برایان آرمسترانگ: ۸۰٪ از حجم عملیات هوش مصنوعی به مدل‌های ارزان منتقل می‌شوند

اگر امروز برای استفاده از مدل‌های پیشرو هزینه پرداخت می‌کنید، احتمالاً به‌زودی شاهد کاهش شدید صورت‌حساب خود خواهید بود. این اتفاق زمانی رخ می‌دهد که ۸۰٪ از حجم کاری شما به جایگزین‌های ارزان‌تر منتقل شود. این پیش‌بینی برایان آرمسترانگ (Brian Armstrong)، هم‌بنیان‌گذار کوین‌بیس (Coinbase) است که در پلتفرم X اعلام کرد طی ۱۲ تا ۱۸ ماه آینده، اکثر وظایف روی مدل‌هایی اجرا خواهند شد که ۹۹٪ ارزان‌تر هستند. طبق گفته‌ی او، تنها ۲۰٪ از پردازش‌ها که در آن‌ها «حداکثر بهره‌وری هوشی» (IQ maxing) حیاتی است، همچنان به مدل‌های نسل جدید وابسته خواهند بود.

سال‌ها بود که صنعت هوش مصنوعی بر اساس رویکرد «اول مقیاس» (scaling-first) پیش می‌رفت. این رویکرد از مفهوم «درس تلخ» الهام گرفته بود و باعث شد آزمایشگاه‌ها تمام توان خود را روی آموزش مدل‌هایی متمرکز کنند که بیشترین توان محاسباتی را می‌طلبند تا مرزهای فناوری را جابه‌جا کنند. آزمایشگاه‌ها باور داشتند که مدل‌های بزرگ‌تر همیشه پیروز می‌شوند و سرمایه‌گذاران نیز هزینه‌های بالای این روند را به‌شدت پرداخت می‌کردند. این وضعیت فرهنگی ایجاد کرد که در آن شرکت‌ها به‌طور پیش‌فرض از قدرتمندترین مدل موجود استفاده می‌کردند، بدون اینکه بررسی کنند آیا آن وظیفه واقعاً به آن سطح از هوش نیاز دارد یا خیر.

چرخش اقتصادی

اکنون اقتصاد این بازی در حال تغییر است. با افزایش قیمت توکن‌ها و کاهش سرعت یارانه‌های سرمایه‌گذاران، کسب‌وکارها برای اولین بار با فشار واقعی هزینه‌ها روبرو شده‌اند. این پدیده «خرید مدل با نگاه به هزینه»، اتفاق جدیدی است و احتمالاً تأثیرات قابل‌توجهی خواهد داشت.

شرکت‌ها در حال کشف این نکته هستند که «کیفیت» به معنای استفاده از بزرگ‌ترین مدل نیست، بلکه به معنای استفاده از بهینه‌ترین مدلی است که پاسخ درست را می‌دهد. همان‌طور که گیب پريرا (Gabe Pereyra)، هم‌بنیان‌گذار هاروی (Harvey)، در گفتگو با تک‌کرانچ (TechCrunch) اشاره کرد، تعریف کیفیت در حال تکامل است؛ از اینکه صرفاً قدرتمندترین مدل را برای همه چیز به کار ببریم، به سمت یافتن بهینه‌ترین مسیر برای رسیدن به پاسخ صحیح حرکت می‌کنیم.

انتقال به بهره‌وری

شواهد عینی این چرخش در بخش‌های تخصصی دیده می‌شود. هاروی که یک ابزار هوش مصنوعی حقوقی است، اخیراً برای آزمایش این فرضیه با پلتفرم استنتاج فایروورکس ای‌آی (Fireworks AI) همکاری کرد. نتایج آن‌ها نشان می‌دهد:

هزینه‌های استنتاج (Inference) — لحظه‌ای که مدل واقعاً جواب تولید می‌کند و شبیه خودِ آشپزی است نه دوره‌ی آموزش — ۳ برابر کاهش یافت.
کیفیت خروجی‌ها با وجود کاهش هزینه‌ها، ثابت ماند.
این سیستم با ترکیب مدل کلود اپوس (Claude Opus) و مدل GLM 5.1 شرکت فایروورکس به این نتیجه رسید.
سازوکار کار به این صورت بود که فقط متمرکزترین و سنگین‌ترین وظایف به Opus سپرده شدند، که این امر به‌طور قابل‌توجهی زمان سرور و هزینه کلی را کاهش داد.

این تغییر صرفاً انتخاب مدل‌های بازمتن (open-weight) به جای مدل‌های اختصاصی نیست. اگرچه یک جنگ قیمتی فعال بین مدل‌های بازمتن که به‌طور مستقل سرویس می‌دهند و استنتاج‌های داخلی آزمایشگاه‌های بزرگ وجود دارد، اما شکاف واقعی بین مدل‌های پیشرو در مقیاس بزرگ و مدل‌های کوچک و بهینه است. شما می‌توانید با جایگزینی GPT-5.5 با مدل V4 Flash شرکت دیپ‌سیک (DeepSeek) هزینه را کم کنید، اما رسیدن به همین نتیجه با استفاده از GPT-5.4-mini نیز ممکن است. در واقع، هر دو مسیر به یک نتیجه در کاهش هزینه منجر می‌شوند.

پیامدهای صنعتی

این روند ریسک مالی بزرگی برای آزمایشگاه‌های بزرگ ایجاد می‌کند. اوپن‌ای‌آی (OpenAI) و آنتروپیک (Anthropic) در مسیر عرضه عمومی سهام (IPO) هستند، اما مهاجرت جمعی به مدل‌های کوچک‌تر، ضربه‌ای سنگین به جریان درآمدی اصلی آن‌ها یعنی استنتاج‌های گران‌قیمت می‌زند. بخش بزرگی از این صرفه‌جویی‌ها مستقیماً از جیب این آزمایشگاه‌ها کم خواهد شد.

اگر اکثریت استقرار‌های سازمانی بتوانند روی مدل‌های کوچک‌تر اجرا شوند، صنعت باید در مورد نحوه توجیه هزینه‌های نجومی برای آموزش نسل بعدی مدل‌های پیشرو تجدیدنظر کند. در حالی که برخی کاربران ممکن است با کاهش تعداد درخواست‌ها یا استفاده از کانتکست کمتر صرفه‌جویی کنند، اما یک تغییر گسترده به سمت مدل‌های کوچک‌تر می‌تواند تقاضای رو به رشد برای استنتاج را به‌شدت کاهش دهد.

ما از عصر «بیشینه کردن هوش» به عصر «بهره‌وری عملیاتی» می‌رویم. کاربرانی که خود را تطبیق ندهند، برای محاسباتی هزینه می‌پردازند که اصلاً به آن نیاز ندارند. از این پس باید پشته‌ی فناوری خود را نه با نمرات بنچمارک، بلکه با «حداقل محاسبات مورد نیاز برای هر وظیفه» ارزیابی کنید.

منتظر موج بعدی عرضه مدل‌های «mini» از سوی آزمایشگاه‌های بزرگ باشید، زیرا آن‌ها تلاش می‌کنند تا پیش از آنکه جایگزین‌های بازمتن بازار را تسخیر کنند، بازار سازمان‌های حساس به بودجه را تصاحب کنند.

گام بعدی شما

لیست وظایف تکراری خود را شناسایی کنید و بررسی کنید کدام‌یک را می‌توان به مدل‌های Mini یا Flash سپرد.
استراتژی «مسیریابی مدل» (Model Routing) را پیاده کنید تا فقط سوالات سخت به مدل‌های گران‌قیمت ارسال شوند.
هزینه‌های ماهانه خود را با مدل‌های کوچک‌تر مقایسه کنید تا نقطه شکست کیفیت را بیابید.

اما داستان سخت‌افزاری این تحول حتی شگفت‌انگیزتر است — به تحلیل ما درباره‌ی تراشه‌های Blackwell مراجعه کنید.

این گزارش با خط‌لولهٔ خودکار دات‌هوش از منابع معتبر جهانی تدوین و زیر نظر تحریریه منتشر شده است. روش کار ما

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

اخبار روزانه، معرفی ابزارها و مدل‌ها، و آموزشِ کار با هوش مصنوعی؛ همیشه با این پرسش که از ایران چه چیزی کار می‌کند و چه چیزی نه.

چرخش اقتصادی

انتقال به بهره‌وری

هزینه‌های استنتاج (Inference) — لحظه‌ای که مدل واقعاً جواب تولید می‌کند و شبیه خودِ آشپزی است نه دوره‌ی آموزش — ۳ برابر کاهش یافت.
کیفیت خروجی‌ها با وجود کاهش هزینه‌ها، ثابت ماند.
این سیستم با ترکیب مدل کلود اپوس (Claude Opus) و مدل GLM 5.1 شرکت فایروورکس به این نتیجه رسید.
سازوکار کار به این صورت بود که فقط متمرکزترین و سنگین‌ترین وظایف به Opus سپرده شدند، که این امر به‌طور قابل‌توجهی زمان سرور و هزینه کلی را کاهش داد.

پیامدهای صنعتی

گام بعدی شما

لیست وظایف تکراری خود را شناسایی کنید و بررسی کنید کدام‌یک را می‌توان به مدل‌های Mini یا Flash سپرد.
استراتژی «مسیریابی مدل» (Model Routing) را پیاده کنید تا فقط سوالات سخت به مدل‌های گران‌قیمت ارسال شوند.
هزینه‌های ماهانه خود را با مدل‌های کوچک‌تر مقایسه کنید تا نقطه شکست کیفیت را بیابید.

اما داستان سخت‌افزاری این تحول حتی شگفت‌انگیزتر است — به تحلیل ما درباره‌ی تراشه‌های Blackwell مراجعه کنید.

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

برایان آرمسترانگ: ۸۰٪ از حجم عملیات هوش مصنوعی به مدل‌های ارزان منتقل می‌شوند

چرخش اقتصادی

انتقال به بهره‌وری

پیامدهای صنعتی

گام بعدی شما

منابع

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

برایان آرمسترانگ: ۸۰٪ از حجم عملیات هوش مصنوعی به مدل‌های ارزان منتقل می‌شوند

چرخش اقتصادی

انتقال به بهره‌وری

پیامدهای صنعتی

گام بعدی شما

منابع

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

برایان آرمسترانگ: ۸۰٪ از حجم عملیات هوش مصنوعی به مدل‌های ارزان منتقل می‌شوند

چرخش اقتصادی

انتقال به بهره‌وری

پیامدهای صنعتی

گام بعدی شما

منابع

مقاله‌های مرتبطهمه ←

«تهدید امنیت ملی»؛ هشدار کشورهای G7 به انحصار مدل‌های آمریکایی

سرمایه‌گذاری سری B: ۳۱۰ میلیون دلار برای شبیه‌سازی فیزیک در Odyssey

«پیش‌بینی مسیر از طریق متن»؛ دستاورد جدید مؤسسه AllenAI در فضای سه‌بعدی

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

مدل‌ها و ابزارهای مرتبط

اصطلاحات این مطلب

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

برایان آرمسترانگ: ۸۰٪ از حجم عملیات هوش مصنوعی به مدل‌های ارزان منتقل می‌شوند

چرخش اقتصادی

انتقال به بهره‌وری

پیامدهای صنعتی

گام بعدی شما

منابع

مقاله‌های مرتبطهمه ←

«تهدید امنیت ملی»؛ هشدار کشورهای G7 به انحصار مدل‌های آمریکایی

سرمایه‌گذاری سری B: ۳۱۰ میلیون دلار برای شبیه‌سازی فیزیک در Odyssey

«پیش‌بینی مسیر از طریق متن»؛ دستاورد جدید مؤسسه AllenAI در فضای سه‌بعدی

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

مدل‌ها و ابزارهای مرتبط

اصطلاحات این مطلب

راهنمای فارسی هوش مصنوعی — با نگاه به ایران