اگر امروز برای توکنهای مدلهای پیشرفته پول میپردازید، باید بدانید جریان درآمدی شما با یک دیوار سخت برخورد کرده است. برایان آرمسترانگ (Brian Armstrong)، همبنیانگذار کوینبیس (Coinbase)، پیشبینی میکند که طی ۱۲ تا ۱۸ ماه آینده، ۸۰ درصد از حجم عملیات هوش مصنوعی روی مدلهایی اجرا خواهد شد که ۹۹ درصد ارزانتر هستند.
طبق این تحلیل، تنها ۲۰ درصد از وظایفی که به بالاترین سطح هوش نیاز دارند، روی مدلهای نسل جدید باقی میمانند. سالها بود که آزمایشگاهها با این فرض پیش میرفتند که مدلهای بزرگتر همیشه پیروز میشوند. در آن دوران، سرمایهگذاران هزینهها را پوشش میدادند و شرکتها سراغ پیشرفتهترین ابزارها میرفتند.
اما طبق گزارشهای صنعتی، از ۹ ژوئن ۲۰۲۶ اقتصاد این بازار تغییر کرد. افزایش قیمت توکنها و کاهش یارانههای سرمایهگذاران، کاربران را مجبور کرد برای نخستین بار «هزینه» را در اولویت قرار دهند. همانطور که در تحلیل قبلی ما دربارهی هزینههای محاسباتی مدلهای بازمتن اشاره کردیم، تمرکز صنعت اکنون از قدرت خام به سمت بهینهسازی حرکت کرده است.
این تغییر رویکرد همین حالا در محیطهای عملیاتی دیده میشود. به نقل از منابع صنعتی، ابزار حقوقی هاروی (Harvey) با پلتفرم فایروورکس ایآی (Fireworks AI) همکاری کرد تا یک روش ترکیبی را آزمایش کند. آنها با استفاده از کلود اوپوس (Claude Opus) برای کارهای پیچیده و مدل جیالام ۵.۱ (GLM 5.1) برای سایر وظایف، هزینهی استنتاج (Inference) — یعنی لحظهای که مدل واقعاً جواب تولید میکند، شبیه به خودِ آشپزی و نه دورهی آموزش آشپز — را ۳ برابر کاهش دادند، بدون آنکه کیفیت افت کند.
این روند حاشیه سود اوپنایآی (OpenAI) و انتروپیک (Anthropic) را دقیقاً در آستانه عرضه عمومی سهام (IPO) تهدید میکند. تعریف «کیفیت» در حال تغییر است؛ کیفیت دیگر به معنای استفاده از قدرتمندترین مدل زبانی بزرگ (LLM) — مثل کتابخانهداری که میلیاردها صفحه را خوانده و حالا با همان لحن کتابها جواب میدهد — نیست، بلکه یافتن بهینهترین مدلی است که جواب درست را بدهد.
گام بعدی شما
- لیست کارهای هوش مصنوعی خود را بررسی کنید تا ببینید کدام وظایف «پیشرو» را میتوان به مدلهای کوچکتر با وزنهای باز (Open Weights) سپرد.
- بررسی کنید که آیا حجم استفادهی شرکت شما از مدلهای گرانقیمت در حال کاهش است یا صرفاً برای صرفهجویی، تعداد درخواستها را کم کردهاید.
- استراتژی «مدل ترکیبی» (استفاده از مدلهای کوچک برای کارهای ساده و مدلهای بزرگ برای تحلیلهای عمیق) را در جریان کاری خود پیاده کنید.
اما داستان سختافزاری این تحول حتی شگفتانگیزتر است — به تحلیل ما دربارهی تراشههای Blackwell مراجعه کنید.



گفتگو