اگر در حال حاضر در حال توسعه یک کسبوکار مبتنی بر هوش مصنوعی هستید، باید بدانید که هزینه «هوش» ارزانتر شده است. تصور کنید تا همین چند هفته پیش، قیمتهای مدلهای برتر بازار مانند نوسانات تصادفی بودند، اما حالا ورق برگشته است.
طبق گزارش بنچمارک قیمت استنتاج ATOM (AIPI) که در ۱۲ مه ۲۰۲۶ منتشر شد، شاخص مدلهای پیشرو — که شامل مدلهای غولپیکری چون GPT-5.5، Claude Opus 4.7 و Gemini 3.1 Pro میشود — برای سومین هفته متوالی کاهش یافته است. در این بازار، استنتاج (Inference) — تشبیه روزمره: لحظهای که مدل واقعاً جواب تولید میکند — مثل خودِ آشپزی، نه دورهی آموزش آشپز — گرانترین بخش عملیاتی است و هر کاهش قیمت در این لایه، مستقیماً روی سودآوری شرکتها اثر میگذارد.
همانطور که در تحلیلهای قبلی ما دربارهی رقابت مدلهای بازمتن اشاره کردیم، فشار برای کاهش قیمتها همواره وجود داشت، اما تا پیش از این، تغییرات قیمتی در بخش مدلهای پیشرو بیشتر شبیه به «نویز» بود؛ یعنی هر فروشنده به صورت پراکنده قیمت برخی خدمات خود را تغییر میداد. اما یک سقوط هماهنگ سه هفتهای نشان میدهد که بازیگران اصلی اکنون در یک جهت حرکت میکنند.
بر اساس مستندات هفتهی ۱۸، روند نزولی در تمام بخشها مشهود است:
- هزینه ورودی (Input): ۰.۲۳٪ کاهش
- ورودیهای کششده (Cached Input): ۲.۰۶٪ کاهش
- هزینه خروجی (Output): ۰.۳۵٪ کاهش
در شدیدترین حالت، هزینه ورودیهای کششده در کانالهای پلتفرمی ۱۷.۴۷٪ سقوط کرد. به گزارش این بنچمارک، این ریزش شدید نتیجهی دو اتفاق کلیدی بود: تخفیف ۷۵ درصدی DeepSeek برای مدل V4-Pro و کاهش قیمت کش این مدل در Alibaba Cloud Bailian به ۱ یوان برای هر میلیون توکن.

علاوه بر این، قیمت مدلهای استدلالی (Reasoning Model) — تشبیه روزمره: مدلی که قبل از جواب، یک قدم درنگ میکند و فکر میکند — مثل شطرنجبازی که چند حرکت جلوتر را میبیند — نیز در حال نرم شدن است. شاخص «پاداش استدلال» (Reasoning Premium) از ۲.۲ برابر به ۱.۷ برابر کاهش یافته که نشان میدهد ورود رقبای جدید با قیمتهای پایینتر، حاشیه سود مدلهای پیچیده را تحت فشار قرار داده است.
گام بعدی شما
- اگر از مدلهای گرانقیمت برای پردازشهای حجیم استفاده میکنید، اکنون زمان بازنگری در معماری کشینگ (Caching) برای کاهش هزینههاست.
- استراتژی قیمتگذاری محصولات خود را بر اساس این فرض پیش ببرید که کف قیمتی هوش مصنوعی در حال پایین آمدن است.
- عملکرد مدلهای ارزانتر را با مدلهای پیشرو مقایسه کنید تا نقطه بهینه «کیفیت به قیمت» را بیابید.
اما داستان سختافزاری این تحول حتی شگفتانگیزتر است؛ برای درک اینکه چگونه بهینهسازیهای سختافزاری این سقوط قیمتها را ممکن کرده، به تحلیل ما دربارهی تراشههای Blackwell مراجعه کنید.




گفتگو