اگر در حال توسعه عاملهای هوش مصنوعی در مقیاس وسیع هستید، هزینههای عملیاتی شما همین امروز سقوط کرد. تصور کنید پیش از این برای هر درخواست مبلغی میپرداختید که حالا تنها یکچهارم آن را پرداخت میکنید.
در ۳ ژوئن ۲۰۲۶، شرکت inclusionAI قیمت مدل Ring-2.6-1T را ۷۵٪ کاهش داد. این مدل در مرحلهی استنتاج (Inference) — لحظهای که مدل واقعاً جواب تولید میکند، شبیه خودِ آشپزی و نه دورهی آموزش آشپز — حالا بسیار ارزانتر شده است.
به نقل از گزارش The Token Ledger، جزئیات این تغییر قیمت به شرح زیر است:
- قیمت درخواستها (Prompts) از ۰.۳۰ دلار به ۰.۰۷۵ دلار برای هر ۱ میلیون توکن (Token) کاهش یافت. توکنها تکههای کوچکی از متن هستند، مثل برشهای یک کیک طولانی که مدل تکهتکه میخورد.
- قیمت پاسخها (Completion) از ۲.۵۰ دلار به ۰.۶۲۵ دلار برای هر ۱ میلیون توکن رسید.
همانطور که در تحلیلهای پیشین ما دربارهی اقتصاد مدلهای زبانی اشاره کردیم، رقابت در این صنعت از «دقت محض» به سمت «کاهش هزینه استنتاج» حرکت کرده است. این وضعیت شبیه روزهای اولیه رایانش ابری است؛ زمانی که ارائهدهندگان برای جذب سهم بازار، قیمتها را به شدت پایین میآوردند.
طبق گزارشهای متعدد، سایر بازیگران نیز واکنش نشان دادهاند. شرکت Z.ai قیمت مدل GLM 5 را ۷.۷٪ کاهش داد و به ۱.۹۲ دلار رساند. همچنین مدل Fusion در پلتفرم OpenRouter در حال حاضر رایگان است. با این حال، مدل Ling-2.6-flash همچنان با قیمت ۰.۰۱ دلار ارزانترین گزینه بازار است.
این تخفیف ساده نیست، بلکه تلاشی برای جذب حجم عظیم دادههای سازمانی است. وقتی هزینهها یکچهارم میشوند، کارهایی مثل تحلیل جامع اسناد در لحظه، ناگهان سودآور میشوند. این موضوع فشار شدیدی بر ارائهدهندگان میانرده میآورد تا یا سرعت خود را بالا ببرند یا قیمتها را بیشتر کاهش دهند.
گام بعدی شما
- منطق مسیریابی مدلهای خود را بررسی کنید تا ببینید آیا جایگزینی با Ring-2.6-1T نرخ هزینهی شما را کاهش میدهد.
- تغییرات روزانه قیمتها را از طریق The Token Ledger رصد کنید تا بودجهی AI خود را بهینه کنید.
- استراتژیهای جدید برای تحلیل اسناد حجیم را که پیش از این گران بودند، تست کنید.
اما این جنگ قیمتها تنها بخشی از ماجراست؛ اثر این رقابت بر سختافزارهای نسل جدید را در گزارش بعدی بررسی خواهیم کرد.



گفتگو