GPT-4o LATENCY240msCLAUDE OPUS 4.7ONLINENVDA+1.2%MISTRAL LARGE 2STREAMINGOPENAI API99.97% UPTIMEGROQ MIXTRAL580 tok/sGEMINI 2.5 PROCTX 2MANTHROPIC STATUSOKTSMC+0.4%PERPLEXITYINDEXINGGPT-4o LATENCY240msCLAUDE OPUS 4.7ONLINENVDA+1.2%MISTRAL LARGE 2STREAMINGOPENAI API99.97% UPTIMEGROQ MIXTRAL580 tok/sGEMINI 2.5 PROCTX 2MANTHROPIC STATUSOKTSMC+0.4%PERPLEXITYINDEXING
پرش به محتوای مقاله

کاهش ۷۵ درصدی قیمت Ring-2.6-1T؛ استراتژی inclusionAI برای تسخیر بازار سازمان‌ها

·۱۳ خرداد ۱۴۰۵۱ دقیقه مطالعه
اشتراک‌گذاری
واقعاً چه چیز جدید است؟

کاهش ۷۵ درصدی قیمت در یک مدل تریلیونی (1T). این اولین بار است که یک مدل با این حجم از پارامترها، قیمت خود را به سطح مدل‌های زبانی کوچک (SLM) نزدیک می‌کند.

اگر در حال توسعه عامل‌های هوش مصنوعی در مقیاس وسیع هستید، هزینه‌های عملیاتی شما همین امروز سقوط کرد. تصور کنید پیش از این برای هر درخواست مبلغی می‌پرداختید که حالا تنها یک‌چهارم آن را پرداخت می‌کنید.

در ۳ ژوئن ۲۰۲۶، شرکت inclusionAI قیمت مدل Ring-2.6-1T را ۷۵٪ کاهش داد. این مدل در مرحله‌ی استنتاج (Inference) — لحظه‌ای که مدل واقعاً جواب تولید می‌کند، شبیه خودِ آشپزی و نه دوره‌ی آموزش آشپز — حالا بسیار ارزان‌تر شده است.

به نقل از گزارش The Token Ledger، جزئیات این تغییر قیمت به شرح زیر است:

  • قیمت درخواست‌ها (Prompts) از ۰.۳۰ دلار به ۰.۰۷۵ دلار برای هر ۱ میلیون توکن (Token) کاهش یافت. توکن‌ها تکه‌های کوچکی از متن هستند، مثل برش‌های یک کیک طولانی که مدل تکه‌تکه می‌خورد.
  • قیمت پاسخ‌ها (Completion) از ۲.۵۰ دلار به ۰.۶۲۵ دلار برای هر ۱ میلیون توکن رسید.

همان‌طور که در تحلیل‌های پیشین ما درباره‌ی اقتصاد مدل‌های زبانی اشاره کردیم، رقابت در این صنعت از «دقت محض» به سمت «کاهش هزینه استنتاج» حرکت کرده است. این وضعیت شبیه روزهای اولیه رایانش ابری است؛ زمانی که ارائه‌دهندگان برای جذب سهم بازار، قیمت‌ها را به شدت پایین می‌آوردند.

طبق گزارش‌های متعدد، سایر بازیگران نیز واکنش نشان داده‌اند. شرکت Z.ai قیمت مدل GLM 5 را ۷.۷٪ کاهش داد و به ۱.۹۲ دلار رساند. همچنین مدل Fusion در پلتفرم OpenRouter در حال حاضر رایگان است. با این حال، مدل Ling-2.6-flash همچنان با قیمت ۰.۰۱ دلار ارزان‌ترین گزینه بازار است.

این تخفیف ساده نیست، بلکه تلاشی برای جذب حجم عظیم داده‌های سازمانی است. وقتی هزینه‌ها یک‌چهارم می‌شوند، کارهایی مثل تحلیل جامع اسناد در لحظه، ناگهان سودآور می‌شوند. این موضوع فشار شدیدی بر ارائه‌دهندگان میان‌رده می‌آورد تا یا سرعت خود را بالا ببرند یا قیمت‌ها را بیشتر کاهش دهند.

گام بعدی شما

  • منطق مسیریابی مدل‌های خود را بررسی کنید تا ببینید آیا جایگزینی با Ring-2.6-1T نرخ هزینه‌ی شما را کاهش می‌دهد.
  • تغییرات روزانه قیمت‌ها را از طریق The Token Ledger رصد کنید تا بودجه‌ی AI خود را بهینه کنید.
  • استراتژی‌های جدید برای تحلیل اسناد حجیم را که پیش از این گران بودند، تست کنید.

اما این جنگ قیمت‌ها تنها بخشی از ماجراست؛ اثر این رقابت بر سخت‌افزارهای نسل جدید را در گزارش بعدی بررسی خواهیم کرد.

چرا این موضوع مهم است؟

این کاهش قیمت باعث می‌شود استقرار عامل‌های هوش مصنوعی در سازمان‌ها از مرحله آزمایش به مرحله عملیاتی برسد. اعتبار این گزارش که توسط The Token Ledger منتشر شده، نشان می‌دهد هزینه استنتاج دیگر مانعی برای مقیاس‌پذیری تجاری نیست.

تأثیر برای ایران

به دلیل محدودیت‌های API و تحریم‌ها، دسترسی مستقیم به این مدل برای توسعه‌دهندگان ایرانی دشوار است. با این حال، کاهش قیمت‌های جهانی در مدل‌های رقیب از طریق واسطه‌ها، هزینه‌ی اجرای پروژه‌های هوش مصنوعی در ایران را کاهش می‌دهد.

·نگاه ما
تحریریه دات‌هوش

تحلیل ما این است که inclusionAI با این حرکت، مدل‌های میان‌رده را در وضعیت دشواری قرار داده است. دیگر نمی‌توان صرفاً با «ارزان بودن» رقابت کرد، بلکه باید سرعت یا دقت را در سطح قیمت‌های تقریباً صفر نگه داشت. این یک سیگنال جدی برای پایان دوران سودآوری بالای مدل‌های عمومی است.

منابع

گفتگو

شماره ۰۵۳پنج‌شنبه‌های هوش‌محور

بسته‌ی هفتگی دات‌هوش

۵ خبر، ۲ ابزار، ۱ پرامپت — به‌علاوه ۳ بخش جدید. بدون هیاهو، هر پنج‌شنبه صبح.

خبر کلیدی
ابزار کاربردی
پرامپت حرفه‌ای
تحلیل پژوهش
به‌زودی
زاویه‌ی ایرانی
به‌زودی
تمرین این هفته
به‌زودی
۰۰:۰۰تا شماره بعدیهفته‌ی ۵۳ بدون وقفه