صورتحسابهای پردازش هوش مصنوعی در مقیاس سازمانی به نقطهای رسیدهاند که حتی غولی مثل آمازون هم برای کاهش هزینهها دست به تدابیر اضطراری میزند. اگر شما مدیر زیرساخت هستید، باید بدانید که دوران تکیه مطلق به مدلهای عظیم و گرانقیمت در حال پایان است.
طبق گزارش The Information در ۲۹ ژوئن ۲۰۲۶، مهندسان آمازون (Amazon) در حال استفاده از تکنیک تقطیر (Distillation) — که شبیه استخراج عصارهی یک کتاب هزار صفحهای برای تبدیل آن به یک دفترچه راهنمای کوچک و کاربردی است — برای ساخت نسخههای سبکتر از مدلهای آنتروپیک (Anthropic) هستند. این چرخش راهبردی برای مقابله با تغییر مدل قیمتگذاری در سال ۲۰۲۷ رخ میدهد.
همانطور که در تحلیلهای پیشین ما دربارهی امنیت مدلهای بازمتن اشاره کردیم، کاهش وابستگی به تامینکنندگان واحد، اولویت اصلی شرکتهای بزرگ است. آمازون اکنون زیرساختهای داخلی خود را بازسازی میکند تا از هزینههای سرسامآور APIهای شخص ثالث در امان بماند.
به نقل از همین گزارش، جزئیات این استراتژی به شرح زیر است:
- تغییر مدل هزینه: از سال آینده، آمازون بهجای پرداخت برای ساعات محاسباتی، بر اساس تعداد توکن (Token) — تکههای کوچکی از متن شبیه برشهای یک کیک طولانی که مدل میخورد — هزینه پرداخت میکند؛ تغییری که میتواند هزینهها را بهشدت افزایش دهد.
- شکاف پلتفرمی: با اینکه سرویس تقطیر در پلتفرم بدراک (Bedrock) ارائه میشود، اما در حال حاضر فقط از مدلهای لاما (Llama) متعلق به متا و مدلهای نووا (Nova) خود آمازون پشتیبانی میکند و مدلهای Claude در این فهرست نیستند.
- سرمایهگذاریهای کلان: آمازون امسال تا ۲۵ میلیارد دلار دیگر در آنتروپیک و تا ۵۰ میلیارد دلار در OpenAI سرمایهگذاری کرده است. این رویکرد بخشی از استراتژی گستردهتر آمازون برای تسلط بر اکوسیستم هوش مصنوعی است که سرمایهگذاریهای اخیر در استارتاپهای مدلهای جهانی را نیز شامل میشود.
این رویکرد نشان میدهد که حتی بزرگترین بازیگران تکنولوژی با هزینههای استنتاج (Inference) مدلهای پیشرو دستوپنجه نرم میکنند. به نظر میرسد مدلهای عمومی و بسیار پیشرفته برای کارهای روتین داخلی بیش از حد گران شدهاند و آمازون ترجیح میدهد روی مدلهای داخلی Nova تمرکز کند.
موفقیت این طرح به این بستگی دارد که مدلهای تقطیرشده بتوانند کیفیت استدلال نسخههای اصلی را حفظ کنند.
گام بعدی شما
- اگر از مدلهای بزرگ برای کارهای تکراری استفاده میکنید، بررسی کنید آیا یک مدل کوچکتر (SLM) با دقت مشابه میتواند جایگزین شود.
- بنچمارکهای آتی آمازون را برای مقایسه کیفیت مدلهای تقطیرشده در برابر نسخههای استاندارد دنبال کنید.
- هزینههای توکنی مدلهای فعلی خود را با نرخهای پیشبینیشده برای سال آینده بسنجید.
اما داستان سختافزاری این تحول حتی شگفتانگیزتر است؛ به تحلیل ما دربارهی تراشههای Blackwell مراجعه کنید.




گفتگو