اگر برای هر خط کد تکراری در پروژههای متنباز خود به مدلهای ابری پول میدهید، در واقع در حال سوزاندن بودجهتان هستید. تصور کنید بتوانید استراتژی را از یک مدل قدرتمند ابری بگیرید و اجرای خستهکننده را به یک مدل رایگان محلی بسپارید.
پروژه gas-fakes که برای شبیهسازی Apps Script در محیطهای محلی طراحی شده، در ۹ ژوئن ۲۰۲۶ به نقطه عطفی در معماری خود رسید. این پروژه حالا برای جلوگیری از هزینههای نجومی، نقشهای هوش مصنوعی را بین ابر و سختافزار محلی تقسیم کرده است.
همانطور که در تحلیل قبلی ما دربارهی بهینهسازی هزینههای استنتاج اشاره کردیم، تکیه بر یک مدل واحد برای تمام وظایف، ناکارآمدترین روش ممکن است. برای درک این موضوع، مدل زبانی بزرگ (LLM) — مثل کتابخانهداری که میلیاردها صفحه را خوانده و حالا با همان لحن جواب میدهد — نباید برای کارهای سادهی تایپی استخدام شود.
به نقل از مستندات پروژه، این سیستم از یک مدل سلسلهمراتبی سختگیرانه استفاده میکند:
- Gemini: به عنوان «برنامهریز استراتژیک» عمل کرده و تصمیمات سطح بالا را میگیرد.
- Gemma: یک مدل با وزنهای باز (Open Weights) — یعنی دستور پخت مدل علناً منتشر شده و رایگان است — که روی مک با استفاده از oMLX اجرا میشود و نقش «مجری متمرکز» را دارد.
- MCP: این دو مدل از طریق سرور پروتکل بافت مدل (MCP) و ابزاری به نام
query_local_modelبا هم ارتباط برقرار میکنند.
طبق گزارش تکمیلی gas-fakes، برای تضمین بهرهوری، یک «دروازه تفویض صفر-تولرانس» تعریف شده است. در این ساختار، برنامهریز ابری اجازه ندارد کد تولید کند؛ او فقط زمینه را جمعآوری کرده و اجرای آن را به مدل محلی میسپارد و در نهایت خروجی را بازبینی میکند.
این روش تا امروز ۴۳۹۹ متد از ۶۷۰۸ مورد را پشتیبانی کرده و ۱۰۵۰۰ تست تطبیقی را با موفقیت پشت سر گذاشته است. نتیجه این معماری، رسیدن به امتیاز ۹۴ از ۱۰۰ در استانداردهای سازمانی است.

این رویکرد، دیدگاه برنامه نویس را از «یک چتبات واحد» به «یک نیروی کار لایهبندی شده» تغییر میدهد. در واقع استنتاج (Inference) — که مثل خودِ آشپزی است، نه دورهی آموزش آشپز — حالا در دو سطح مختلف رخ میدهد تا هزینه توکنها به حداقل برسد.

گام بعدی شما
- مخزن گیتهاب gas-fakes را برای بررسی منطق تفویض وظایف بررسی کنید.
- یک سرور oMLX برای مدیریت مدلهای محلی خود راهاندازی کنید.
- توابع تکراری پروژه خود را شناسایی کرده و آنها را به مدلهای کوچکتر منتقل کنید.
اما داستان سختافزاری این تحول حتی شگفتانگیزتر است — به تحلیل ما دربارهی تراشههای Blackwell مراجعه کنید.


گفتگو