اگر فکر میکنید صورتحسابهای API شما بالا است، بدانید که تنها نوک کوه یخ را میبینید. تصور کنید هر گام جدید در یک مکالمه، هزینهی شما را نه به صورت خطی، بلکه به صورت تصاعدی افزایش دهد؛ این همان دیواری است که مانع از گسترش عاملهای خودمختار میشود.
در ۴ مه ۲۰۲۶، یک پروتکل باز و لایهی ارکستراسیون (Orchestration Layer) به نام Burnless معرفی شد تا این منحنی هزینه را به کلی تغییر دهد. به نقل از گزارش فنی منتشر شده در وبسایت dev.to، این ابزار هزینهی حلقههای چند-مرحلهای را از پیچیدگی $O(N^2)$ به $O(N)$ تبدیل میکند و تعاملات طولانیمدت عاملها (Agents) را از نظر مالی توجیهپذیر میسازد.
Burnless این تحول را از طریق دو سازوکار فنی محقق میکند:
- حافظه پیشوند مشترک (Shared Prefix Cache): این سیستم از قابلیتهای خاص ارائهدهندگان، مانند حافظه پرامپت در Anthropic، استفاده میکند تا پرامپتهای سیستمی حجیم (بیش از ۲۰ هزار توکن) را در حافظه نگه دارد و هزینهی خواندن را تا ۱۰ برابر کاهش دهد.
- تاریخچه کپسولی (Capsule History): به جای ارسال مجدد تمام متن مکالمات قبلی، مدل «ماسترو» (Maestro) کپسولهای فشردهای با طول تقریبی ۸۰ کاراکتر از تعاملات پیشین را مدیریت میکند.
طبق اعلام تیم توسعه، در یک بنچمارک واقعی با استفاده از مدل Claude 3 Opus برای یک جلسه ۱۰ مرحلهای، هزینه از ۴.۶۶ دلار در حالت عادی به تنها ۰.۴۵ دلار رسید؛ یعنی کاهشی ۹۰.۳ درصدی.
همانطور که در تحلیل قبلی ما دربارهی Trooper و رویکرد آن برای حل مشکل فقدان بافت (Context Loss) در سیستمهای ابری اشاره کردیم، Burnless اکنون روی ضلع اقتصادی این معضل تمرکز کرده است. در حالی که Trooper بر قابلیت اطمینان متمرکز بود، Burnless بقای مالی عاملهایی با حجم توکن بالا را تضمین میکند.
این سیستم کاملاً مستقل از ارائهدهنده است و به توسعهدهندگان اجازه میدهد مدلها را در لایههای مختلف (طلایی، نقرهای و برنزی) طبقهبندی کنند. برای مثال، میتوان از یک مدل پیشرو به عنوان «مغز» استفاده کرد و وظایف اجرایی را به یک نمونه محلی Ollama سپرد تا هزینه نهایی به صفر برسد.
اما داستان سختافزاری این تحول حتی شگفتانگیزتر است؛ پیادهسازی رمزگذاری و رمزگشایی محلی برای حذف کامل وابستگی به ابر، مرز بعدی این مسیر خواهد بود.
گام بعدی شما
- بررسی مستندات Burnless برای جایگزینی لایهی ارکستراسیون فعلی.
- پیادهسازی استراتژی مدلهای لایهبندی شده (Tiered Models) برای کاهش هزینهها.
- تست مدلهای محلی Ollama برای بخشهای اجرایی زنجیره تفکر.




گفتگو