احتمالاً همین حالا ۶۰ درصد بیشتر از هزینه واقعی عاملهای کدنویسی AI میپردازید. تصور کنید با حذف دادههای اضافی، نه تنها هزینه کم شود، بلکه دقت کدها بالا برود.
در ۲۷ آوریل ۲۰۲۶، آزمایشگاه Dirac Delta Labs از Dirac پردهبرداری کرد؛ یک عامل (Agent) متنباز که هدفش به حداکثر رساندن بهرهوری در برابر هزینه است. به نقل از مستندات گیتهاب این پروژه، Dirac توانسته است هزینههای API را بهطور میانگین ۶۴.۸٪ کاهش دهد و همزمان کیفیت کد تولیدی را بهبود بخشد.
این موفقیت بر پایه یک مشاهده کلیدی است: توانایی استدلال مدلها با افزایش طول بافتار کاهش مییابد. برای مقابله با این مشکل، Dirac از استراتژیهای زیر استفاده میکند:
ویرایشهای موازی لنگر-هش (Hash-anchored parallel edits) برای مدیریت بهینه تغییرات.
دستکاری درخت نحو انتزاعی (AST manipulation) جهت دستیابی به دقت بومی در اصلاح کدها.
عملیات موازی انبوه و دستهبندی چندفایلی برای تسریع اجرای وظایف.
طبق گزارش نتایج بنچمارک Terminal-Bench-2، این ابزار با استفاده از مدل gemini-3-flash-preview به امتیاز ۶۵.۲٪ رسید. این رقم بهطور قابلتوجهی از خطمبنای رسمی گوگل (۴۷.۶٪) و حتی برنده مدلهای بسته یعنی Junie CLI (۶۴.۳٪) بالاتر است.
همانطور که در تحلیل قبلی ما دربارهی بهینهسازی استنتاج (Inference) در مدلهای زبانی اشاره کردیم، حذف نویز از ورودی مدلها کلید افزایش دقت است. Dirac که در واقع یک فورک (Fork) از پروژه Cline است و تحت لایسنس Apache 2.0 منتشر شده، به صورت افزونه VS Code و ابزار CLI در دسترس است. این ابزار به جای تکیه بر پنجرههای بافتار (Context Window) عظیم، بر «پرامپتهای حداقلی» تمرکز کرده تا بازسازیهای بزرگ کد در یک مرحله ممکن شود.
اما این تنها بخشی از بازی است؛ تأثیر این رویکرد بر آینده مدلهای کوچک را در گزارش بعدی بررسی خواهیم کرد.
گام بعدی شما
- اگر از عاملهای کدنویسی گرانقیمت استفاده میکنید، Dirac را به عنوان جایگزین متنباز تست کنید.
- ساختار درخت نحو انتزاعی (AST) را در گردشکار خود برای افزایش دقت اصلاحات کد بررسی کنید.
- نتایج Terminal-Bench-2 را برای مقایسه عملکرد مدلهای Flash در برابر مدلهای حجیم مطالعه کنید.




گفتگو