اگر در حال استقرار عاملهای هوش مصنوعی (AI Agents) — مثل کارمندانی دیجیتال که میتوانند به جای شما ابزارها را اجرا کنند — با دهها ابزار مختلف هستید، احتمالاً با کابوس «حلقههای تکرار مرگبار» آشنا شدهاید. در این وضعیت، مدل در یک چرخه بینهایت از خواندن و نوشتن گیر میکند و هرگز به جواب نمیرسد.
پروژهی Statewright با یک تغییر بنیادین این مشکل را حل کرده است: تبدیل «وضعیتها» به «قوانین». به جای اینکه مدل را بزرگتر کنیم، مسئله را کوچکتر میکنیم. همانطور که در تحلیلهای پیشین ما دربارهی امنیت مدلهای بازمتن اشاره کردیم، کنترل دقیق روی دسترسیها، کلید پایداری سیستمهای خودکار است.
این سیستم از یک موتور قطعی با زبان Rust برای اعمال محدودیتها از طریق پروتکل کانتکست مدل (MCP) استفاده میکند. طبق مستندات رسمی این پروژه، گاردریلهای کلیدی شامل موارد زیر هستند:
- تشخیص Bash: مسدود کردن عملیات تخریبی مثل
rmیاshredدر وضعیتهایی که مدل اجازه تغییر فایل ندارد. - محافظ ویرایش: محدود کردن تعداد خطوط تغییریافته در هر وضعیت برای جلوگیری از تغییرات گسترده و فاجعهبار در کد.
- انتقالهای شرطی: استفاده از پیششرطهای برنامهنویسی شده (مثلاً
tests_passed) برای عبور از یک مرحله به مرحلهی بعد.
به نقل از مستندات گیتهاب، در ۱۲ مه ۲۰۲۶ مشاهده شد که مدلهای محلی با حجم ۱۳.۸ و ۱۹.۹ گیگابایت، نرخ موفقیت خود را در یک زیرمجموعه از بنچمارک SWE-bench از ۲ از ۱۰ به ۱۰ از ۱۰ رساندند.

این نتیجه به معنای شکست این فرضیه است که برای کارهای پیچیده حتماً به مدلهای غولپیکر نیاز داریم. وقتی فضای ابزارها در هر مرحله از ۳۰ ابزار به تنها ۵ ابزار کاهش مییابد، استنتاج (Inference) — یعنی همان لحظهای که مدل واقعاً جواب تولید میکند، شبیه به آشپزیِ نهایی پس از آموزش — بسیار دقیقتر صورت میگیرد. برای توسعهدهندگان، این یعنی مدلهای محلی و خصوصی اکنون میتوانند کارهایی را انجام دهند که پیشتر مختص GPT-4 یا Claude 3.5 بود.
گام بعدی شما
- اگر از Claude Code استفاده میکنید، افزونه را با دستور
/plugin marketplace add statewright/statewrightنصب کنید. - گردشهای کاری (Workflow) خود را به مراحل کوچکتر تقسیم کنید تا مدلهای کوچکتر بتوانند آنها را مدیریت کنند.
- روی تعریف «شرطهای انتقال» بین مراحل تمرکز کنید تا از توهم مدل در تغییر وضعیت جلوگیری شود.
اما داستان سختافزاری این تحول حتی شگفتانگیزتر است؛ برای درک اینکه چگونه مدلهای کوچکتر بر سختافزارهای لبه اجرا میشوند، تحلیل ما دربارهی رایانش لبه را بخوانید.




گفتگو