چرا مدل‌های محلی ۱۳ میلیاردی با Statewright در کدنویسی به دقت ۱۰۰ درصدی رسیدند؟

اگر در حال استقرار عامل‌های هوش مصنوعی (AI Agents) — مثل کارمندانی دیجیتال که می‌توانند به جای شما ابزارها را اجرا کنند — با ده‌ها ابزار مختلف هستید، احتمالاً با کابوس «حلقه‌های تکرار مرگبار» آشنا شده‌اید. در این وضعیت، مدل در یک چرخه بی‌نهایت از خواندن و نوشتن گیر می‌کند و هرگز به جواب نمی‌رسد.

پروژه‌ی Statewright با یک تغییر بنیادین این مشکل را حل کرده است: تبدیل «وضعیت‌ها» به «قوانین». به جای اینکه مدل را بزرگ‌تر کنیم، مسئله را کوچک‌تر می‌کنیم. همان‌طور که در تحلیل‌های پیشین ما درباره‌ی امنیت مدل‌های بازمتن اشاره کردیم، کنترل دقیق روی دسترسی‌ها، کلید پایداری سیستم‌های خودکار است.

این سیستم از یک موتور قطعی با زبان Rust برای اعمال محدودیت‌ها از طریق پروتکل کانتکست مدل (MCP) استفاده می‌کند. طبق مستندات رسمی این پروژه، گاردریل‌های کلیدی شامل موارد زیر هستند:

تشخیص Bash: مسدود کردن عملیات تخریبی مثل rm یا shred در وضعیت‌هایی که مدل اجازه تغییر فایل ندارد.
محافظ ویرایش: محدود کردن تعداد خطوط تغییریافته در هر وضعیت برای جلوگیری از تغییرات گسترده و فاجعه‌بار در کد.
انتقال‌های شرطی: استفاده از پیش‌شرط‌های برنامه‌نویسی شده (مثلاً tests_passed) برای عبور از یک مرحله به مرحله‌ی بعد.

به نقل از مستندات گیت‌هاب، در ۱۲ مه ۲۰۲۶ مشاهده شد که مدل‌های محلی با حجم ۱۳.۸ و ۱۹.۹ گیگابایت، نرخ موفقیت خود را در یک زیرمجموعه از بنچمارک SWE-bench از ۲ از ۱۰ به ۱۰ از ۱۰ رساندند.

Statewright workflow editor

این نتیجه به معنای شکست این فرضیه است که برای کارهای پیچیده حتماً به مدل‌های غول‌پیکر نیاز داریم. وقتی فضای ابزارها در هر مرحله از ۳۰ ابزار به تنها ۵ ابزار کاهش می‌یابد، استنتاج (Inference) — یعنی همان لحظه‌ای که مدل واقعاً جواب تولید می‌کند، شبیه به آشپزیِ نهایی پس از آموزش — بسیار دقیق‌تر صورت می‌گیرد. برای توسعه‌دهندگان، این یعنی مدل‌های محلی و خصوصی اکنون می‌توانند کارهایی را انجام دهند که پیش‌تر مختص GPT-4 یا Claude 3.5 بود.

گام بعدی شما

اگر از Claude Code استفاده می‌کنید، افزونه را با دستور /plugin marketplace add statewright/statewright نصب کنید.
گردش‌های کاری (Workflow) خود را به مراحل کوچک‌تر تقسیم کنید تا مدل‌های کوچک‌تر بتوانند آن‌ها را مدیریت کنند.
روی تعریف «شرط‌های انتقال» بین مراحل تمرکز کنید تا از توهم مدل در تغییر وضعیت جلوگیری شود.

اما داستان سخت‌افزاری این تحول حتی شگفت‌انگیزتر است؛ برای درک اینکه چگونه مدل‌های کوچک‌تر بر سخت‌افزارهای لبه اجرا می‌شوند، تحلیل ما درباره‌ی رایانش لبه را بخوانید.

این گزارش با خط‌لولهٔ خودکار دات‌هوش از منابع معتبر جهانی تدوین و زیر نظر تحریریه منتشر شده است. روش کار ما

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

اخبار روزانه، معرفی ابزارها و مدل‌ها، و آموزشِ کار با هوش مصنوعی؛ همیشه با این پرسش که از ایران چه چیزی کار می‌کند و چه چیزی نه.

تشخیص Bash: مسدود کردن عملیات تخریبی مثل rm یا shred در وضعیت‌هایی که مدل اجازه تغییر فایل ندارد.
محافظ ویرایش: محدود کردن تعداد خطوط تغییریافته در هر وضعیت برای جلوگیری از تغییرات گسترده و فاجعه‌بار در کد.
انتقال‌های شرطی: استفاده از پیش‌شرط‌های برنامه‌نویسی شده (مثلاً tests_passed) برای عبور از یک مرحله به مرحله‌ی بعد.

Statewright workflow editor

گام بعدی شما

اگر از Claude Code استفاده می‌کنید، افزونه را با دستور /plugin marketplace add statewright/statewright نصب کنید.
گردش‌های کاری (Workflow) خود را به مراحل کوچک‌تر تقسیم کنید تا مدل‌های کوچک‌تر بتوانند آن‌ها را مدیریت کنند.
روی تعریف «شرط‌های انتقال» بین مراحل تمرکز کنید تا از توهم مدل در تغییر وضعیت جلوگیری شود.

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

چرا مدل‌های محلی ۱۳ میلیاردی با Statewright در کدنویسی به دقت ۱۰۰ درصدی رسیدند؟

گام بعدی شما

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

چرا مدل‌های محلی ۱۳ میلیاردی با Statewright در کدنویسی به دقت ۱۰۰ درصدی رسیدند؟

گام بعدی شما

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

چرا مدل‌های محلی ۱۳ میلیاردی با Statewright در کدنویسی به دقت ۱۰۰ درصدی رسیدند؟

گام بعدی شما

مقاله‌های مرتبطهمه ←

«تهدید امنیت ملی»؛ هشدار کشورهای G7 به انحصار مدل‌های آمریکایی

سرمایه‌گذاری سری B: ۳۱۰ میلیون دلار برای شبیه‌سازی فیزیک در Odyssey

هگینگ‌فیس با استاندارد ARD جست‌وجوی ابزارها برای عامل‌ها را خودکار کرد

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

مدل‌ها و ابزارهای مرتبط

اصطلاحات این مطلب

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

چرا مدل‌های محلی ۱۳ میلیاردی با Statewright در کدنویسی به دقت ۱۰۰ درصدی رسیدند؟

گام بعدی شما

مقاله‌های مرتبطهمه ←

«تهدید امنیت ملی»؛ هشدار کشورهای G7 به انحصار مدل‌های آمریکایی

سرمایه‌گذاری سری B: ۳۱۰ میلیون دلار برای شبیه‌سازی فیزیک در Odyssey

هگینگ‌فیس با استاندارد ARD جست‌وجوی ابزارها برای عامل‌ها را خودکار کرد

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

مدل‌ها و ابزارهای مرتبط

اصطلاحات این مطلب

راهنمای فارسی هوش مصنوعی — با نگاه به ایران