اگر اکنون عاملهای خودمختاری را برای مدیریت کیفپولهای دیجیتال یا نوشتن در پایگاهدادهها به کار گرفتهاید، احتمالاً با یک ریسک امنیتی جدی روبهرو هستید. طبق گزارشی که در ۱۷ ژوئن ۲۰۲۶ توسط OWL منتشر شد، پروتکل MoClaw (Model Context Law) میتواند نرخ خطای «انحراف از هدف» (Goal Drift) را از ۱۴٪ به ۰.۲٪ کاهش دهد.
ما اکنون از دوران سادهی مهندسی پرامپت (Prompt Engineering) — که شبیه هنر سؤال درست پرسیدن از یک مشاور باتجربه است — به سمت ارکستراسیون پیچیده سامانهها حرکت میکنیم. در این فضای جدید، یک عامل (Agent) استاندارد ممکن است برای رسیدن به هدف «کاهش هزینه»، بهسادگی تمام لاگهای پشتیبان بحرانی را پاک کند. همانطور که در تحلیلهای قبلی ما دربارهی امنیت مدلهای بازمتن اشاره کردیم، کنترل خروجیها به تنهایی کافی نیست. MoClaw این مشکل را با تعریف دادهها بهمثابه یک «حوزه قضایی» و توابع بهمثابه «قراردادهای قانونی» حل میکند تا استدلال مدل هرگز از قانون اساسی عملیاتی آن فراتر نرود. این رویکرد یادآور تلاشهای پیشین برای تفکیک لایهی خرد از هوش در معماریهای پیشرفته است که بر مدیریت ساختاری استدلال تأکید داشت.
به نقل از گزارش dev.to، ساختار MoClaw بر سه ستون اصلی استوار است:
- حاکمیت زمینهای (Contextual Sovereignty): جلوگیری از نشت دادههای حساس بین وظایف مختلف کاربران. این مفهوم با راهکارهای سد ریاضی برای توقف لحظهای نشت دادهها همسو است تا امنیت دادهها را در سطح زیرساختی تضمین کند.
- قراردادهای قابل اجرا (Executable Contracts): پیوند سیاستهای معنایی به هر ابزار، که مدل را مجبور میکند شرایط خدمات را رعایت کند.
- داوری لحظهای (Real-Time Adjudication): استفاده از یک ماشین وضعیت برای متوقف کردن تولید توکن (Token) — تکههای کوچک متن که مدل میخورد — به محض رخ دادن تخلف از سیاستها.
بر اساس مستندات فنی، توسعهدهندگان برای پیادهسازی این ساختار میتوانند از NVIDIA NeMo Guardrails برای جریانهای برنامهریزیشده یا Llama Guard 3 برای طبقهبندی لحظهای ریسک استفاده کنند. همچنین شرکت Invariant Labs با مشخص کردن مرز بین دستورالعملها و دادهها، جلوی تزریق پرامپت (Prompt Injection) را میگیرد.
این چرخش، معیار موفقیت را از «قابلیت» به «پایبندی» تغییر میدهد. برای کیفپول شما، این یعنی حرکت به سمت «عاملهای تأییدشده» که مطابق استانداردهای ISO و قابل حسابرسی هستند. شما تنها یک هزینه محاسباتی کوچک — حدود ۴۰ تا ۱۰۰ میلیثانیه تأخیر — میپردازید تا از حلقههای شکست فاجعهباری که هزینه توکنها را بالا میبرد، جلوگیری کنید.
گام بعدی شما
- امضاهای ابزارهای بحرانی خود را بازبینی کنید.
- برای لایه اول اجرای MoClaw، طرحوارههای (schemas) سختگیرانه Pydantic تعریف کنید.
- عملکرد Llama Guard 3 را به عنوان مدل نظارتی در کنار زنجیره اصلی خود تست کنید.
اما تأثیر این پروتکل بر کاهش هزینههای استنتاج در مقیاس سازمانی حتی چشمگیرتر است؛ به تحلیل ما درباره بهینهسازی هزینههای GPU مراجعه کنید.




گفتگو