اگر فکر میکنید دسترسی عاملها به مستندات از طریق تولید بازیابیافزا (Retrieval-Augmented Generation - RAG) کافی است، احتمالاً با سد اجرایی مواجه شدهاید. مشکل بنیادین این است که مدلها میتوانند دفترچه راهنما را بخوانند، اما همیشه نمیدانند چگونه آن را در دنیای واقعی اجرا کنند.
Anything2Skill این شکاف را با تبدیل دانش خام به قراردادهای مهارتی (Skill Contracts) اجرایی پر میکند تا عاملها به جای استنتاج هر بار از صفر، «تخصص» را نصب کنند.
طبق مستندات ارائهشده در arxiv.org در تاریخ ۹ ژوئن ۲۰۲۶، این چارچوب از طریق یک خط لوله تخصصی عمل میکند:
- استخراج مهارت (Skill Extraction): تجزیه سوابق دانش به پنجرههای شواهدی و استخراج دادهها بر اساس یک پیشفرض درخت مهارت.
- ساختاردهی قرارداد (Contract Structuring): تبدیل کاندیدها به قراردادهایی که شامل شرایط فراخوانی، موارد منع، گامهای گردشکار و امتیازات اطمینان هستند.
- مدیریت بانک مهارت (SkillBank Management): ذخیرهسازی این قراردادها در یک بانک مهارت (SkillBank) پایدار با قابلیت بهروزرسانی نسخهها.
به نقل از نتایج آزمایشهای رودررو، عاملهایی که از این حافظه رویهای در کنار RAG استفاده کردند، به نرخ موفقیت ۹۸.۸۵٪ در qsv و ۹۴.۱۰٪ در GitHub-CLI دست یافتند و بهطور قابلتوجهی از مدلهای مبتنی بر RAG ساده پیشی گرفتند.
همانطور که در تحلیلهای پیشین ما دربارهی محدودیتهای حافظهی کوتاهمدت در مدلهای زبانی اشاره کردیم، صنعت اکنون به سمت حافظههای خود-تکاملیافته حرکت میکند. هدف، ایجاد یک سلسلهمراتب قابلیتهای شناختی است تا عاملها بتوانند تجربیات پیشین را بدون نویز ناشی از ردههای تاریخی خام، در پروندههای جدید به کار بگیرند.
این سازوکار این فرض را که RAG برای خودمختاری پیچیده کافی است، بهطور کلی تغییر میدهد. در واقع، گلوگاه از «توانایی مدل در استدلال روی تکههای متن» به «کارآمدی فرآیند تدوین مهارت» منتقل میشود. این یعنی جداسازی کامل «چیستی» (دانش اظهاری) از «چگونگی» (قابلیت رویهای).
گام بعدی شما
- بررسی امکان ادغام این رویکرد با سیستمهای حافظه شناختی دو-پردازشی برای پالایش مهارتها در محیط عملیاتی.
- تحلیل نرخ خطای تبدیل دانش خام به قرارداد در دامنههای تخصصیتر مانند پزشکی یا حقوق.
- دنبال کردن توسعه ابزارهای خودکار برای بهروزرسانی SkillBank بدون دخالت انسانی.
اما تأثیر این رویکرد بر کاهش هزینههای استنتاج در مقیاس بزرگ، موضوع دیگری است — به بررسی ما درباره بهینهسازی توکنها مراجعه کنید.
گفتگو