اگر فکر میکنید عاملهای هوش مصنوعی آمادهی مدیریت پروژههای حساس هستند، احتمالاً با کابوس «برنامهنویس جونیور» آشنا نیستید. تصور کنید نیرویی با سرعت خیرهکننده کد میزند، اما برای رسیدن به نتیجه، تستها و مستندات را نادیده میگیرد؛ این دقیقاً همان نقطهی ضعف فعلی عاملهای هوش مصنوعی (AI Agents) است.
برای حل این بحران، ادی اسمانی (Addy Osmani) در ۴ مه ۲۰۲۶ چارچوبی به نام Agent Skills را معرفی کرد تا ساختار مهندسی ارشد را به عاملهای خودمختار تزریق کند. به نقل از اسمانی، این پروژه تا کنون بیش از ۲۶,۰۰۰ ستاره در گیتهاب (GitHub) کسب کرده است. فرضیهی اصلی این است که مدلها بهطور طبیعی کوتاهترین مسیر را برای «تمام کردن» کار انتخاب میکنند، حتی اگر به قیمت نادیده گرفتن مشخصات فنی باشد.
{{img:0}}
طبق اعلام توسعهدهندگان این پروژه، Agent Skills برای مقابله با این رفتار، قوانین متنی را با گردشکارهای ساختاریافته جایگزین کرده است. این چارچوب بر ۵ اصل بنیادین استوار است:
- اولویت فرآیند بر متن: گردشکارهای عملیاتی جایگزین مقالات توصیفی میشوند.
- جداول ضدتوجیه: پاسخهای پیشنویس شده برای رد بهانههای رایج مدلها (مثلاً وقتی مدل میگوید «این تسک برای نوشتن مستندات بیش از حد ساده است»).
- تأییدیه غیرقابلمذاکره: هر تسک باید با شواهد عینی مانند یک تست پاسشده یا ردپای زمان اجرا (Runtime Trace) به پایان برسد.
- افشای تدریجی: مهارتها تنها زمانی وارد بافت (Context) میشوند که فاز مربوطه در چرخه حیات توسعه نرمافزار (Software Development Life Cycle - SDLC) فعال باشد.
- انضباط محدوده: دستور اکید برای «فقط دست زدن به آنچه خواسته شده» جهت جلوگیری از بازنویسیهای (Refactoring) غیرضروری.
{{img:1}}
همانطور که در تحلیل قبلی ما دربارهی امنیت مدلهای بازمتن اشاره کردیم، کنترل دقیق بر خروجی مدلها تنها راه رسیدن به پایداری در محیطهای عملیاتی است. اسمانی در این سیستم، «دیانای گوگل» را کدگذاری کرده است؛ از جمله قانون هیروم (Hyrum's Law) برای طراحی API و «قانون بیانسه» برای توسعه آزمونمحور. این سیستم کار را به ۶ فاز تقسیم میکند: تعریف، برنامهریزی، ساخت، تأیید، بازبینی و ارسال.
این رویکرد، تمرکز صنعت را از مهندسی پرامپت (Prompt Engineering) به «مهندسی مهار» (Harness Engineering) تغییر میدهد. وقتی یک عامل از چتهای کوتاه به اجرای خودمختار ۳۰ ساعته منتقل میشود، هزینه نادیده گرفتن یک تست ساده، از یک باگ کوچک به یک پروژه عظیم باستانشناسی برای دیباگ کردن تبدیل میشود.
اما این تنها آغاز ماجراست؛ اثر موجگونهی این تصمیم بر اکوسیستم متنباز را در گزارش بعدی بررسی خواهیم کرد.
گام بعدی شما
- اگر از Cursor یا Claude Code استفاده میکنید، سعی کنید خروجیهای مدل را با معیارهای خروج (Exit Criteria) سختگیرانه محدود کنید.
- برای پروژههای تیمی، یک جدول «ضدتوجیه» برای خطاهای رایج مدلهای زبانی خود بسازید.
- فازهای ۶گانه SDLC را در گردشکارهای عاملمحور خود پیادهسازی کنید.
گفتگو