اگر تصور میکنید بهینهسازی جداگانهی برنامهریز و اجراکننده در عاملهای هوش مصنوعی به نقطه شکست میرساند، در اشتباه نیستید. واقعیت این است که تا امروز، شکاف ساختاری میان «آنچه مدل قصد انجامش را دارد» و «آنچه واقعاً میتواند اجرا کند»، بزرگترین گلوگاه در توسعهی سیستمهای عاملمحور (Agentic) بوده است.
طبق اعلام پژوهشگران در مقالهای که ۹ ژوئن ۲۰۲۶ در arXiv.org منتشر شد، چارچوب جدیدی به نام یادگیری سلسلهمراتبی همراستا با قابلیت (Capability-Aligned Hierarchical Learning یا CAHL) این مشکل را با بهینهسازی مشترک (Joint Optimization) حل میکند. در معماریهای سنتی، یک سیاست سطحبالا برای برنامهریزی کلی و یک سیاست سطحپایین برای فراخوانی ابزارها استفاده میشود؛ اما چون این دو بهطور مجزا بهینه میشوند، برنامهریز اغلب گامهایی را پیشنهاد میدهد که اجراکننده توانایی عملیاتی آنها را ندارد.
همانطور که در تحلیلهای پیشین ما دربارهی چارچوبهای یادگیری ترجیحی (Preference Learning) اشاره کردیم، تمرکز صنعت اکنون از بهبود صرفِ دستورالعملها به سمت همراستاسازی (Alignment) ساختاری در سلسلهمراتب داخلی عاملها تغییر یافته است.
سیستم CAHL برای پل زدن بر این شکاف، از یادگیری تقویتشده از پاداشهای قابل تأیید (RLVR) استفاده میکند تا هر دو سطح سیستم را بهطور همزمان در محیطهای سختگیرانه بهینه کند. این چارچوب در بنچمارکهای زیر بهطور گسترده آزمایش شده است:
- API-Bank و BFCL: برای ارزیابی استفاده از ابزار در محیطهای محدود.
- Bamboogle: برای تعاملات باز در محیطهای پویا.
بر اساس مستندات این پژوهش، این رویکرد فرض قدیمی مبنی بر مستقل بودن ماژول برنامهریز و اجراکننده را به چالش میکشد. CAHL ثابت میکند که «همراستاسازی قابلیتها» به اندازه دنبال کردن دستورالعملها حیاتی است؛ به این معنا که مدل باید پیش از متعهد شدن به یک برنامه، محدودیتهای ابزارهای خود را بهدقت درک کند.
گام بعدی شما
- رصد انتشار وزنهای باز (Open Weights) مدلهای آموزشدیده با CAHL برای استقرار محلی.
- بررسی امکان ادغام منطق بهینهسازی مشترک در گرافهای عملیاتی مانند LangGraph.
- تحلیل مجدد زنجیرههای ابزار (Tool-chains) پیچیده در پروژههای فعلی برای شناسایی نقاط شکست برنامهریز.
این تحول در لایهی آموزش، تنها بخشی از معماری جدید است؛ اثرات این همراستاسازی بر کاهش توهمات در محیطهای صنعتی را در گزارشهای آتی بررسی خواهیم کرد.
گفتگو