گزارش arXiv: نرخ موفقیت عامل‌های کدنویس با متد Shepherd به ۵۴.۷٪ رسید

اگر هنوز برای مدیریت وضعیت عامل‌ها به کانتینرهای سنگین تکیه می‌کنید، باید بدانید که گلوگاه اصلی سرعت پیشرفت شما همین‌جاست. تصور کنید بتوانید هر لحظه از تصمیم‌گیری یک مدل را مانند یک شاخه در گیت فورک کنید و بدون اتلاف زمان، مسیرهای جایگزین را آزمایش کنید.

مدیریت وضعیت در عامل‌های (Agents) خودمختار مدت‌هاست که به دلیل نیاز به مجازی‌سازی‌های سنگین، سرعت تکرار و یادگیری را کاهش داده است. همان‌طور که در تحلیل‌های پیشین ما درباره‌ی یادگیری مهارت‌های متا در SkillEvolver اشاره کردیم، صنعت به سمت کنترل‌های دانه‌ریزتر برای یادگیری مدل‌ها از اشتباهاتشان حرکت می‌کند.

طبق اعلام مقاله‌ای که در ۱۲ می ۲۰۲۶ در arxiv.org منتشر شد، Shepherd یک مدل برنامه‌نویسی تابعی را پیاده‌سازی کرده که در آن عملیات متا-عامل‌ها در زبان Lean مکانیزه شده‌اند. بر اساس مستندات این پژوهش، مزایای فنی این معماری عبارتند از:

ایجاد ردپای اجرایی (Execution Trace) مشابه گیت که هر تعامل را به عنوان یک رویداد تایپ‌شده ثبت کرده و فورک کردن هر وضعیت گذشته را ممکن می‌کند.
فورک کردن فرآیند و سیستم فایل که ۵ برابر سریع‌تر از Docker است.
بازاستفاده از حافظه پومپ (Prompt-cache) با نرخ بیش از ۹۵٪ در هنگام بازپخش وضعیت‌ها.
ارتقای نمرات TerminalBench-2 از ۳۴.۲٪ به ۳۹.۴٪ در آموزش‌های Tree-RL.

این معماری پارادایم اجرا را از یک خط مستقیم به یک اکتشاف شاخه‌ای تغییر می‌دهد. به نقل از نویسندگان مقاله، این قابلیت به پژوهشگران اجازه می‌دهد بهینه‌سازی‌های متقابل‌الواقع (Counterfactual Optimization) را انجام دهند و زمان واقعی اجرای عملیات را تا ۵۸٪ کاهش دهند. در واقع، دیباگ کردن و بهینه‌سازی عامل‌ها اکنون به یک مسئله‌ی مدیریت نسخه‌ی نرم‌افزاری تبدیل شده است.

گام بعدی شما

بررسی مخزن متن‌باز Shepherd برای ادغام قابلیت «سفر در زمان» در فریم‌ورک‌های ارکستراسیون فعلی.
جایگزینی کانتینرهای سنگین با ردپاهای اجرایی برای کاهش هزینه‌ی آموزش عامل‌های کدنویس.
تحلیل اثر این متد بر کاهش هزینه‌های استنتاج (Inference) در مقیاس بالا.

اما داستان سخت‌افزاری این تحول حتی شگفت‌انگیزتر است — به تحلیل ما درباره‌ی تراشه‌های Blackwell مراجعه کنید.

این گزارش با خط‌لولهٔ خودکار دات‌هوش از منابع معتبر جهانی تدوین و زیر نظر تحریریه منتشر شده است. روش کار ما

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

اخبار روزانه، معرفی ابزارها و مدل‌ها، و آموزشِ کار با هوش مصنوعی؛ همیشه با این پرسش که از ایران چه چیزی کار می‌کند و چه چیزی نه.

ایجاد ردپای اجرایی (Execution Trace) مشابه گیت که هر تعامل را به عنوان یک رویداد تایپ‌شده ثبت کرده و فورک کردن هر وضعیت گذشته را ممکن می‌کند.
فورک کردن فرآیند و سیستم فایل که ۵ برابر سریع‌تر از Docker است.
بازاستفاده از حافظه پومپ (Prompt-cache) با نرخ بیش از ۹۵٪ در هنگام بازپخش وضعیت‌ها.
ارتقای نمرات TerminalBench-2 از ۳۴.۲٪ به ۳۹.۴٪ در آموزش‌های Tree-RL.

گام بعدی شما

بررسی مخزن متن‌باز Shepherd برای ادغام قابلیت «سفر در زمان» در فریم‌ورک‌های ارکستراسیون فعلی.
جایگزینی کانتینرهای سنگین با ردپاهای اجرایی برای کاهش هزینه‌ی آموزش عامل‌های کدنویس.
تحلیل اثر این متد بر کاهش هزینه‌های استنتاج (Inference) در مقیاس بالا.

اما داستان سخت‌افزاری این تحول حتی شگفت‌انگیزتر است — به تحلیل ما درباره‌ی تراشه‌های Blackwell مراجعه کنید.

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

گزارش arXiv: نرخ موفقیت عامل‌های کدنویس با متد Shepherd به ۵۴.۷٪ رسید

گام بعدی شما

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

گزارش arXiv: نرخ موفقیت عامل‌های کدنویس با متد Shepherd به ۵۴.۷٪ رسید

گام بعدی شما

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

گزارش arXiv: نرخ موفقیت عامل‌های کدنویس با متد Shepherd به ۵۴.۷٪ رسید

گام بعدی شما

مقاله‌های مرتبطهمه ←

سرمایه‌گذاری سری B: ۳۱۰ میلیون دلار برای شبیه‌سازی فیزیک در Odyssey

هگینگ‌فیس با استاندارد ARD جست‌وجوی ابزارها برای عامل‌ها را خودکار کرد

«پیش‌بینی مسیر از طریق متن»؛ دستاورد جدید مؤسسه AllenAI در فضای سه‌بعدی

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

اصطلاحات این مطلب

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

گزارش arXiv: نرخ موفقیت عامل‌های کدنویس با متد Shepherd به ۵۴.۷٪ رسید

گام بعدی شما

مقاله‌های مرتبطهمه ←

سرمایه‌گذاری سری B: ۳۱۰ میلیون دلار برای شبیه‌سازی فیزیک در Odyssey

هگینگ‌فیس با استاندارد ARD جست‌وجوی ابزارها برای عامل‌ها را خودکار کرد

«پیش‌بینی مسیر از طریق متن»؛ دستاورد جدید مؤسسه AllenAI در فضای سه‌بعدی

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

اصطلاحات این مطلب

راهنمای فارسی هوش مصنوعی — با نگاه به ایران