اگر عاملهای هوش مصنوعی شما در حلقههای تکراری از اشتباهات گیر میکنند، مشکل از کمبود دانش نیست، بلکه ناتوانی آنها در «فراموش کردن» مسیرهای غلط است. باید بدانید که PruneTIR میتواند با حذف مسیرهای استدلالی معیوب، مانع از سقوط مدل در تلههای تکرار شود.
استفاده از ابزارها در استدلال (TIR) به مدلها اجازه میدهد از مفسرهای کد و APIها استفاده کنند، اما این فرآیند اغلب پنجره متنی (Context Window) را با نویز پر میکند. همانطور که در تحلیلهای پیشین ما دربارهی پایداری عاملهای هوشمند اشاره کردیم، قابلیت بازیابی از خطا در زمان اجرا، اکنون حیاتیتر از حجم دادههای آموزشی است و صنعت به سمت جریانهای کاری عاملمحور (Agentic) حرکت میکند.
بر اساس مقالهای که در ۱۲ می ۲۰۲۶ در arxiv.org منتشر شد، چارچوب PruneTIR از سه سازوکار کلیدی برای اصلاح مسیر استدلال استفاده میکند:
- هرس مبتنی بر موفقیت: حذف مسیرهای تکراری و اضافی به محض یافتن یک راهحل درست.
- هرس و بازنمونهبرداری مبتنی بر گیر کردن: شناسایی شکستهای تکراری و اجبار مدل به انتخاب یک مسیر متفاوت.
- تعلیق ابزار مبتنی بر تلاش مجدد: توقف موقت استفاده از ابزار زمانی که تلاشهای مکرر منجر به رفع خطا نشود.
این رویکرد، تمرکز را از «آموزش بهتر برای استفاده از ابزار» به «مدیریت هوشمندتر در زمان استنتاج (Inference)» تغییر میدهد. طبق یافتههای نویسندگان، تعداد فراخوانیهای غلط ابزار با صحت پاسخها رابطه معکوس دارد و PruneTIR دقیقاً با هدف قرار دادن این خطاها، نمرات Pass@1 را بهبود بخشیده و طول متن فعال را کاهش میدهد.
گام بعدی شما
- بررسی کامل مقاله PruneTIR در arXiv برای درک بنچمارکهای مقایسهای.
- رصد روندهای «محاسبات زمان تست» (Test-time Compute) برای بهینهسازی مدلهای استدلالی.
- آزمایش متدهای هرس مسیر در پیادهسازیهای فعلی عاملهای هوشمند خود.
اما تأثیر این بهینهسازیها بر سختافزارهای نسل جدید، داستانی دیگر است؛ تحلیل ما دربارهی تراشههای Blackwell را بخوانید.




گفتگو