مدلهای زبانی بزرگ از طریق عوامل مجهز به ابزار که از طریق API تعامل میکنند، استدلال خودکار را متحول کردهاند. با این حال، اجرای وظایف چندمرحلهای در کتابخانههای ابزار گسترده همچنان یک چالش اساسی محسوب میشود. دو مانع اصلی پیشرفت را کند کرده است: فقدان چارچوبهای ارزیابی دقیق در سطح برنامه و هزینههای محاسباتی بالای کاوش در فضاهای تصمیمگیری گسترده هنگام برنامهریزی بلندمدت.
برای رفع این شکافها، پژوهشگران SLATE را معرفی کردند؛ مجموعه ابزارهای API مصنوعی در مقیاس بزرگ برای تجارت الکترونیک که برای ارزیابی خودکار عوامل یکپارچه با ابزار طراحی شده است. برخلاف معیارهای ارزیابی ایستا، SLATE مسیرهای اجرایی متنوع اما از نظر عملکردی معتبر را میپذیرد. تحلیلها نشان میدهد که عوامل فعلی در خوداصلاحی و کارایی جستجو در محیطهای ابزار پیچیده بهشدت ضعف دارند.
بر پایه این بینشها، پژوهشگران «شاخهبندی آنتروپیمحور» را پیشنهاد کردند؛ الگوریتم جستجوی آگاه از عدم قطعیت که شاخههای تصمیمگیری را در جاهایی که آنتروپی پیشبینی بالاست، بهصورت پویا گسترش میدهد. این رویکرد، تعادل بین کاوش و بهرهبرداری را با تخصیص هوشمند منابع محاسباتی به پربازدهترین نقاط تصمیمگیری بهینهسازی میکند. این الگوریتم نرخ موفقیت وظایف و کارایی محاسباتی را بهطور چشمگیری بهبود میبخشد.
آزمایشهای گسترده روی معیار SLATE نشان میدهد که این مشارکت دوعاملی، پایهای محکم برای توسعه عوامل قابلاعتماد و مقیاسپذیر مدل زبانی بزرگ در محیطهای غنی از ابزار ایجاد میکند. این چارچوب، پیمایش مؤثرتر فضاهای تصمیمگیری بزرگ را ممکن میسازد و همزمان قابلیت محاسباتی را حفظ میکند.

گفتگو