اگر قصد دارید تعداد ابزارهای عامل هوش مصنوعی خود را از ۵ به ۵۰ برسانید، آمادهی سقوط نرخ موفقیت آن باشید. باید بدانید که «ابزار بیشتر» لزوماً به معنای «قابلیت بیشتر» نیست؛ بلکه اغلب به فلج تصمیمگیری و خطاهای بحرانی در پارامترها منجر میشود.
این اتفاق زمانی میافتد که توسعهدهندگان سعی میکنند عاملها را به سمت گردشهای کاری پیچیده و چندمراحلهای ببرند. مدل زبانی بزرگ (LLM) — مثل کتابخانهداری که میلیاردها صفحه را خوانده و حالا با همان لحن کتابها جواب میدهد — در مواجهه با لیستهای طولانی ابزارها دچار سردرگمی میشود. همانطور که در تحلیل قبلی ما دربارهی نبودِ لایههای محافظتی (Guards) در فراخوانی ابزارها اشاره کردیم، فاصله میان قدرت تئوریک و پایداری عملی عاملهای هوش مصنوعی (AI Agents) در حال افزایش است. تصور کنید جعبهابزاری دارید که هرچه آچار بیشتری به آن اضافه میکنید، پیدا کردن آچارِ مناسب سختتر میشود.
در ۲۵ مه ۲۰۲۶، مطالعهای در وبسایت dev.to منتشر شد که این بحران مقیاسپذیری را کالبدشکافی میکند. طبق یافتههای این گزارش، وقتی تعداد ابزارهای یک عامل مالی به ۳۰ مورد رسید، مدل چندین دقیقه زمان نیاز داشت تا ابزار درست را انتخاب کند. شکستهای فنی کلیدی ثبتشده عبارت بودند از:
- حذف پارامتر: فراخوانی
inventory_apiبارها شکست خورد، چون عامل فیلد اجباریlocationرا نادیده گرفت. - توهم (Hallucination) — شبیه به دوستی که خاطرهای را اشتباه تعریف میکند — در حالی که مدل سعی میکرد از ابزارهایی استفاده کند که اصلاً وجود نداشتند.
- فراخوانیهای تکراری: اجرای ابزار
user_profile_lookupبرای یک привет ساده، تنها به دلیل دستورالعملهای مبهم.
برای حل این مشکل، نویسنده یک لایهی متادیتا برای گروهبندی ابزارها و یک سیستم کشینگ (Caching) برای فراخوانیهای پرتکرار پیاده کرد. این موضوع ثابت میکند که مدلها ابزارها را به صورت احتمالی انتخاب میکنند، نه بر اساس منطق سخت. وقتی فضای جستوجوی ابزارها گسترده میشود، احتمال انتخاب گزینهی غلط بالا میرود. برای توسعهدهنده، این یعنی گلوگاه دیگر هوش مدل نیست، بلکه شفافیت توصیفات ابزار است.
گام بعدی شما
- توصیفات ابزارهای فعلی خود را برای حذف ابهام بازبینی کنید.
- به دنبال پیادهسازی لایههای ارکستراسیون (Orchestration) باشید که کشف ابزار را از اجرای آن جدا میکند.
- از سیستمهای کشینگ برای فراخوانیهای تکراری استفاده کنید.
اما تأثیر این محدودیت بر هزینههای پردازشی حتی تکاندهندهتر است؛ در تحلیل ما دربارهی بهینهسازی هزینه استنتاج بخوانید.




گفتگو