اگر امروز در حال استقرار عاملهای هوش مصنوعی هستید، بزرگترین هزینه شما یک اشتباه ساده نیست، بلکه حلقهی تکرار بینهایتی است که پس از آن میآید. تصور کنید عاملی یک مرحله را اشتباه انجام میدهد و سیستم بدون هیچ تغییری در وضعیت، دوباره همان دستور را اجرا میکند؛ نتیجه فقط تخلیه بودجه توکنها و از بین رفتن اعتماد کاربر است. این مشکل در واقع شکلی از اتلاف منابع است که در راهکارهای مدیریت صف اقدامات برای جلوگیری از هدررفت توکنها نیز به آن پرداختهایم.
عامل (Agent) — شبیه کارمندی است که به او هدف میدهید و او خودش تصمیم میگیرد چه ابزاری را در چه زمانی استفاده کند تا به جواب برسد. طبق گزارشی از dev.to که در ۱۷ ژوئن ۲۰۲۶ منتشر شد، این اتفاق یک شکست در سیستم کنترل است، نه نقص در کیفیت مدل. برای مثال، بسیاری از عاملهای کدنویس را میتوان دید که در مراحل نهایی تولید به دلیل همین نقص در کنترل، دچار شکست میشوند.
همانطور که در تحلیلهای قبلی ما دربارهی امنیت مدلهای بازمتن اشاره کردیم، کنترل دقیق روی خروجیها حیاتی است. اکثر توسعهدهندگان به اشتباه سعی میکنند این مشکل را با طولانیتر کردن پرامپتها یا افزایش زمان انتظار (Timeout) حل کنند. اما اگر محیط تغییری نکند، تکرار صرفاً کپی دوم همان اشتباه قبلی است. لازم به ذکر است که افزایش طول تاریخچه گفتگو در تلاش برای حل این مشکلات، میتواند مشابه چتهای طولانی با هوش مصنوعی باشد و هزینه استنتاج را بهشدت بالا ببرد.
برای توقف این روند، MartinLoop پیشنهاد میکند تمرکز را از مهندسی پرامپت (Prompt Engineering) — که هنر سؤال درست پرسیدن است، مثل کسی که میداند چطور از یک مشاور باتجربه بهترین جواب را بگیرد — به سمت عملیات (Operations) ببریم. بر اساس مستندات این رویکرد، سیستم کنترل باید قبل از هر حرکت به چهار سؤال پاسخ دهد:
- سقف بودجه چقدر است (مثلاً ۲۵۰ توکن)؟
- چه چیزی «موفقیت» تعریف میشود؟
- بررسیکننده یا تاییدکننده کیست؟
- اگر همان خطا تکرار شد، چه اتفاقی بیفتد؟
با فعال کردن سیاست stop_on_same_error: true، سامانهها دیگر تظاهر نمیکنند که اجرای مجدد، نتیجهای متفاوت دارد. این تغییر نیازمند «رسید» است؛ یعنی تاریخچههای واقعی که نشان دهد عامل چه چیزی را امتحان کرد، چه تغییری رخ داد و چرا متوقف شد، نه خلاصههای مبهمی که فقط برای ایجاد حس اعتماد نوشته شدهاند.
این شیوه باعث میشود عامل شما زودتر متوقف شود و شاید کمتر «جادویی» به نظر برسد. اما برای یک توسعهدهنده، عاملی که شکست خود را بپذیرد، بسیار کاربردیتر از عاملی است که کورکورانه در بودجه سازمان پرسه میزند.
گام بعدی شما
- سیاست توقف در خطاهای تکراری (
stop_on_same_error) را در لایهی اجرایی پیاده کنید. - به جای خلاصههای متنی، سیستم ثبت لاگ (Log) دقیق برای هر اکشن عامل ایجاد کنید.
- سقف توکن برای هر چرخه تکرار (Retry Loop) تعریف کنید.
اما تکامل بعدی در این مسیر، طبقهبندی دقیقتر خطاهاست؛ به تحلیل ما دربارهی مدلهای استدلالی برای مدیریت بازیابی خطا مراجعه کنید.




گفتگو