تصور کنید صبح از خواب بیدار شوید و با اعلان پرداخت ۲۰۰ دلاری از Stripe مواجه شوید که در حالی که شماe خواب بودید، از حسابتان کم شده است. این کابوس برای توسعهدهندهای رخ داد که متوجه شد عامل (Agent) — سیستمی که مثل یک کارمند دیجیتال میتواند بهطور مستقل ابزارها را اجرا کند — شب تمام در یک «حلقه توکن» گیر کرده بود.
این حلقه شامل فراخوانیهای بیپایان API بود که در گزارشها کاملاً سالم به نظر میرسیدند اما در عمل هیچ ارزشی تولید نکردند. همانطور که در تحلیلهای قبلی ما دربارهی ریسکهای استقرار مدلهای خودکار اشاره کردیم، انتقال از چتباتهای ساده به سامانههای عاملمحور (Agentic)، ریسک هزینههای سرکشی را بهشدت افزایش میدهد. این مسئله بهویژه در محیطهای توسعه کدجایی مشهود است، جایی که طولانی شدن چتها میتواند هزینههای استنتاج را بهطور غیرمنتظرهای بالا ببرد.
به گزارش وبسایت dev.to در ۱۸ ژوئن ۲۰۲۶، این اتفاق زمانی رخ میدهد که عاملها فاقد سقف تعداد تلاش مجدد (retry count) یا معماریهای حساس به هزینه باشند. برخلاف نرمافزارهای سنتی که هنگام خطا متوقف میشوند، یک عامل هوش مصنوعی میتواند بهصورت «ساکت» شکست بخورد؛ یعنی مدام ابزاری را فراخوانی کند که نتیجهای مبهم میدهد و مدل را دوباره به همان نقطه بازمیگرداند. در همین راستا، جایگزینی مهندسی پرامپت با محدودیتهای اجرایی سختگیرانه به عنوان راهکار موثرتری برای توقف این بحرانهای تکرار معرفی شده است.
طبق اعلام نویسنده، ریاضیات این ضرر ساده است: هر فراخوانی GPT-4o حدود ۰.۰۰۵ دلار برای هر ۱ هزار توکن (Token) — تکههای کوچکی از متن، شبیه برشهای یک کیک طولانی که مدل تکهتکه میخورد — هزینه دارد. با ۵۰۰ چرخه در ساعت و ۴ هزار توکن در هر مورد، هر ساعت ۱۰ دلار میسوزد که در یک چرخه ۲۰ ساعته خواب، به ۲۰۰ دلار میرسد.
برای جلوگیری از این وضعیت، چهار معیار نظارتی حیاتی پیشنهاد شده است:
- مدتزمان اجرا: علامتگذاری اجراهایی که ۲ برابر زمان متوسط طول میکشند.
- تعداد توکن در هر اجرا: شناسایی جهشهای ۱۰ برابری در مصرف توکن.
- هزینه هر اجرا: تعیین یک سقف سخت (مثلاً ۴.۵۰ دلار) برای کشتن فرآیند.
- الگوهای شکست: توقف خودکار پس از سه فراخوانی ناموفق متوالی ابزار.
این حادثه ثابت میکند هزینه واقعی عاملها فقط قبض API نیست، بلکه ساعتهای تلف شده توسعهدهنده برای عیبیابی شکستهای ساکت و از دست رفتن اعتماد مشتری است.
گام بعدی شما
- ابزارهای نظارتی خارجی مانند AI Agents Control Tower را بررسی کنید.
- برای تمام فراخوانیهای ابزار، یک Wrapper سفارشی بنویسید که هزینه را بهصورت آنی ردیابی کند.
- پیش از انتقال به محیط عملیاتی، «قطعکنندههای مدار» (Circuit Breakers) سختافزاری یا نرمافزاری تعریف کنید.
اما داستان سختافزاری این تحول و نحوه مدیریت حافظه در مقیاس بالا حتی شگفتانگیزتر است — به تحلیل ما دربارهی تراشههای Blackwell مراجعه کنید.




گفتگو