اگر در حال توسعه خط لولههای چندعاملی هستید، احتمالاً با سقفهای نامرئی برخورد کردهاید که هیچ ربطی به هوش مدل ندارد. در ۲۹ ژوئن ۲۰۲۶، مقیاسدهی عاملها (Agents) در Claude Code از ۴ به ۸ مورد، نرخ خطا را از ۰.۸٪ به ۴.۳٪ افزایش داد.
به نقل از تحلیل فنی منتشرشده در dev.to، علت این شکست مدل نبود، بلکه یک ابزار MCP به نام analytics_query بود. این ابزار در محیط Cloudflare Workers، وقتی درخواستها به نمونههای مختلف ارسال میشد، نشانگرهای صفحهبندی (Pagination Cursors) را گم میکرد.
همانطور که در تحلیل قبلی ما دربارهی اجرای محلی Claude Code روی اولاما (Ollama) اشاره کردیم، کاهش هزینهها یک سوی سکه است و سوی دیگر آن، «مالیات زیرساختی» در گردشهای عاملمحور (Agentic) است. این موضوع در واقع تکرار همان چالشهای مربوط به محیطهای Stateless است که باعث فراموشی عاملها و کاهش بهرهوری آنها میشود. این وضعیت شبیه به گفتگو با یک کارمند است که هر چند دقیقه شما را به شخص جدیدی ارجاع میدهد؛ در نهایت، کارمند جدید فراموش میکند شما کی هستید و چه سفارش دادهاید.
طبق گزارش توسعهدهنده، برای حل این مشکل دو معماری آزمایش شد:
- ذخیرهساز نشست مبتنی بر KV: مشکل مسیریابی را حل کرد، اما تأخیر p99 را از ۱۸۰ میلیثانیه به ۶۲۰ میلیثانیه رساند و هزینه ماهانه را به دلیل افزایش ۱۶ برابری نوشتن دادهها، به ۱۵۰ دلار افزایش داد.
- اشیاء بادوام (Durable Objects - DO): با مسیریابی بر اساس شناسه نشست، تأخیر p99 به ۳۸ میلیثانیه رسید و هزینهها به ۴۰ تا ۶۰ دلار کاهش یافت.
با این حال، توسعهدهنده هشدار داد که نمونههای DO در حالت بیکار حذف میشوند و باعث از دست رفتن وضعیت در حافظه میشوند. برای مقابله با این نقص، معماری نهایی از حافظه DO برای نشستهای فعال و نقطه بازرسی (Checkpoint) برای هر فراخوانی ابزار استفاده میکند (که ۱۰ دلار هزینه اضافه دارد) و KV را فقط برای ایندکسگذاری مسیریابی بهکار میبرد.
این تغییر ثابت میکند که سقف پیشرفت عاملها همیشه هوش مدل نیست، بلکه فیزیک مدیریت وضعیت در محیطهای بدون سرور (Serverless) است. برای توسعهدهندگان، مرز ۶ عامل یک نقطه عطف بحرانی است که در آن محاسبات برخورد نشستها بدون یک سیستم پیوستگی اختصاصی، ناپایدار میشود. این پیچیدگیها در واقع بخشی از روند گذار از چتهای ساده به مهندسی برنامهریزیشده در Claude Code است که نیازمند نگاهی دقیقتر به زیرساختهاست.
گام بعدی شما
- وضعیت پایداری ابزارهای خود را در مقیاس بالا بازبینی کنید.
- بهدنبال «شکستهای خاموش» بگردید؛ جایی که عامل بدون داشتن زمینه (Context) معتبر ادامه میدهد اما هشدار سیستمی نمیدهد.
- اگر از Cloudflare استفاده میکنید، تفاوتهای عملکردی بین KV و Durable Objects را برای مدیریت State ارزیابی کنید.
اما تأثیر این محدودیتها بر مدلهای استدلالی جدید حتی پیچیدهتر است — به تحلیل ما دربارهی مدلهای Reasoning مراجعه کنید.




گفتگو