چگونه جایگزینی ذخیره‌ساز KV پایداری عامل‌های Claude را بازگرداند؟

اگر در حال توسعه خط لوله‌های چندعاملی هستید، احتمالاً با سقف‌های نامرئی برخورد کرده‌اید که هیچ ربطی به هوش مدل ندارد. در ۲۹ ژوئن ۲۰۲۶، مقیاس‌دهی عامل‌ها (Agents) در Claude Code از ۴ به ۸ مورد، نرخ خطا را از ۰.۸٪ به ۴.۳٪ افزایش داد.

به نقل از تحلیل فنی منتشرشده در dev.to، علت این شکست مدل نبود، بلکه یک ابزار MCP به نام analytics_query بود. این ابزار در محیط Cloudflare Workers، وقتی درخواست‌ها به نمونه‌های مختلف ارسال می‌شد، نشانگرهای صفحه‌بندی (Pagination Cursors) را گم می‌کرد.

همان‌طور که در تحلیل قبلی ما درباره‌ی اجرای محلی Claude Code روی اولاما (Ollama) اشاره کردیم، کاهش هزینه‌ها یک سوی سکه است و سوی دیگر آن، «مالیات زیرساختی» در گردش‌های عامل‌محور (Agentic) است. این موضوع در واقع تکرار همان چالش‌های مربوط به محیط‌های Stateless است که باعث فراموشی عامل‌ها و کاهش بهره‌وری آن‌ها می‌شود. این وضعیت شبیه به گفتگو با یک کارمند است که هر چند دقیقه شما را به شخص جدیدی ارجاع می‌دهد؛ در نهایت، کارمند جدید فراموش می‌کند شما کی هستید و چه سفارش داده‌اید.

طبق گزارش توسعه‌دهنده، برای حل این مشکل دو معماری آزمایش شد:

ذخیره‌ساز نشست مبتنی بر KV: مشکل مسیریابی را حل کرد، اما تأخیر p99 را از ۱۸۰ میلی‌ثانیه به ۶۲۰ میلی‌ثانیه رساند و هزینه ماهانه را به دلیل افزایش ۱۶ برابری نوشتن داده‌ها، به ۱۵۰ دلار افزایش داد.
اشیاء بادوام (Durable Objects - DO): با مسیریابی بر اساس شناسه نشست، تأخیر p99 به ۳۸ میلی‌ثانیه رسید و هزینه‌ها به ۴۰ تا ۶۰ دلار کاهش یافت.

با این حال، توسعه‌دهنده هشدار داد که نمونه‌های DO در حالت بیکار حذف می‌شوند و باعث از دست رفتن وضعیت در حافظه می‌شوند. برای مقابله با این نقص، معماری نهایی از حافظه DO برای نشست‌های فعال و نقطه بازرسی (Checkpoint) برای هر فراخوانی ابزار استفاده می‌کند (که ۱۰ دلار هزینه اضافه دارد) و KV را فقط برای ایندکس‌گذاری مسیریابی به‌کار می‌برد.

این تغییر ثابت می‌کند که سقف پیشرفت عامل‌ها همیشه هوش مدل نیست، بلکه فیزیک مدیریت وضعیت در محیط‌های بدون سرور (Serverless) است. برای توسعه‌دهندگان، مرز ۶ عامل یک نقطه عطف بحرانی است که در آن محاسبات برخورد نشست‌ها بدون یک سیستم پیوستگی اختصاصی، ناپایدار می‌شود. این پیچیدگی‌ها در واقع بخشی از روند گذار از چت‌های ساده به مهندسی برنامه‌ریزی‌شده در Claude Code است که نیازمند نگاهی دقیق‌تر به زیرساخت‌هاست.

گام بعدی شما

وضعیت پایداری ابزارهای خود را در مقیاس بالا بازبینی کنید.
به‌دنبال «شکست‌های خاموش» بگردید؛ جایی که عامل بدون داشتن زمینه (Context) معتبر ادامه می‌دهد اما هشدار سیستمی نمی‌دهد.
اگر از Cloudflare استفاده می‌کنید، تفاوت‌های عملکردی بین KV و Durable Objects را برای مدیریت State ارزیابی کنید.

اما تأثیر این محدودیت‌ها بر مدل‌های استدلالی جدید حتی پیچیده‌تر است — به تحلیل ما درباره‌ی مدل‌های Reasoning مراجعه کنید.

این گزارش با خط‌لولهٔ خودکار دات‌هوش از منابع معتبر جهانی تدوین و زیر نظر تحریریه منتشر شده است. روش کار ما

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

اخبار روزانه، معرفی ابزارها و مدل‌ها، و آموزشِ کار با هوش مصنوعی؛ همیشه با این پرسش که از ایران چه چیزی کار می‌کند و چه چیزی نه.

طبق گزارش توسعه‌دهنده، برای حل این مشکل دو معماری آزمایش شد:

ذخیره‌ساز نشست مبتنی بر KV: مشکل مسیریابی را حل کرد، اما تأخیر p99 را از ۱۸۰ میلی‌ثانیه به ۶۲۰ میلی‌ثانیه رساند و هزینه ماهانه را به دلیل افزایش ۱۶ برابری نوشتن داده‌ها، به ۱۵۰ دلار افزایش داد.
اشیاء بادوام (Durable Objects - DO): با مسیریابی بر اساس شناسه نشست، تأخیر p99 به ۳۸ میلی‌ثانیه رسید و هزینه‌ها به ۴۰ تا ۶۰ دلار کاهش یافت.

گام بعدی شما

وضعیت پایداری ابزارهای خود را در مقیاس بالا بازبینی کنید.
به‌دنبال «شکست‌های خاموش» بگردید؛ جایی که عامل بدون داشتن زمینه (Context) معتبر ادامه می‌دهد اما هشدار سیستمی نمی‌دهد.
اگر از Cloudflare استفاده می‌کنید، تفاوت‌های عملکردی بین KV و Durable Objects را برای مدیریت State ارزیابی کنید.

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

چگونه جایگزینی ذخیره‌ساز KV پایداری عامل‌های Claude را بازگرداند؟

گام بعدی شما

منابع

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

چگونه جایگزینی ذخیره‌ساز KV پایداری عامل‌های Claude را بازگرداند؟

گام بعدی شما

منابع

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

چگونه جایگزینی ذخیره‌ساز KV پایداری عامل‌های Claude را بازگرداند؟

گام بعدی شما

منابع

مقاله‌های مرتبطهمه ←

هگینگ‌فیس با استاندارد ARD جست‌وجوی ابزارها برای عامل‌ها را خودکار کرد

«پیش‌بینی مسیر از طریق متن»؛ دستاورد جدید مؤسسه AllenAI در فضای سه‌بعدی

Z.ai: برتری GLM-5.2 بر GPT-5.5 در کدنویسی بلندمدت

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

مدل‌ها و ابزارهای مرتبط

اصطلاحات این مطلب

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

چگونه جایگزینی ذخیره‌ساز KV پایداری عامل‌های Claude را بازگرداند؟

گام بعدی شما

منابع

مقاله‌های مرتبطهمه ←

هگینگ‌فیس با استاندارد ARD جست‌وجوی ابزارها برای عامل‌ها را خودکار کرد

«پیش‌بینی مسیر از طریق متن»؛ دستاورد جدید مؤسسه AllenAI در فضای سه‌بعدی

Z.ai: برتری GLM-5.2 بر GPT-5.5 در کدنویسی بلندمدت

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

مدل‌ها و ابزارهای مرتبط

اصطلاحات این مطلب

راهنمای فارسی هوش مصنوعی — با نگاه به ایران