اگر عامل هوش مصنوعی شما در حلقهی بهبود خود، حقایق تأییدشده را با توهمات جایگزین میکند، شما با یک شکست سیستمی رو بهرو هستید، نه مشکل کیفیت مدل. طبق اعلام توسعهدهندگان، نسخهی akm 0.8.0 که در ۴ ژوئن ۲۰۲۶ منتشر شد، دقیقاً برای توقف این «حلقهی تخریب» طراحی شده است تا به عاملها یاد دهد چه زمانی باید دست از بازنویسی دادهها بکشند.
bیشتر عاملها برای سازماندهی اطلاعات خود از فرآیند تجمیع حافظه استفاده میکنند. این سیستم مثل یک فایلینگکابینت دیجیتالی است که سعی میکند شبها خودش را مرتب کند؛ اما مشکل زمانی پیش میآید که کابینت تصمیم میگیرد یک پروندهی کاملاً دقیق را «ناقص» تشخیص دهد و آن را با یک پیشنویس اشتباه جایگزین کند. همانطور که در تحلیلهای قبلی ما دربارهی پایداری حافظهی عاملها اشاره کردیم، این نقص باعث میشود عامل حتی هنگام تلاش برای پیشرفت، عقبگرد کند.
akm 0.8.0 این مشکل را از طریق دو فیلد متادیتای کلیدی حل میکند:
- حالت ثبت (captureMode): حافظههای «داغ» (Hot) توسط انسان تأیید شدهاند و فقط خواندنی هستند؛ اما حافظههای «پسزمینه» (Background) توسط عامل (Agent) تولید شدهاند و همچنان در حلقهی بهبود قابل تغییر هستند.
- حالت باور (beliefState): یک سیستم ۵ سطحی شامل: فعال (پیشفرض)، تأییدشده (توسط انسان)، منسوخ، جایگزینشده و متناقض (اثباتشده که غلط است).
بر اساس مستندات این ابزار، اگر یک تکهی حافظه بهطور کامل «داغ» باشد، سیستم فرمان «خروج زودهنگام» صادر میکند. این یعنی مدل زبانی بزرگ (LLM) — مثل کتابخانهداری که میلیاردها صفحه را خوانده و حالا با همان لحن جواب میدهد — اصلاً برای پردازش آن داده فراخوانی نمیشود. این سازوکار هم هزینهی توکنها را کاهش میدهد و هم تضمین میکند هیچ دادهی تأییدشدهای توسط مدل تغییر نکند.

برای توسعهدهندگان، این تغییر به معنای تبدیل حافظه از یک جعبهسیاه احتمالی به یک پایگاه داده مدیریتشده با سطوح دسترسی مشخص است. دیگر لازم نیست نگران باشید که یک اجرای شبانهی تجمیع حافظه، تصمیمات معماری شما را که دستی قفل کردهاید، پاک کند. در واقع، «حقیقت انسانی» اکنون به عنوان یک محدودیت سخت عمل میکند که بر میل مدل به بهینهسازی ارجحیت دارد.
گام بعدی شما
- با استفاده از دستور
akm search "beliefState:contradicted"محتواهای منسوخ و متناقض را در حافظه شناسایی و پاک کنید. - از بخش
akm healthو شمارندهیjudgedNoActionبرای رصد هزینههای محاسباتی ذخیرهشده از طریق خروجهای زودهنگام استفاده کنید. - متادیتای حافظههای حیاتی خود را به حالت Hot تغییر دهید تا از بازنویسی تصادفی جلوگیری شود.
اما اثر این مدیریت دقیق حافظه بر سرعت استنتاج در مقیاس میلیاردها توکن حتی شگفتانگیزتر است — به بررسی ما دربارهی بهینهسازیهای لایهی استنتاج مراجعه کنید.




گفتگو