اگر امروز یک عامل هوش مصنوعی را برای مدیریت تسکهای پیچیده به کار گرفتهاید، احتمالاً در حال تخریب تدریجی مغز آن هستید. یک مطالعه از دانشگاه ایلینوی اربانا-شمپین (UIUC) ثابت میکند که عاملها هنگام سازماندهی حافظه خود، تقریباً نیمی از دقتشان را از دست میدهند.
طبق گزارشی که در ۲۸ ژوئن ۲۰۲۶ منتشر شد، عملکرد مدل GPT-5.4 در محک ARC-AGI پس از تکرار فرآیند تثبیت حافظه، از ۱۰۰٪ به ۵۲.۶٪ سقوط کرد. بسیاری از توسعهدهندگان با حافظه هوش مصنوعی مانند یک دفترچه یادداشت فیزیکی برخورد میکنند و تصور میکنند «مرتب کردن» یادداشتهای قدیمی و ادغام موارد تکراری، بازدهی را بالا میبرد. این چالش با یافتههای اخیر دربارهی تأثیر ابزارهای حافظهی بلندمدت بر دقت مدلها همسو است که نشان میدهد مدیریت نادرست حافظه میتواند منجر به کاهش کیفیت پاسخها شود.
همانطور که در تحلیلهای قبلی ما دربارهی امنیت مدلهای بازمتن دیدیم، شهود انسانی همیشه در دنیای مدلها کار نمیکند. بر اساس مستندات مقاله Useful Memories Become Faulty When Continuously Updated by LLMs، برای یک مدل زبانی بزرگ (LLM) — که شبیه کتابخانهداری است که میلیاردها صفحه را خوانده و حالا با همان لحن کتابها جواب میدهد — یک سوابق نامنظم اما خام، بسیار قابلاعتمادتر از یک نسخه پاکسازیشده و خلاصهشده است.
به نقل از گزارش ژانگ و همکاران (Zhang et al.)، این تخریب کیفیت از طریق سه مکانیزم رخ میدهد:
- سوگیری انتخابی (Selection Bias): مدل دادههایی را که در لحظه مهم به نظر میرسند نگه میدارد و هر چه را بیربط ببیند برای همیشه پاک میکند.
- انحراف بازنویسی (Rewriting Drift): ادغام سوابق باعث میشود اطلاعات از یک «لنز» متغیر عبور کنند و حقایق اصلی تغییر شکل دهند.
- حلقه بازخورد (Feedback Loops): حافظههای فاسد شده بر تصمیمات آینده اثر میگذارند و در چرخه بعدی تثبیت، دادههای فاسد بیشتری تولید میکنند.
پژوهشگران این اثرات را در محیطهای مختلفی از جمله ALFWorld، ScienceWorld، WebShop و AppWorld آزمایش کردند. در تمام این موارد، حافظه «فقط اپیزودیک» (Episodic-only) — که سوابق خام را بدون انتزاع کردن نگه میدارد — عملکردی برابر یا بهتر از روشهای مبتنی بر سازماندهی داشت. در مقابل، راهکارهای نوآورانهای مانند سیستم Lorekeeper با بهرهگیری از چرخههای بازاندیشی تلاش میکنند تا پدیده فراموشی و تخریب حافظه را در عاملها کاهش دهند.
این یافتهها یک چرخش راهبردی در معماریهای عاملمحور (Agentic) ایجاد میکند. با جایگزینی سیستمهای خلاصهساز با مدل «فقط افزودنی» (Append-only)، توسعهدهندگان میتوانند ریسک تخریب داده را حذف کنند. در این حالت، مدل یک شاخص جامع و نسخههای کامل از وضعیتها را نگه میدارد تا ردپای تصمیمات کاملاً قابل ردیابی باشد.
برای کسانی که اکنون عاملهای خود را مدیریت میکنند، حفظ دادههای خام ضروری است. از مدلهای خود نخواهید که برای ذخیرهسازی بلندمدت «جلسه را خلاصه کنند».
گام بعدی شما
- سیستمهای ذخیرهسازی عاملهای خود را به ساختار Append-only تغییر دهید.
- برای حذف دادهها، یک تست سختگیرانه سه مرحلهای (خطا، تکرار یا حریم خصوصی) تعریف کنید.
- متدهای بازیابی داده را جایگزین خلاصهسازیهای خودکار کنید.
اما داستان سختافزاری این تحول حتی شگفتانگیزتر است — به تحلیل ما دربارهی تراشههای Blackwell مراجعه کنید.




گفتگو