اگر عامل هوش مصنوعی شما شهری را که کاربر دو مرحله پیش گفته بود فراموش میکند، مشکل شما فضای پنجره متنی نیست، بلکه معماری حافظه است. اکثر توسعهدهندگان صرفاً تاریخچهٔ گفتگو را در پرامپت میریزند؛ اما این رویکرد خام، مدل را مجبور میکند تا از میان انبوهی از نویز، استدلالهای معکوس انجام دهد.
این شکست در مدلهای کوچکتر بسیار مشهودتر است. به نقل از یک گزارش فنی در dev.to که در ۷ ژوئن ۲۰۲۶ منتشر شد، مدل GLM-4-Flash حتی وقتی تاریخچهٔ گفتگو بهطور کامل در اختیارش بود، نتوانست شهر کاربر را به پرسوجوی مربوط به آبوهوا مرتبط کند؛ در حالی که مدلهایی مثل GPT-4 یا Claude احتمالاً در این کار موفق میشدند.
همانطور که در تحلیلهای پیشین ما دربارهی گردشهای کاری عاملمحور اشاره کردیم، تکیه بر استنتاج مدل برای بازیابی حقایق، ریسک توهم را بالا میبرد. برای حل این مشکل، پیادهسازی یک معماری سهلایه ضروری است:
- حافظه کوتاهمدت: استفاده از LangGraph's MemorySaver برای متصل کردن تاریخچه به یک شناسه (thread_id) خاص جهت جداسازی جلسات.
- حافظه بلندمدت: استخراج حقایق کلیدی توسط مدل زبانی بزرگ (LLM) — مثل کتابخانهداری که میلیاردها صفحه را خوانده و حالا با همان لحن کتابها جواب میدهد — و ذخیره آنها در یک فرمت JSON (مثلاً city: shanghai). این حقایق سپس مستقیماً به دستورات سیستم تزریق میشوند تا مدل مجبور نباشد دادهها را از دل تاریخچه استخراج کند.
- فشردهسازی: برای جلوگیری از افزایش تأخیر در استنتاج (Inference) — که لحظهی تولید جواب و شبیه به خودِ آشپزی است، نه دورهی آموزش آشپز — یک «دریچه ایمنی» تعریف میشود تا وقتی تعداد توکنها (Token) — یا همان تکههای کوچک متن که شبیه برشهای یک کیک طولون هستند — به بازهی ۲۰۰۰ تا ۴۰۰۰ رسید، خلاصهسازی خودکار اجرا شود.

این تغییر، فرض بنیادی در طراحی عاملها را عوض میکند: تزریق صریح دادهها بسیار پایدارتر از استنتاج ضمنی است. با تبدیل گفتگوهای بدون ساختار به حقایق منظم، بار شناختی مدل کاهش مییابد. نتیجه این است که تیمها میتوانند از مدلهای کوچکتر و ارزانتر استفاده کنند، بدون اینکه دقت یا شخصیسازی را فدا کنند.
گام بعدی شما
- ابزار MemorySaver در LangGraph را برای جداسازی جلسات پیاده کنید.
- یک لایه استخراج داده برای تبدیل چتها به فرمت JSON KV طراحی کنید.
- آستانهی توکنهای ورودی را برای فعالسازی خودکار لایه خلاصهسازی تنظیم کنید.
اما تثبیت حافظه تنها گام اول است؛ چالش بعدی، اجرای ابزارهاست. برای بررسی تأثیر استراتژیهای بازبینی (retry) بر پایداری سیستم، تحلیل ما دربارهی اجرای ابزارها را بخوانید.

گفتگو