تصور کنید عامل هوش مصنوعی شما دقیقاً همان چیزی را که هفتهها پیش گفتهاید به یاد آورد، بدون اینکه آن را در یک خلاصهی ناقص بفشارد. اگر هنوز به دیتابیسهای برداری برای مدیریت حافظه تکیه میکنید، احتمالاً بخشی از مزیت رقابتی خود را از دست دادهاید.
طبق اعلام پژوهشگران در مقالهای که در ۷ مه ۲۰۲۶ در arxiv.org منتشر شد، معماری True Memory (True Memory) با رد کردن استاندارد صنعتی «استخراج هنگام ورود»، بازی را تغییر داده است. بر اساس مستندات این پژوهش، این سیستم مرکز حافظهی عامل (Agent) را از یک طرح ذخیرهسازی صلب به یک خط لولهی بازیابی چندمرحلهای منتقل کرده است که رویدادها را دقیقاً همانطور که رخ دادهاند، حفظ میکند.
از نظر فنی، این سیستم بهطور شگفتآوری سبک است. True Memory تنها به صورت یک فایل SQLite (SQLite) روی پردازندههای معمولی (CPU) اجرا میشود و نیاز به موارد زیر را بهطور کامل حذف میکند:
- دیتابیسهای خارجی
- شاخصهای برداری (Vector Indices)
- ذخیرهسازهای گرافی (Graph Stores)
- شتابدهندههای GPU (GPU)
همانطور که در تحلیل قبلی ما دربارهی محدودیتهای تولید بازیابیافزا (Retrieval-Augmented Generation - RAG) اشاره کردیم، مشکل اصلی همواره در دسترسی به جزئیات دقیق بوده است. True Memory با حذف بردار معنایی (Embedding) برای فشردهسازی حافظه، این مشکل را حل کرده است.
به گزارش این مطالعه، نتایج عملکردی خیرهکننده است. در بنچمارک LoCoMo (با ۱٬۵۴۰ پرسش)، مدل True Memory Pro به دقت ۹۳.۰ درصد رسید. این رقم در مقایسه با رقبای شناختهشده، یک جهش بزرگ است:
- Mem0: ۶۱.۴ درصد
- Supermemory: ۶۵.۴ درصد
- Zep: حدود ۷۱ درصد
این سیستم همچنین در بازخوانیهای طولانیمدت، با کسب امتیاز ۸۷.۸ درصد در LongMemEval و ۷۶.۶ درصد در BEAM-1M، رکورد قبلی مدل Hindsight (۷۳.۹ درصد) را شکست.
این رویکرد، روند غالب RAG را که بر استفاده از بردارها برای فشردهسازی حافظه متکی است، به چالش میکشد. با تبدیل ذخیرهسازی به یک آرشیو کلمه-به-کلمه (Verbatim) به جای یک شاخص خلاصهشده، عامل میتواند جزئیات فشردهنشدهای را بازیابی کند که معمولاً در فرآیندهای سنتی حذف میشوند.
اما این بهینهسازی تنها بخشی از ماجراست؛ تأثیر این رویکرد بر کاهش هزینههای استنتاج (Inference) در لبه را در گزارش بعدی بررسی خواهیم کرد.
گام بعدی شما
- اگر در حال توسعهی عاملهای هوش مصنوعی هستید، معماریهای مبتنی بر SQLite را برای کاهش هزینههای زیرساختی بررسی کنید.
- تفاوت بین «خلاصهسازی هنگام ورود» و «بازیابی دقیق» را در جریانهای کاری (Workflows) خود تست کنید.
- مقاله کامل True Memory در arxiv را برای درک لایههای ششگانهی بازیابی مطالعه کنید.




گفتگو