چگونه True Memory بدون GPU و دیتابیس برداری، حافظه‌ی AI را متحول کرد؟

تصور کنید عامل هوش مصنوعی شما دقیقاً همان چیزی را که هفته‌ها پیش گفته‌اید به یاد آورد، بدون اینکه آن را در یک خلاصه‌ی ناقص بفشارد. اگر هنوز به دیتابیس‌های برداری برای مدیریت حافظه تکیه می‌کنید، احتمالاً بخشی از مزیت رقابتی خود را از دست داده‌اید.

طبق اعلام پژوهشگران در مقاله‌ای که در ۷ مه ۲۰۲۶ در arxiv.org منتشر شد، معماری True Memory (True Memory) با رد کردن استاندارد صنعتی «استخراج هنگام ورود»، بازی را تغییر داده است. بر اساس مستندات این پژوهش، این سیستم مرکز حافظه‌ی عامل (Agent) را از یک طرح ذخیره‌سازی صلب به یک خط لوله‌ی بازیابی چندمرحله‌ای منتقل کرده است که رویدادها را دقیقاً همان‌طور که رخ داده‌اند، حفظ می‌کند.

از نظر فنی، این سیستم به‌طور شگفت‌آوری سبک است. True Memory تنها به صورت یک فایل SQLite (SQLite) روی پردازنده‌های معمولی (CPU) اجرا می‌شود و نیاز به موارد زیر را به‌طور کامل حذف می‌کند:

دیتابیس‌های خارجی
شاخص‌های برداری (Vector Indices)
ذخیره‌سازهای گرافی (Graph Stores)
شتاب‌دهنده‌های GPU (GPU)

همان‌طور که در تحلیل قبلی ما درباره‌ی محدودیت‌های تولید بازیابی‌افزا (Retrieval-Augmented Generation - RAG) اشاره کردیم، مشکل اصلی همواره در دسترسی به جزئیات دقیق بوده است. True Memory با حذف بردار معنایی (Embedding) برای فشرده‌سازی حافظه، این مشکل را حل کرده است.

به گزارش این مطالعه، نتایج عملکردی خیره‌کننده است. در بنچ‌مارک LoCoMo (با ۱٬۵۴۰ پرسش)، مدل True Memory Pro به دقت ۹۳.۰ درصد رسید. این رقم در مقایسه با رقبای شناخته‌شده، یک جهش بزرگ است:

Mem0: ۶۱.۴ درصد
Supermemory: ۶۵.۴ درصد
Zep: حدود ۷۱ درصد

این سیستم همچنین در بازخوانی‌های طولانی‌مدت، با کسب امتیاز ۸۷.۸ درصد در LongMemEval و ۷۶.۶ درصد در BEAM-1M، رکورد قبلی مدل Hindsight (۷۳.۹ درصد) را شکست.

این رویکرد، روند غالب RAG را که بر استفاده از بردارها برای فشرده‌سازی حافظه متکی است، به چالش می‌کشد. با تبدیل ذخیره‌سازی به یک آرشیو کلمه-به-کلمه (Verbatim) به جای یک شاخص خلاصه‌شده، عامل می‌تواند جزئیات فشرده‌نشده‌ای را بازیابی کند که معمولاً در فرآیندهای سنتی حذف می‌شوند.

اما این بهینه‌سازی تنها بخشی از ماجراست؛ تأثیر این رویکرد بر کاهش هزینه‌های استنتاج (Inference) در لبه را در گزارش بعدی بررسی خواهیم کرد.

گام بعدی شما

اگر در حال توسعه‌ی عامل‌های هوش مصنوعی هستید، معماری‌های مبتنی بر SQLite را برای کاهش هزینه‌های زیرساختی بررسی کنید.
تفاوت بین «خلاصه‌سازی هنگام ورود» و «بازیابی دقیق» را در جریان‌های کاری (Workflows) خود تست کنید.
مقاله کامل True Memory در arxiv را برای درک لایه‌های شش‌گانه‌ی بازیابی مطالعه کنید.

این گزارش با خط‌لولهٔ خودکار دات‌هوش از منابع معتبر جهانی تدوین و زیر نظر تحریریه منتشر شده است. روش کار ما

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

اخبار روزانه، معرفی ابزارها و مدل‌ها، و آموزشِ کار با هوش مصنوعی؛ همیشه با این پرسش که از ایران چه چیزی کار می‌کند و چه چیزی نه.

دیتابیس‌های خارجی
شاخص‌های برداری (Vector Indices)
ذخیره‌سازهای گرافی (Graph Stores)
شتاب‌دهنده‌های GPU (GPU)

Mem0: ۶۱.۴ درصد
Supermemory: ۶۵.۴ درصد
Zep: حدود ۷۱ درصد

گام بعدی شما

اگر در حال توسعه‌ی عامل‌های هوش مصنوعی هستید، معماری‌های مبتنی بر SQLite را برای کاهش هزینه‌های زیرساختی بررسی کنید.
تفاوت بین «خلاصه‌سازی هنگام ورود» و «بازیابی دقیق» را در جریان‌های کاری (Workflows) خود تست کنید.
مقاله کامل True Memory در arxiv را برای درک لایه‌های شش‌گانه‌ی بازیابی مطالعه کنید.

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

چگونه True Memory بدون GPU و دیتابیس برداری، حافظه‌ی AI را متحول کرد؟

گام بعدی شما

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

چگونه True Memory بدون GPU و دیتابیس برداری، حافظه‌ی AI را متحول کرد؟

گام بعدی شما

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

چگونه True Memory بدون GPU و دیتابیس برداری، حافظه‌ی AI را متحول کرد؟

گام بعدی شما

مقاله‌های مرتبطهمه ←

سرمایه‌گذاری سری B: ۳۱۰ میلیون دلار برای شبیه‌سازی فیزیک در Odyssey

هگینگ‌فیس با استاندارد ARD جست‌وجوی ابزارها برای عامل‌ها را خودکار کرد

«پیش‌بینی مسیر از طریق متن»؛ دستاورد جدید مؤسسه AllenAI در فضای سه‌بعدی

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

اصطلاحات این مطلب

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

چگونه True Memory بدون GPU و دیتابیس برداری، حافظه‌ی AI را متحول کرد؟

گام بعدی شما

مقاله‌های مرتبطهمه ←

سرمایه‌گذاری سری B: ۳۱۰ میلیون دلار برای شبیه‌سازی فیزیک در Odyssey

هگینگ‌فیس با استاندارد ARD جست‌وجوی ابزارها برای عامل‌ها را خودکار کرد

«پیش‌بینی مسیر از طریق متن»؛ دستاورد جدید مؤسسه AllenAI در فضای سه‌بعدی

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

اصطلاحات این مطلب

راهنمای فارسی هوش مصنوعی — با نگاه به ایران