تصور کنید دستیاری دارید که تمام یادداشتهای شما را میشناسد و بهجای گشتن در کل اینترنت، ابتدا سریعترین راه برای یافتن پاسخ را در دفترچههای شخصی شما میجوید. اگر امروز از ابزارهای مدیریت دانش استفاده میکنید، احتمالاً با تضاد «ذخیرهسازی محلی اما جستوجوی ابری» دستوپنجه نرم میکنید.
طبق اعلام توسعهدهندگان، نسخه v0.0.2 که در ۲۵ ژوئن ۲۰۲۶ منتشر شد، معماری «فراخوانی سه لایه» را معرفی کرد تا تلهٔ «جمعآوری بدون استفاده» در عاملهای محلی را حل کند. این سیستم هوش مصنوعی را مجبور میکند پیش از هرگونه مراجعه به وب، ابتدا یادداشتهای شخصی، سپس حافظه برداری و در نهایت گراف دانش را بررسی کند.
بسیاری از ابزارهای فعلی، شما را به APIهای خارجی برای بردار معنایی (Embedding) — که مثل کارت معرفی عددی برای هر واژه است و میگوید این کلمه «همسایهی» چه کلمات دیگری است — وابسته میکنند و حریم خصوصی شما را به خطر میاندازند. همانطور که در تحلیلهای پیشین ما دربارهی امنیت مدلهای محلی اشاره کردیم، حذف این پل ارتباطی با ابری، کل فرآیند بازیابی را به دستگاه کاربر منتقل میکند.
به نقل از راهنمای فنی dev.to، این سامانه برای ایجاد موازنه بین سرعت و عمق، از مکانیزم بازگشتی لایهبندی شده استفاده میکند:
- FTS5 (داغ): نمایهسازی متنی کامل SQLite برای تطابق دقیق کلمات کلیدی در سطح میلیثانیه.
- Hindsight (گرم): استفاده از بردار معنایی برای بازیابی معنایی، که تا ۱۰ هزار گره را برای زمانی که کلمات کلیدی فراموش شدهاند، پشتیبانی میکند.
- gbrain (سرد): یک گراف دانش (Knowledge Graph) که بیش از ۱۱ هزار صفحه را از طریق لینکهای ویکی به هم متصل میکند تا عامل بتواند مسیرهای پیچیده روابط را طی کند.
در زمان پردازش پرسوجو، سیستم یک منحنی تأخیر سختگیرانه را دنبال میکند. اگر لایهی FTS5 پاسخ دهد، فرآیند متوقف میشود؛ در غیر این صورت، نوبت به Hindsight و سپس gbrain میرسد. تنها زمانی که تابع lightweight_recall نتیجهای تهی برگرداند، سیستم AnySearch را برای جستوجوی شبکه فعال میکند.
بر اساس نتایج آزمایشهای واقعی، نرخ کل موفقیت در بازیابی حدود ۷۰ درصد است. لایه FTS5 مسئول ۴۰ درصد، Hindsight مسئول ۲۰ درصد و زنجیرههای رابطهای gbrain ۱۰ درصد باقی موفقیتها را تامین میکنند.
برای تغذیه این لایهها، پلتفرم از یک خط لوله ingest با بیش از ۴۰ ابزار استفاده میکند. این ابزارها شامل Scrapling برای استخراج وب، Whisper ASR و OCR برای ویدیوها و SenseNova برای اسناد PDF و Word هستند. این خط لوله بهجای ذخیره URLهای خام، موجودیتها را استخراج کرده و یادداشتهای ساختاریافتهای برای پر کردن سه لایه حافظه میسازد.
این تغییر، عامل (Agent) را از یک چتبات ساده به یک پایگاه دانش شخصی واقعی تبدیل میکند. با کنترل محلی لایه دانش، تأخیر API و نشت حریم خصوصی حذف میشود. حالا معیار سنجش AI شخصی از «اندازه پنجره متنی» به «کارایی بازیابی محلی» تغییر کرده است.
گام بعدی شما
- بررسی قابلیتهای اشتراک حافظه بین چندین عامل (Cross-Agent Shared Memory).
- مطالعه روی مکانیزم «فراموشی خودکار» بر اساس بازخورد کاربر برای بهینهسازی حافظه.
- تست جایگزینی APIهای ابری با لایههای محلی v0.0.2 برای افزایش سرعت پاسخدهی.
اما داستان سختافزاری این تحول حتی شگفتانگیزتر است — به تحلیل ما دربارهی تراشههای Blackwell مراجعه کنید.




گفتگو