داده‌های محلی در برابر ابری در سیستم بازیابی v0.0.2

تصور کنید دستیاری دارید که تمام یادداشت‌های شما را می‌شناسد و به‌جای گشتن در کل اینترنت، ابتدا سریع‌ترین راه برای یافتن پاسخ را در دفترچه‌های شخصی شما می‌جوید. اگر امروز از ابزارهای مدیریت دانش استفاده می‌کنید، احتمالاً با تضاد «ذخیره‌سازی محلی اما جست‌وجوی ابری» دست‌وپنجه نرم می‌کنید.

طبق اعلام توسعه‌دهندگان، نسخه v0.0.2 که در ۲۵ ژوئن ۲۰۲۶ منتشر شد، معماری «فراخوانی سه لایه» را معرفی کرد تا تلهٔ «جمع‌آوری بدون استفاده» در عامل‌های محلی را حل کند. این سیستم هوش مصنوعی را مجبور می‌کند پیش از هرگونه مراجعه به وب، ابتدا یادداشت‌های شخصی، سپس حافظه برداری و در نهایت گراف دانش را بررسی کند.

بسیاری از ابزارهای فعلی، شما را به APIهای خارجی برای بردار معنایی (Embedding) — که مثل کارت معرفی عددی برای هر واژه است و می‌گوید این کلمه «همسایه‌ی» چه کلمات دیگری است — وابسته می‌کنند و حریم خصوصی شما را به خطر می‌اندازند. همان‌طور که در تحلیل‌های پیشین ما درباره‌ی امنیت مدل‌های محلی اشاره کردیم، حذف این پل ارتباطی با ابری، کل فرآیند بازیابی را به دستگاه کاربر منتقل می‌کند.

به نقل از راهنمای فنی dev.to، این سامانه برای ایجاد موازنه بین سرعت و عمق، از مکانیزم بازگشتی لایه‌بندی شده استفاده می‌کند:

FTS5 (داغ): نمایه‌سازی متنی کامل SQLite برای تطابق دقیق کلمات کلیدی در سطح میلی‌ثانیه.
Hindsight (گرم): استفاده از بردار معنایی برای بازیابی معنایی، که تا ۱۰ هزار گره را برای زمانی که کلمات کلیدی فراموش شده‌اند، پشتیبانی می‌کند.
gbrain (سرد): یک گراف دانش (Knowledge Graph) که بیش از ۱۱ هزار صفحه را از طریق لینک‌های ویکی به هم متصل می‌کند تا عامل بتواند مسیرهای پیچیده روابط را طی کند.

در زمان پردازش پرس‌وجو، سیستم یک منحنی تأخیر سخت‌گیرانه را دنبال می‌کند. اگر لایه‌ی FTS5 پاسخ دهد، فرآیند متوقف می‌شود؛ در غیر این صورت، نوبت به Hindsight و سپس gbrain می‌رسد. تنها زمانی که تابع lightweight_recall نتیجه‌ای تهی برگرداند، سیستم AnySearch را برای جست‌وجوی شبکه فعال می‌کند.

بر اساس نتایج آزمایش‌های واقعی، نرخ کل موفقیت در بازیابی حدود ۷۰ درصد است. لایه FTS5 مسئول ۴۰ درصد، Hindsight مسئول ۲۰ درصد و زنجیره‌های رابطه‌ای gbrain ۱۰ درصد باقی موفقیت‌ها را تامین می‌کنند.

برای تغذیه این لایه‌ها، پلتفرم از یک خط لوله ingest با بیش از ۴۰ ابزار استفاده می‌کند. این ابزارها شامل Scrapling برای استخراج وب، Whisper ASR و OCR برای ویدیوها و SenseNova برای اسناد PDF و Word هستند. این خط لوله به‌جای ذخیره URLهای خام، موجودیت‌ها را استخراج کرده و یادداشت‌های ساختاریافته‌ای برای پر کردن سه لایه حافظه می‌سازد.

این تغییر، عامل (Agent) را از یک چت‌بات ساده به یک پایگاه دانش شخصی واقعی تبدیل می‌کند. با کنترل محلی لایه دانش، تأخیر API و نشت حریم خصوصی حذف می‌شود. حالا معیار سنجش AI شخصی از «اندازه پنجره متنی» به «کارایی بازیابی محلی» تغییر کرده است.

گام بعدی شما

بررسی قابلیت‌های اشتراک حافظه بین چندین عامل (Cross-Agent Shared Memory).
مطالعه روی مکانیزم «فراموشی خودکار» بر اساس بازخورد کاربر برای بهینه‌سازی حافظه.
تست جایگزینی APIهای ابری با لایه‌های محلی v0.0.2 برای افزایش سرعت پاسخ‌دهی.

اما داستان سخت‌افزاری این تحول حتی شگفت‌انگیزتر است — به تحلیل ما درباره‌ی تراشه‌های Blackwell مراجعه کنید.

این گزارش با خط‌لولهٔ خودکار دات‌هوش از منابع معتبر جهانی تدوین و زیر نظر تحریریه منتشر شده است. روش کار ما

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

اخبار روزانه، معرفی ابزارها و مدل‌ها، و آموزشِ کار با هوش مصنوعی؛ همیشه با این پرسش که از ایران چه چیزی کار می‌کند و چه چیزی نه.

FTS5 (داغ): نمایه‌سازی متنی کامل SQLite برای تطابق دقیق کلمات کلیدی در سطح میلی‌ثانیه.
Hindsight (گرم): استفاده از بردار معنایی برای بازیابی معنایی، که تا ۱۰ هزار گره را برای زمانی که کلمات کلیدی فراموش شده‌اند، پشتیبانی می‌کند.
gbrain (سرد): یک گراف دانش (Knowledge Graph) که بیش از ۱۱ هزار صفحه را از طریق لینک‌های ویکی به هم متصل می‌کند تا عامل بتواند مسیرهای پیچیده روابط را طی کند.

گام بعدی شما

بررسی قابلیت‌های اشتراک حافظه بین چندین عامل (Cross-Agent Shared Memory).
مطالعه روی مکانیزم «فراموشی خودکار» بر اساس بازخورد کاربر برای بهینه‌سازی حافظه.
تست جایگزینی APIهای ابری با لایه‌های محلی v0.0.2 برای افزایش سرعت پاسخ‌دهی.

اما داستان سخت‌افزاری این تحول حتی شگفت‌انگیزتر است — به تحلیل ما درباره‌ی تراشه‌های Blackwell مراجعه کنید.

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

داده‌های محلی در برابر ابری در سیستم بازیابی v0.0.2

گام بعدی شما

منابع

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

داده‌های محلی در برابر ابری در سیستم بازیابی v0.0.2

گام بعدی شما

منابع

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

داده‌های محلی در برابر ابری در سیستم بازیابی v0.0.2

گام بعدی شما

منابع

مقاله‌های مرتبطهمه ←

هگینگ‌فیس با استاندارد ARD جست‌وجوی ابزارها برای عامل‌ها را خودکار کرد

«پیش‌بینی مسیر از طریق متن»؛ دستاورد جدید مؤسسه AllenAI در فضای سه‌بعدی

Z.ai: برتری GLM-5.2 بر GPT-5.5 در کدنویسی بلندمدت

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

اصطلاحات این مطلب

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

داده‌های محلی در برابر ابری در سیستم بازیابی v0.0.2

گام بعدی شما

منابع

مقاله‌های مرتبطهمه ←

هگینگ‌فیس با استاندارد ARD جست‌وجوی ابزارها برای عامل‌ها را خودکار کرد

«پیش‌بینی مسیر از طریق متن»؛ دستاورد جدید مؤسسه AllenAI در فضای سه‌بعدی

Z.ai: برتری GLM-5.2 بر GPT-5.5 در کدنویسی بلندمدت

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

اصطلاحات این مطلب

راهنمای فارسی هوش مصنوعی — با نگاه به ایران