GPT-4o LATENCY240msCLAUDE OPUS 4.7ONLINENVDA+1.2%MISTRAL LARGE 2STREAMINGOPENAI API99.97% UPTIMEGROQ MIXTRAL580 tok/sGEMINI 2.5 PROCTX 2MANTHROPIC STATUSOKTSMC+0.4%PERPLEXITYINDEXINGGPT-4o LATENCY240msCLAUDE OPUS 4.7ONLINENVDA+1.2%MISTRAL LARGE 2STREAMINGOPENAI API99.97% UPTIMEGROQ MIXTRAL580 tok/sGEMINI 2.5 PROCTX 2MANTHROPIC STATUSOKTSMC+0.4%PERPLEXITYINDEXING
پرش به محتوای مقاله

درون معماری «مغز شرکتی» Hyper برای حل مشکل فراموشی عامل‌های هوش مصنوعی

·۱۳ خرداد ۱۴۰۵۴ دقیقه مطالعه
تأییدنشده · منبع منفرد
اشتراک‌گذاری
واقعاً چه چیز جدید است؟

نوآوری اصلی در تفکیک «اپیزودها» از «حقایق» است که اجازه می‌دهد داده‌های جدید به‌طور فعال داده‌های قدیمی را منسوخ کنند؛ برخلاف RAGهای سنتی که فقط نتایج مشابه را تجمیع می‌کنند و با تضاد داده‌ها دست‌به‌گریبان هستند.

اگر مؤسس استارتاپی هستید که عامل‌های هوش مصنوعی (Agent) — شبیه کارمندی مجازی که دستورات شما را می‌گیرد و ابزارهای مختلف را مدیریت می‌کند — مدام لحن برند شما را فراموش می‌کنند یا تغییرات سریع پروژه را نادیده می‌گیرند، یک قطعه گم‌شده در معماری شما وجود دارد.

بیشتر عامل‌ها امروز به حافظه کوتاه‌مدت یا تولید بازیابی‌افزا (RAG) — مثل دانش‌آموزی که قبل از جواب دادن، اول کتاب درسی را باز می‌کند و از آن نقل می‌آورد — تکیه می‌کنند. اما مشکل اینجاست که وقتی زمان‌بندی‌ها تغییر می‌کند، این سیستم‌ها شکست می‌خورند. تصور کنید عامل شما اصرار دارد ضرب‌الاجل پروژه جمعه است، در حالی که شما از هفته پیش آن را به دوشنبه منتقل کرده‌اید.

همان‌طور که در تحلیل‌های پیشین ما درباره‌ی محدودیت‌های پنجره متنی اشاره کردیم، مدل‌ها در مدیریت تضادهای زمانی ضعیف هستند. Hyper برای حل اینC مشکل، یک لایه‌ی حافظه مشترک برای ابزارهایی مثل Claude Code، Cursor و Codex ایجاد می‌کند.

به نقل از گزارش انتشار این پلتفرم در ۳ ژوئن ۲۰۲۶ در Hacker News، این سیستم از دو روش مجزا برای حفظ تازگی داده‌ها استفاده می‌کند:

  • اپیزودها (Episodes): ذخیره‌ی مواد خام منابع به عنوان حقیقت مطلق.
  • حقایق (Facts): استخراج معنا با استفاده از رکورد‌های «فاعل-گزاره-مفعول».

طبق مستندات فنی این پلتفرم، حقایق از طریق یال‌های تایپ‌شده به هم متصل می‌شوند تا مشخص شود کدام اثر، جایگزین اثر قدیمی‌تر شده است. همچنین برای بازیابی داده‌ها، ترکیبی از بردار معنایی (Embedding) — مثل کارت معرفی عددی برای هر واژه که همسایگی آن با کلمات دیگر را نشان می‌دهد — و جست‌وجوی متنی Postgres استفاده می‌شود.

این رویکرد، گلوگاه عامل‌ها را از «هوش کلی» به «تازگی داده‌ها» منتقل می‌کند. برای صاحبان کسب‌وکار، این یعنی حذف «مالیات پرامپت»؛ یعنی دیگر لازم نیست در هر جلسه، مدارک و فایل‌ها را دوباره برای هوش مصنوعی آپلود کنید.

گام بعدی شما

  • اگر از ابزارهای کدنویسی AI استفاده می‌کنید، بررسی کنید که آیا حافظه‌ی آن‌ها ایزوله است یا یک سیستم واحد دارند.
  • از دوره‌ی آزمایش رایگان ۳ روزه‌ی Hyper برای تست انتقال دانش از Slack به عامل‌های خود استفاده کنید.
  • معماری حافظه را جایگزین افزایش حجم پرامپت‌ها کنید.

اما داستان سخت‌افزاری این تحول حتی شگفت‌انگیزتر است؛ به تحلیل ما درباره‌ی تراشه‌های Blackwell برای کاهش هزینه‌ی استنتاج حافظه مراجعه کنید.

چرا این موضوع مهم است؟

این رویکرد با تکیه بر اعتبار معماری گراف‌های دانش، وابستگی عامل‌ها به حافظه کوتاه‌مدت را از بین می‌برد. در نتیجه، خطای عملیاتی در پروژه‌های پیچیده شرکتی که تغییرات سریع دارند، به‌شدت کاهش می‌یابد.

تأثیر برای ایران

به‌دلیل محدودیت‌های API و تحریم‌ها، دسترسی مستقیم به این ابزار برای تیم‌های ایرانی دشوار است، اما معماری آن الگویی ارزشمند برای توسعه سیستم‌های حافظه محلی در زبان فارسی است.

·نگاه ما
تحریریه دات‌هوش

تحلیل ما این است که در دنیای عامل‌محور، «تازگی داده‌ها» (Data Freshness) جایگزین «قدرت استدلال» به عنوان مزیت رقابتی شده است. Hyper ثابت می‌کند که برای بهره‌وری واقعی، مدل‌ها به جای پنجره‌های متنی بزرگ‌تر، به سیستم‌های مدیریت حافظه فعال نیاز دارند که بتوانند اطلاعات منسوخ را حذف کنند.

منابع

گفتگو

شماره ۰۵۳پنج‌شنبه‌های هوش‌محور

بسته‌ی هفتگی دات‌هوش

۵ خبر، ۲ ابزار، ۱ پرامپت — به‌علاوه ۳ بخش جدید. بدون هیاهو، هر پنج‌شنبه صبح.

خبر کلیدی
ابزار کاربردی
پرامپت حرفه‌ای
تحلیل پژوهش
به‌زودی
زاویه‌ی ایرانی
به‌زودی
تمرین این هفته
به‌زودی
۰۰:۰۰تا شماره بعدیهفته‌ی ۵۳ بدون وقفه