تصور کنید عاملی داشته باشید که از اشتباهاتش درس میگیرد، اما برای این کار حتی به یک بهروزرسانی در وزنهای مدل نیاز ندارد. این یعنی پایان دوران وابستگی مطلق به بازآموزی برای ارتقای مهارتهای یک مدل.
در ۱۲ مه ۲۰۲۶، پژوهشگران چارچوبی به نام MAGE را معرفی کردند که دانش خودآگاه مدل را در یک گراف دانش تکاملی خارجی میکند تا محدودیتهای مدلهای ایستا (Static Backbones) را دور بزند. صنعت اکنون به سمت عاملهای «خود-تکاملیافته» حرکت میکند که میتوانند در زمان استقرار (Deployment) سازگار شوند. همانطور که در تحلیلهای پیشین ما دربارهی حافظههای غیرپارامتریک اشاره کردیم، رویکردهای قبلی مانند HAGE با حافظه وزندار یا Evolving-RL تلاش کردند تا یادگیری را از تجربه جدا کنند، اما MAGE این مسیر را با ساختاری نظاممندتر پیش میبرد.
به نقل از مقاله منتشرشده در arxiv.org، سیستم MAGE (تکامل هدایتشده با گراف چند-عاملی) از یک معماری چهار-زیرگرافی بهره میبرد:
- زیرگراف تجربه: ذخیرهسازی اصلاحات مربوط به شکستها (توسط مدل معلم) و ردپاهای استدلالی موفق (توسط مدل یادگیرنده).
- باندیتهای مسیریابی: مدیریت سطح وظایف و مهارتها که بر اساس یک جریان پاداش مشترک بهروزرسانی میشوند.
- زیرساخت بازیابی: پشتیبانی از رشد حافظه بهصورت «فقط-افزودنی» (Append-only) و بازیابی فیلترشده بر اساس نوع تکلیف.
این سیستم در ۹ بنچمارک مختلف، از جمله استدلالهای عددی مالی و یک بازی بقای جهان-باز، مورد آزمایش قرار گرفت و طبق مستندات، بهطور قابلتوجهی از مدلهای پایه که تنها با مهندسی پرامپت (Prompt Engineering) هدایت میشدند، پیشی گرفت.
این دستاورد، پارادایم را از «تنظیم دقیق برای کسب مهارت» به «مدیریت یک زیرساخت دانشی» تغییر میدهد. با جداسازی فرآیند یادگیری (گراف) از فرآیند اجرا (مدل منجمد)، توسعهدهندگان میتوانند پایداری را تضمین کرده و از فراموشی فاجعهبار (Catastrophic Forgetting) جلوگیری کنند. برای جامعه فنی، این بدان معناست که هوش یک عامل (Agent) بهزودی بیشتر در ساختار حافظه خارجیاش نهفته خواهد بود تا در وزنهای عصبیاش.
گام بعدی شما
- بررسی تحلیل ساختاری رشد حافظه در مقاله اصلی MAGE در arxiv.org برای درک نحوه مدیریت توکنها.
- دنبال کردن ادغام گرافهای تکاملی در عاملهای ناوبری وب (Web Navigation Agents) در ماههای آینده.
- آزمایش رویکردهای حافظه خارجی در پروژههای عاملمحور برای کاهش هزینههای بازآموزی.
اما تأثیر این رویکرد بر کاهش هزینههای استنتاج (Inference) در مقیاس صنعتی، موضوعی است که در گزارش بعدی به آن میپردازیم.




گفتگو