نقص پنهانی در حافظه‌ی مدل‌های زبانی که آن‌ها را رباتیک نگه می‌دارد

باید بپذیرید که شخصیت‌های مجازی شما احتمالاً چیزی جز طوطی‌های یک پایگاه داده نیستند. تصور کنید شخصیتی دیجیتالی دارید که همه چیز را می‌داند، اما نمی‌داند چه زمانی باید از چه خاطره‌ای استفاده کند تا شما را جذب کند یا رابطه‌ای صمیمی بسازد.

به نقل از مقاله‌ای که در ۳۰ آوریل ۲۰۲۶ در arxiv.org منتشر شد، ابزاری به نام StratMem-Bench معرفی شده است که پرده از یک ضعف بنیادین برمی‌دارد: مدل‌های زبانی بزرگ (Large Language Model - LLM) نمی‌توانند از حافظه به صورت استراتژیک استفاده کنند. طبق گزارش این پژوهش، در حالی که مدل‌های فعلی در فیلتر کردن داده‌های نامرتبط موفق هستند، اما در ادغام «خاطرات حمایتی» برای بهبود تعاملات اجتماعی کاملاً ناتوان‌اند.

پژوهشگران برای سنجش این توانایی، مجموعه‌ای از ۶۵۷ مورد را طراحی کردند که در آن شخصیت‌های مجازی باید با سه نوع حافظه مواجه شوند:

خاطرات ضروری: حقایق کلیدی که برای پاسخ به پرسش لازم است.
خاطرات حمایتی: اطلاعاتی که الزامی نیستند اما باعث تقویت بافت اجتماعی و صمیمیت می‌شوند.
خاطرات نامرتبط: نویزهایی که باید نادیده گرفته شوند.

همان‌طور که در تحلیل‌های پیشین ما درباره‌ی عامل‌های هوشمند (AI Agents) اشاره کردیم، چالش اصلی همواره عبور از بازخوانی ساده به سمت استدلال استراتژیک بوده است. در این بنچ‌مارک، عملکرد مدل‌ها با چهار معیار سخت‌گیرانه از جمله «کیفیت ادغام حافظه» و «امتیاز غنی‌سازی پیش‌دستانه» سنجیده شد.

نتایج تکان‌دهنده بود. بر اساس مستندات این تحقیق، مدل‌ها در تفکیک حقایق ضروری از نویزها عالی عمل کردند، اما به محض اینکه باید تصمیم می‌گرفتند چگونه از یک خاطره حمایتی برای «انسانی‌تر کردن» گفتگو استفاده کنند، شکست خوردند. این یعنی هوش مصنوعی زاینده (Generative AI) هنوز نمی‌تواند تعادلی بین دقت factual و غنی‌سازی فعال گفتگو ایجاد کند.

اگر مدل‌ها نتوانند اطلاعات حمایتی را استراتژیک به‌کار بگیرند، شخصیت‌های مجازی فارغ از تعداد پارامترهایشان، همچنان رفتاری رباتیک خواهند داشت. این موضوع نشان می‌دهد که سیستم‌های تولید بازیابی‌افزا (Retrieval-Augmented Generation - RAG) فعلی، حافظه را صرفاً به عنوان یک انبار ایستا می‌بینند، نه ابزاری برای مدیریت رابطه.

اما آیا این نقص مربوط به معماری ترنسفورمر است یا روش‌های آموزش؟ پاسخ این پرسش در تحلیل‌های آینده ما درباره‌ی معماری‌های جایگزین نهفته است.

گام بعدی شما

اگر توسعه‌دهنده هستید، در طراحی پرامپت‌ها برای عامل‌های هوشمند، لایه‌ای برای «هدف اجتماعی» (Social Goal) تعریف کنید تا مدل را مجبور به استفاده از داده‌های غیرضروری اما حمایتی کنید.
مقالات مربوط به «حافظه اپیزودیک» در مدل‌های زبانی را دنبال کنید تا متوجه شوید چگونه می‌توان از بازیابی استاتیک فاصله گرفت.
در تست‌های کاربردی، مدل خود را با داده‌های «حمایتی» به چالش بکشید تا میزان رباتیک بودن پاسخ‌ها را بسنجید.

این گزارش با خط‌لولهٔ خودکار دات‌هوش از منابع معتبر جهانی تدوین و زیر نظر تحریریه منتشر شده است. روش کار ما

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

اخبار روزانه، معرفی ابزارها و مدل‌ها، و آموزشِ کار با هوش مصنوعی؛ همیشه با این پرسش که از ایران چه چیزی کار می‌کند و چه چیزی نه.

خاطرات ضروری: حقایق کلیدی که برای پاسخ به پرسش لازم است.
خاطرات حمایتی: اطلاعاتی که الزامی نیستند اما باعث تقویت بافت اجتماعی و صمیمیت می‌شوند.
خاطرات نامرتبط: نویزهایی که باید نادیده گرفته شوند.

گام بعدی شما

اگر توسعه‌دهنده هستید، در طراحی پرامپت‌ها برای عامل‌های هوشمند، لایه‌ای برای «هدف اجتماعی» (Social Goal) تعریف کنید تا مدل را مجبور به استفاده از داده‌های غیرضروری اما حمایتی کنید.
مقالات مربوط به «حافظه اپیزودیک» در مدل‌های زبانی را دنبال کنید تا متوجه شوید چگونه می‌توان از بازیابی استاتیک فاصله گرفت.
در تست‌های کاربردی، مدل خود را با داده‌های «حمایتی» به چالش بکشید تا میزان رباتیک بودن پاسخ‌ها را بسنجید.

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

نقص پنهانی در حافظه‌ی مدل‌های زبانی که آن‌ها را رباتیک نگه می‌دارد

گام بعدی شما

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

نقص پنهانی در حافظه‌ی مدل‌های زبانی که آن‌ها را رباتیک نگه می‌دارد

گام بعدی شما

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

نقص پنهانی در حافظه‌ی مدل‌های زبانی که آن‌ها را رباتیک نگه می‌دارد

گام بعدی شما

مقاله‌های مرتبطهمه ←

سرمایه‌گذاری سری B: ۳۱۰ میلیون دلار برای شبیه‌سازی فیزیک در Odyssey

هگینگ‌فیس با استاندارد ARD جست‌وجوی ابزارها برای عامل‌ها را خودکار کرد

«پیش‌بینی مسیر از طریق متن»؛ دستاورد جدید مؤسسه AllenAI در فضای سه‌بعدی

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

اصطلاحات این مطلب

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

نقص پنهانی در حافظه‌ی مدل‌های زبانی که آن‌ها را رباتیک نگه می‌دارد

گام بعدی شما

مقاله‌های مرتبطهمه ←

سرمایه‌گذاری سری B: ۳۱۰ میلیون دلار برای شبیه‌سازی فیزیک در Odyssey

هگینگ‌فیس با استاندارد ARD جست‌وجوی ابزارها برای عامل‌ها را خودکار کرد

«پیش‌بینی مسیر از طریق متن»؛ دستاورد جدید مؤسسه AllenAI در فضای سه‌بعدی

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

اصطلاحات این مطلب

راهنمای فارسی هوش مصنوعی — با نگاه به ایران