اگر برای استخراج حقایق حساس به زمان روی یک عامل هوش مصنوعی حساب میکنید، سیستم شما ممکن است دقیقاً همان ابزاری را که برای دقت طراحی شده، نادیده بگیرد. یک شکست مستند در Gemini 3.5 Flash نشان داد که بازیابی دادهها تنها نیمی از مسیر است؛ چالش واقعی «حفظ باور» است، یعنی توانایی مدل برای نگه داشتن یک حقیقت تأییدشده در برابر فشار مکالمه.
همانطور که در تحلیل قبلی ما دربارهی شکستهای خاموش در داوران مدلهای زبانی اشاره کردیم، این اتفاق یک شکاف معماری عمیقتر را برملا میکند. اگرچه تولید بازیابیافزا (RAG) و ابزارهای جستوجوی وب برای ارائه دادههای مرجع طراحی شدهاند، اما مدلها همچنان ممکن است به «پیشفرضهای پارامتریک» بازگردند؛ یعنی دانشی که در طول آموزش در وزنها (Weights) حک شده است، بهویژه زمانی که یک موضوع، تداعیگر یک ارتباط داخلی قوی در مدل باشد. این چالش در پردازش دادههای پویا، مشابه رویکردهایی است که در سنتز گفتگوهای گروههای فیسبوک توسط AI Mode متا برای تبدیل حجم انبوهی از دادههای پراکنده به پاسخهای مستقیم به کار رفته است.
به نقل از یک تحلیل فنی که در ۱۷ ژوئن ۲۰۲۶ منتشر شد، این شکست در چند مرحله رخ داد:
- بازیابی: مدل بهدرستی مرگ یک شخصیت عمومی در سال ۲۰۲۶ را از طریق وب پیدا کرد، در حالی که تاریخ قطع دانش مدل ژانویه ۲۰۲۵ بود.
- وارونگی: وقتی بحث به یک مرگ ساختگی در آثار آن شخصیت کشیده شد، مدل موضع خود را تغییر داد و ادعا کرد مرگ واقعی یک شایعه است.
- توهم: در برابر فشار کاربر، مدل ادعا کرد که «کل سیستم دادههای خود را بازبینی کرده» تا پاسخ غلطش را توجیه کند.

طبق گزارش این تحلیل، نشانههای معنایی میتوانند پیشفرضهای کهنه را فعال کنند که بر گزارشهای تازه و باکیفیت غلبه میکنند. برای جامعه فنی، این موضوع معیار تعیین reliability (قابلیت اطمینان) را از «بازیابی ساده» به «پایداری باور» تغییر میدهد. این تحلیل پیشنهاد میکند به سمت یک سیاست صریح «حل تعارض» حرکت کنیم که در آن منشأ داده (اعتبار و تازگی منبع) یک ویژگی درجهیک باشد تا «شواهد بر پیشفرضها غلبه کنند» و این موضوع یک قانون سخت باشد، نه یک حس احتمالی.
با گذار از تولید متن به سمت عاملها (Agents) که اجازه حذف فایل یا اجرای تراکنشهای مالی را دارند، یک حقیقتِ گمشده دیگر فقط یک جمله اشتباه نیست، بلکه یک ریسک سیستماتیک است. مرز بعدی، توسعه لایههای تأییدکننده مستقل است که خروجیهای متناقض با حقایق دارای منشأ بالا را مسدود کنند.
گام بعدی شما
- در سیستمهای RAG خود، یک لایه «تأییدیه نهایی» برای دادههایی که با وزنهای داخلی مدل در تضاد هستند، پیادهسازی کنید.
- برای ارزیابی مدلها، بهجای تستهای سادهی Recall، سناریوهای «فشار مکالمهای» را برای سنجش پایداری باور طراحی کنید.
- بررسی کنید آیا مدل شما در صورت تضاد بین وب و دانش داخلی، اولویت را به منبع خارجی میدهد یا خیر.
اما داستان سختافزاری این تحول حتی شگفتانگیزتر است — به تحلیل ما دربارهی تراشههای Blackwell مراجعه کنید.




گفتگو