سقوط خاموش سامانه‌های RAG به‌دلیل داده‌های منقضی‌شده

اگر برای کسب‌وکار خود سیستمی ساخته‌اید که پاسخ‌ها را از اسناد داخلی می‌خواند، احتمالاً کاربران شما پاسخ‌هایی می‌گیرند که سال‌هاست منقضی شده‌اند. این یک شکست خاموش است؛ جایی که مدل با اعتمادبه‌نفس کامل، حقیقتی را روایت می‌کند که دیگر وجود ندارد.

این بحران زمانی آشکار شد که یک توسعه‌دهنده در ۲۸ ژوئن ۲۰۲۶ متوجه شد دستیارهای هوش مصنوعی قادر نیستند گذر زمان میان جلسات مختلف را درک کنند. در واقع، تضاد میان یک زمان‌سنج ایستا (Static Timestamp) و جریان واقعی زمان، باعث می‌شود مدل نتواند تفاوت بین یک واقعیت فعلی و داده‌ای مربوط به سه سال پیش را تشخیص دهد. این مشکلات در مدیریت حافظه و بافتار مدل‌ها، یادآور چالش‌های مدیریت جلسه است که در متد تک‌فایلی Dory برای جلوگیری از اتلاف وقت و فقدان بافتار در چت‌های جدید بررسی شده بود.

این مشکل به‌ویژه در سامانه‌های تولید بازیابی‌افزا (RAG) — که شبیه دانش‌آموزی است که قبل از جواب دادن، اول کتاب درسی را باز می‌کند و از آن نقل می‌آورد — بسیار خطرناک است. در این ساختار، مدل زبانی بزرگ (LLM) — مانند کتابخانه‌داری که میلیاردها صفحه را خوانده و حالا با همان لحن جواب می‌دهد — سندی را از پایگاه‌داده می‌گیرد و آن را یک حقیقت مطلق می‌پندارد. طبق گزارش وب‌سایت dev.to، چون اکثر داده‌های بازیابی‌شده سیگنال زمانی معتبری ندارند، مدل فرض می‌کند همه چیز در زمان حال رخ می‌دهد.

همان‌طور که در تحلیل‌های پیشین ما درباره‌ی توهمات مدل‌های زبانی اشاره کردیم، این «کهنگیِ نامرئی» در حوزه‌های حساس منجر به پاسخ‌های غلط می‌شود:

قیمت‌گذاری: ارائه قیمتی که از فصل گذشته تغییر کرده است.
موجودی: ادعای «موجود بودن» کالا بر اساس یک صفحه کش‌شده (Cached).
انطباق: استناد به سیاست‌هایی که پیش‌تر نسخه‌شان تغییر کرده است.
پرسنل: استفاده از عنوان شغلی مربوط به دو سال پیش.

چنین خطاهای پنهانی که در نگاه اول درست به نظر می‌رسند اما در واقعیت معیوب هستند، مشابه باگ‌های خاموش در کدهای تولیدشده با AI هستند که در پروژه Loupe مورد تحلیل قرار گرفتند.

بر اساس مستندات فنی، افزودن یک ساعت ساده از طریق دستور now() راهکار این مشکل نیست. دانستن اینکه ساعت ۹ شب است به مدل کمک نمی‌کند، مگر اینکه بداند سندی که استناد می‌کند در سال ۲۰۲۳ منقضی شده است. شکاف اصلی، نه در ساعت داخلی مدل، بلکه در تازگیِ تکه‌داده‌های پردازش‌شده است.

راهکار پیشنهادی، الگوبرداری از سیستم GPS است: به‌جای هوشمندتر کردن گیرنده (مدل)، خودِ سیگنال (بستر متن یا Context) باید برچسب زمانی داشته باشد. به عبارت دیگر، هوشمندی باید در سیگنال باشد، نه در گیرنده.

برای اجرای این مدل، توسعه‌دهندگان باید هر بخش از داده‌های بازیابی‌شده را با دو نشانگر مشخص کنند: زمان درست بودن اطلاعات و زمان بازیابی آن‌ها. این متادیتا باید در تمام مراحل خط لوله (Pipeline) باقی بماند و در اولین انتقال حذف نشود.

علاوه بر این، سامانه به یک «مدل زوال» (Decay Model) نیاز دارد. زمان برای هر داده نسبی است؛ مثلاً قیمت سهام ۶ ماه پیش بی‌ارزش است، اما یک اثبات ریاضی ۶ ماه پیش همچنان معتبر است. بنابراین تازگی باید هر بار در لحظه خواندن داده سنجیده شود.

برای کسانی که عامل‌های (Agents) هوش مصنوعی یا ابزارهای دانش داخلی می‌سازند، این تغییر یعنی انتقال بارِ حقیقت از مدل به لایه یکپارچگی داده‌ها. با تبدیل بستر متن به یک سیگنال امضاشده و زمان‌دار، مدل دیگر نیازی ندارد برای پاسخ دقیق، «ساعت را بداند».

این رویکرد، پیش‌فرض بنیادی RAG را از «بازیابی و اعتماد» به «بازیابی، تایید سن و زوال» تغییر می‌دهد. در این حالت، پنجره زمینه (Context Window) — که شبیه میز کاری است که جا برای چند ورق دارد و نه برای کل کتابخانه — از یک سطل استاتیکِ متن به جریانی پویا از شواهد زمان‌دار تبدیل می‌شود.

توسعه‌دهندگان باید اکنون خطوط لوله RAG خود را بازرسی کنند تا ببینند متادیتاها در کجا حذف می‌شوند. باید بررسی کنید که آیا سیستم شما پیش از آنکه مدل داده را ببیند، می‌تواند تفاوت بین حقیقت امروز و سه سال پیش را تشخیص دهد یا خیر.

گام بعدی شما

متادیتای زمانی (Timestamp) را به هر تکه داده (Chunk) در پایگاه‌داده برداری خود اضافه کنید.
یک تابع «سنجش زوال» بر اساس نوع داده (مالی، حقوقی، علمی) تعریف کنید.
بررسی کنید که آیا لایه بازیابی شما، متادیتاها را پیش از ارسال به مدل حذف می‌کند یا خیر.

این تنها آغاز ماجراست؛ اثرات این رویکرد بر کاهش نرخ توهم در عامل‌های پیچیده را در گزارش بعدی بررسی خواهیم کرد.

این گزارش با خط‌لولهٔ خودکار دات‌هوش از منابع معتبر جهانی تدوین و زیر نظر تحریریه منتشر شده است. روش کار ما

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

اخبار روزانه، معرفی ابزارها و مدل‌ها، و آموزشِ کار با هوش مصنوعی؛ همیشه با این پرسش که از ایران چه چیزی کار می‌کند و چه چیزی نه.

قیمت‌گذاری: ارائه قیمتی که از فصل گذشته تغییر کرده است.
موجودی: ادعای «موجود بودن» کالا بر اساس یک صفحه کش‌شده (Cached).
انطباق: استناد به سیاست‌هایی که پیش‌تر نسخه‌شان تغییر کرده است.
پرسنل: استفاده از عنوان شغلی مربوط به دو سال پیش.

گام بعدی شما

متادیتای زمانی (Timestamp) را به هر تکه داده (Chunk) در پایگاه‌داده برداری خود اضافه کنید.
یک تابع «سنجش زوال» بر اساس نوع داده (مالی، حقوقی، علمی) تعریف کنید.
بررسی کنید که آیا لایه بازیابی شما، متادیتاها را پیش از ارسال به مدل حذف می‌کند یا خیر.

این تنها آغاز ماجراست؛ اثرات این رویکرد بر کاهش نرخ توهم در عامل‌های پیچیده را در گزارش بعدی بررسی خواهیم کرد.

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

سقوط خاموش سامانه‌های RAG به‌دلیل داده‌های منقضی‌شده

گام بعدی شما

منابع

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

سقوط خاموش سامانه‌های RAG به‌دلیل داده‌های منقضی‌شده

گام بعدی شما

منابع

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

سقوط خاموش سامانه‌های RAG به‌دلیل داده‌های منقضی‌شده

گام بعدی شما

منابع

مقاله‌های مرتبطهمه ←

هگینگ‌فیس با استاندارد ARD جست‌وجوی ابزارها برای عامل‌ها را خودکار کرد

«پیش‌بینی مسیر از طریق متن»؛ دستاورد جدید مؤسسه AllenAI در فضای سه‌بعدی

Z.ai: برتری GLM-5.2 بر GPT-5.5 در کدنویسی بلندمدت

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

اصطلاحات این مطلب

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

سقوط خاموش سامانه‌های RAG به‌دلیل داده‌های منقضی‌شده

گام بعدی شما

منابع

مقاله‌های مرتبطهمه ←

هگینگ‌فیس با استاندارد ARD جست‌وجوی ابزارها برای عامل‌ها را خودکار کرد

«پیش‌بینی مسیر از طریق متن»؛ دستاورد جدید مؤسسه AllenAI در فضای سه‌بعدی

Z.ai: برتری GLM-5.2 بر GPT-5.5 در کدنویسی بلندمدت

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

اصطلاحات این مطلب

راهنمای فارسی هوش مصنوعی — با نگاه به ایران