تصور کنید پزشک شما بر اساس دستورالعملی تصمیم بگیرد که روی یک دروغ بنا شده است. طبق گزارش مجله لنسِت (The Lancet)، ارجاعات جعلی در مقالات زیستپزشکی از سال ۲۰۲۳ تاکنون بیش از ۱۲ برابر افزایش یافته است.
این بحران درست زمانی رخ میدهد که مدلهای زبانی بزرگ (LLM) — مثل کتابخانهداری که میلیاردها صفحه را خوانده و حالا با همان لحن کتابها جواب میدهد — به ابزاری همگانی در نگارش دانشگاهی تبدیل شدهاند. همانطور که در تحلیلهای پیشین ما دربارهی توهمات مدلهای زاینده اشاره کردیم، سرعت تولید متن در این مدلها با دقت علمی در تضاد است. این روند بخشی از یک بحران گستردهتر در فضای آکادمیک است؛ جایی که تولید انبوه مقالات بیکیفیت یا «سلاپ» علمی در حال بلعیدن استانداردهای پژوهشی است.
ماکسیم توپاز (Maxim Topaz) از دانشگاه کلمبیا و تیمش، ۲.۴۷ میلیون مقاله از PubMed Central را بین ژانویه ۲۰۲۳ تا فوریه ۲۰۲۶ بررسی کردند. بر اساس مستندات این پژوهش، ۴۰۴۶ ارجاع جعلی در ۲۸۱۰ مقاله یافت شد.
یافتههای کلیدی این مطالعه عبارتند از:
- نرخ جعل در سال ۲۰۲۳: ۴ مورد در هر ۱۰ هزار مقاله.
- نرخ جعل در اوایل ۲۰۲۶: ۵۶.۹ مورد در هر ۱۰ هزار مقاله.
- مقالات مروری (Review Articles) ۵۷٪ بیشتر از سایر مقالات دچار جعل بودند.

این ارجاعات جعلی بهدلیل استفاده از نام پژوهشگران واقعی و تاریخهای محتمل، بهسختی شناسایی میشوند. در یک مقاله ارولوژی، ۱۸ مورد از ۳۰ ارجاع کاملاً جعلی بودند، در حالی که موضوع آنها دقیقاً با متن مقاله همخوانی داشت. این چالش در شناسایی هویت و اعتبار نویسندگان، تنها مختص مقالات پزشکی نیست و در تحلیلهای گسترده بر روی مقالات کنفرانس ICLR نیز به شکافهای عمیق در سیستم اعتبارسنجی نویسندگان اشاره شده است.
برای مدیران سلامت و پزشکان، این یک ریسک سیستمی است. وقتی مقالات مروری — که پایه و اساس دستورالعملهای بالینی هستند — حاوی شواهد جعلی باشند، کل زنجیره تصمیمگیری پزشکی میشکند. اینکه ۹۸.۴٪ ناشران به این گزارش بیتوجه بودهاند، نشان میدهد زیرساختهای علمی از سرعت هوش مصنوعی زاینده (Generative AI) عقب ماندهاند.
گام بعدی شما
- ابزارهایی مثل CiteAudit را برای خودکارسازی تأیید منابع دنبال کنید.
- بررسی کنید آیا مجلات معتبر پزشکی غربالگریهای بازگشتی برای پاکسازی توهم (Hallucination)ها اجرا میکنند یا خیر.
- در هر مقاله علمی، ارجاعات کلیدی را بهصورت دستی بازبینی کنید.
اما این توهمات فقط در متن نیستند؛ تأثیر این روند بر دادههای آماری مقالات را در گزارش بعدی بررسی خواهیم کرد.
گفتگو