تصور کنید هوش مصنوعی به جای حدس زدن آماری، دقیقاً همانجایی را ببیند که یک رادیولوژیست خبره میبیند. این دیگر یک رویای علمی نیست، بلکه آغاز عصری است که در آن مدلها «تفکر» انسانی را بازسازی میکنند.
به نقل از گزارش arxiv.org، در ۳۰ آوریل ۲۰۲۶، مجموعهداده CheXthought معرفی شد؛ منبعی جهانی که پنجرهای به سوی فرآیند استدلال بالینی میگشاید. برخلاف مجموعهدادههای پیشین که تنها تصویر را به گزارش نهایی متصل میکردند، این منبع شامل زنجیره تفکر (Chain-of-Thought) و نقشههای توجه بصری ۵۰۱ رادیولوژیست از ۷۱ کشور مختلف است.
مقیاس این دادهها برای پر کردن شکاف میان ادراک خام و شهود بالینی طراحی شده است:
- ۱۰۳،۵۹۲ ردپای استدلالی از زنجیره تفکر.
- ۶،۶۰۹،۰۸۲ یادداشت همگامسازی شده از توجه بصری.
- ۵۰،۳۱۲ عکس رادیولوژی قفسه سینه با خوانشهای متعدد.
بر اساس مستندات این پژوهش، استفاده از دادههای توجه بصری به عنوان یک راهنما در زمان استنتاج (Inference)، باعث بازیابی یافتههای فراموششده و کاهش چشمگیر توهم (Hallucination) مدلها میشود. مدلهای آموزشدیده با CheXthought در طبقهبندی آسیبشناسی و استدلالهای زمانی عملکرد بهتری دارند و در بیان عدم قطعیت، صادقتر عمل میکنند. همچنین، این مدلها میتوانند پیشبینی کنند که در کجا احتمال اختلافنظر میان انسان و ماشین وجود دارد و بدین ترتیب، قابلیت اطمینان مدل را برای پزشک شفاف کنند.
همانطور که در تحلیلهای پیشین ما دربارهی مدلهای چندوجهی (Multimodal) اشاره کردیم، تلاش برای دستیابی به «شهود بالینی» یک روند گسترده در پزشکی است. برای مثال، چارچوب MedSynapse-V نیز با هدف کاهش تلفات کوانتیزاسیون در مدلهای زبان-بینایی، سعی در پیوند ادراک بصری و شهود خبرگان دارد. این تحولات نشاندهنده گذار از شناسایی سادهی الگوها به سمت استدلال «سیستم ۲» (System 2) در مراقبتهای بهداشتی است.
اما این پیشرفت فنی، چالشی حقوقی را پیش میکشد؛ آیا سازمانهای نظارتی این «زنجیرههای تفکر» را به عنوان سند قانونی برای مسئولیتپذیری پزشکی میپذیرند؟
گام بعدی شما
- بررسی مقاله اصلی در arxiv.org برای درک عمیقتر معماری دادهها.
- آزمایش مدلهای چندوجهی جدید با استفاده از تکنیکهای زنجیره تفکر برای کاهش توهمات.
- دنبال کردن بحثهای مربوط به استانداردهای اخلاقی در پذیرش شواهد AI در تشخیصهای پزشکی.




گفتگو