باید بدانید که برای دستیابی به دقت بالا در تشخیصهای روانپزشکی، دیگر نیازی به آموزشهای سنگین و هزینهبر نیست. تصور کنید سیستمی که بدون تغییر حتی یک پارامتر در مدل زبانی، بتواند با دقتی فراتر از مدلهای تخصصی، افسردگی را تشخیص دهد.
در ۱۰ ژوئن ۲۰۲۶، پژوهشگران چارچوبی به نام Dep-LLM را معرفی کردند که با بهرهگیری از استدلالهای مبتنی بر شواهد بر روی مدلهای زبانی بزرگ (LLM) منجمد (Frozen)، عملکرد مدلهای نظارتشده (Supervised) را به چالش میکشد. همانطور که در تحلیلهای پیشین ما دربارهی محدودیتهای حافظه GPU در مقیاسهای بزرگ اشاره کردیم، حذف نیاز به بهروزرسانی وزنها، گلوگاههای سختافزاری را به کلی از بین میبرد.
طبق گزارش منتشرشده در arXiv، این سیستم برای شبیهسازی تشخیصهای روانپزشکی از یک فرآیند سه مرحلهای استفاده میکند:
- تحلیل چندعاملی با زنجیره تفکر (Chain-of-Thought): تجزیهی گفتگوها به پنج تم کلینیکی برای مدیریت وابستگیهای متنی طولانی.
- تحلیل و تعدیل سطح اطمینان: استفاده از آنتروپی در سطح توکن برای سنجش قابلیت اعتماد epistemic؛ در این مرحله سیگنالهای مطمئن تقویت و موارد نامطمئن سرکوب میشوند.
- پیشبینی مشارکتی چندعاملی: تلفیق پویا و وزندار این سیگنالها برای رسیدن به تشخیص نهایی.
بر اساس مستندات این پژوهش، مدل بر روی مجموعهدادههای DAIC-WOZ و E-DAIC ارزیابی شده است. نتایج نشان میدهد که Dep-LLM در ۲۱ مدل زبانی بنیادین مختلف و در ۹ معیار کلیدی از جمله دقت (Accuracy) و F1-score، از مدلهای پایه در حالت صفر-شات (Zero-shot) پیشی گرفته است.
این تحول ثابت میکند که استدلال ساختاریافته و تعدیل مبتنی بر اطمینان میتواند جایگزین مجموعههای عظیم دادههای برچسبدار در وظایف حساس پزشکی شود. این یافته، این فرض را که عملکرد تخصصی لزوماً نیازمند آموزش تخصصی است، میشکند و نشان میدهد شکاف استدلالی در مدلها را میتوان با ساختاردهی بهتر شواهد پر کرد، نه لزوماً با افزایش تعداد پارامترها.
گام بعدی شما
- بررسی منطق تعدیل مبتنی بر آنتروپی در گزارش فنی arXiv برای درک نحوه وزندهی به شواهد کلینیکی.
- رصد قابلیت انطباق این روش بر روی اختلالات پیچیدهتر مانند PTSD یا اختلال دوقطبی.
- آزمایش متدهای استدلال چندگانه بر روی مدلهای بازمتن برای کاهش وابستگی به دادههای برچسبدار.
این تنها بخشی از تحول در مدلهای استدلالی است؛ اثر این رویکرد بر کاهش هزینههای استنتاج در تجهیزات پزشکی را در گزارش بعدی بررسی خواهیم کرد.



گفتگو