پروتکل Alert-Confirm و افشای نقاط کور هوش مصنوعی در تشخیص بحران‌های روانی

اگر تصور می‌کنید مدل‌های زبانی بزرگ (LLM) می‌توانند در لحظه‌ی وقوع یک بحران روانی هشدار دهند، باید بدانید که دقت آن‌ها در شناسایی این نقطه حیاتی بسیار پایین‌تر از حد تصور است.

طبق گزارش منتشر شده در ۱۰ ژوئن ۲۰۲۶، بنچمارک CRADLE-Dialogue ثابت می‌کند که تشخیص دقیق زمان ظهور یک بحران در جریان گفتگو، برای هوش مصنوعی به‌مراتب دشوارتر از شناسایی کلی وجود ریسک است.

بر اساس مستندات این پژوهش، مجموعه‌داده CRADLE-Dialogue شامل ۶۰۰ گفتگوی تحلیل‌شده توسط متخصصان بالینی است که بر ریسک‌های حیاتی مانند افکار خودکشی، خودزنی و کودک‌آزاری تمرکز دارد. پژوهشگران برای ارزیابی مدل‌ها از پروتکل جدید Alert-Confirm استفاده کردند:

Alert (هشدار): شناسایی سیگنال‌های اولیه که احتمال وقوع بحران را نشان می‌دهد.
Confirm (تأیید): تعیین دقیق همان لحظه (Turn) که بحران به‌طور صریح قابل شناسایی می‌شود.

نتایج آزمایش‌ها تکان‌دهنده است؛ مدل‌ها در فاز «هشدار» به‌شدت شکست می‌خورند و امتیاز Micro F1 آن‌ها تنها در محدوده ۴۰٪ تا ۶۰٪ قرار دارد. برای تقلیل این شکاف، تیم تحقیق یک مدل ۳۲ میلیارد پارامتری و یک کورپوس آموزشی سنتتیک (Synthetic training corpus) منتشر کردند که اگرچه عملکرد بهتری نسبت به مدل‌های متن‌باز داشت، اما همچنان در مواجهه با سیستم‌های تجاری پیشرو، نقاط ضعفی را نشان داد.

همان‌طور که در بحث‌های گذشته‌ی ما درباره‌ی امنیت مدل‌های زبانی در حوزه‌ی سلامت اشاره کردیم، تکیه بر دقت کلی در داده‌های استاتیک، فریبنده‌ترین نقطه در ارزیابی مدل‌هاست.

بیشتر پژوهش‌های پیشین بر تحلیل تک‌مرحله‌ای یا تکه‌تکه‌ی متن‌ها متکی بودند، اما در دنیای واقعی، مداخلات بالینی در یک دیالوگ پویا اتفاق می‌افتند. این تفاوت باعث می‌شود مدل‌ها در ردیابی سیگنال‌های ریسک در طول زمان دچار افت عملکرد شدید شوند.

این تغییر در متدولوژی ارزیابی، پیش‌فرض‌های این حوزه را تغییر می‌دهد؛ هدف دیگر «طبقه‌بندی کلی» نیست، بلکه «تشخیص زمانی دقیق» است. این یعنی رسیدن به دقت بالا در یک دیتاست ایستا، به‌هیچ‌وجه تضمین‌کننده‌ی ایمنی بالینی در زمان واقعی نیست و AI هنوز نمی‌تواند بدون نظارت شدید انسانی، نقش یک «تله‌ی هشدار» (Tripwire) مطمئن را ایفا کند.

گام بعدی شما

بررسی کورپوس آموزشی سنتتیک منتشرشده برای ارزیابی امکان بهبود تشخیص زودهنگام از طریق تنظیم دقیق (Fine-tuning).
پیاده‌سازی پروتکل Alert-Confirm در سیستم‌های تریاژ هوشمند برای شناسایی نقاط کور زمانی.
اجتناب از اتکای کامل به معیارهای Accuracy در مدل‌های حساس به ایمنی.

اما این ضعف در تشخیص زمانی، تنها بخشی از چالش‌های اخلاقی مدل‌های استدلالی در پزشکی است؛ تحلیل ما درباره‌ی توهمات مدل‌های تخصصی را بخوانید.

این گزارش با خط‌لولهٔ خودکار دات‌هوش از منابع معتبر جهانی تدوین و زیر نظر تحریریه منتشر شده است. روش کار ما

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

اخبار روزانه، معرفی ابزارها و مدل‌ها، و آموزشِ کار با هوش مصنوعی؛ همیشه با این پرسش که از ایران چه چیزی کار می‌کند و چه چیزی نه.

Alert (هشدار): شناسایی سیگنال‌های اولیه که احتمال وقوع بحران را نشان می‌دهد.
Confirm (تأیید): تعیین دقیق همان لحظه (Turn) که بحران به‌طور صریح قابل شناسایی می‌شود.

گام بعدی شما

بررسی کورپوس آموزشی سنتتیک منتشرشده برای ارزیابی امکان بهبود تشخیص زودهنگام از طریق تنظیم دقیق (Fine-tuning).
پیاده‌سازی پروتکل Alert-Confirm در سیستم‌های تریاژ هوشمند برای شناسایی نقاط کور زمانی.
اجتناب از اتکای کامل به معیارهای Accuracy در مدل‌های حساس به ایمنی.

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

پروتکل Alert-Confirm و افشای نقاط کور هوش مصنوعی در تشخیص بحران‌های روانی

گام بعدی شما

منابع

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

پروتکل Alert-Confirm و افشای نقاط کور هوش مصنوعی در تشخیص بحران‌های روانی

گام بعدی شما

منابع

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

پروتکل Alert-Confirm و افشای نقاط کور هوش مصنوعی در تشخیص بحران‌های روانی

گام بعدی شما

منابع

مقاله‌های مرتبطهمه ←

«تهدید امنیت ملی»؛ هشدار کشورهای G7 به انحصار مدل‌های آمریکایی

سرمایه‌گذاری سری B: ۳۱۰ میلیون دلار برای شبیه‌سازی فیزیک در Odyssey

هگینگ‌فیس با استاندارد ARD جست‌وجوی ابزارها برای عامل‌ها را خودکار کرد

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

اصطلاحات این مطلب

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

پروتکل Alert-Confirm و افشای نقاط کور هوش مصنوعی در تشخیص بحران‌های روانی

گام بعدی شما

منابع

مقاله‌های مرتبطهمه ←

«تهدید امنیت ملی»؛ هشدار کشورهای G7 به انحصار مدل‌های آمریکایی

سرمایه‌گذاری سری B: ۳۱۰ میلیون دلار برای شبیه‌سازی فیزیک در Odyssey

هگینگ‌فیس با استاندارد ARD جست‌وجوی ابزارها برای عامل‌ها را خودکار کرد

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

اصطلاحات این مطلب

راهنمای فارسی هوش مصنوعی — با نگاه به ایران