آیا میتوانید به ابزاری اعتماد کنید که ادعا میکند یک فایل صوتی جعل شده است، اما نمیتواند دلیل فنی این ادعا را توضیح دهد؟ اگر از سیستمهای فعلی تشخیص جعل عمیق استفاده میکنید، احتمالاً با دو مشکل مواجه شدهاید: یا خروجیها بیش از حد فنی هستند و کاربر عادی آنها را نمیفهمد، یا توضیحات چنان کلی و مبهماند که هیچ ارزش اثباتی ندارند.
این شکاف به این دلیل است که روشهای سنتی هوش مصنوعی قابلتوضیح (Explainable AI یا XAI) برای انسانها غیرقابلفهم هستند و در مقابل، مدلهای زبانی بزرگ (LLM) به دلیل نبود نظارت تخصصی، شروع به تولید توهم میکنند. این چالش توهمات در مدلهای زبانی، پیشتر در بررسیهای مربوط به PhantomBench مورد تحلیل قرار گرفته که نرخ توهمات بسیار بالای این مدلها را در مواجهه با مفاهیم ناموجود نشان داد. در ۱۵ ژوئن ۲۰۲۶، تیمی به سرپرستی Yupei Li روشی را معرفی کرد که این دو دنیا را به هم متصل میکند. آنها چارچوبی چندوجهی ساختهاند که خروجیهای مدل زبانی را به شواهد واقعی XAI گره میزند.
همانطور که در تحلیلهای قبلی ما دربارهی امنیت مدلهای بازمتن اشاره کردیم، مشکل اصلی در لایهی استدلال است، نه لایهی تشخیص. بر اساس مطالعهای که در arxiv.org منتشر شد، این سیستم از مجموعهدادهی PartialSpoof برای تولید توضیحات مبنیسازی شده (grounded) استفاده میکند. این رویکرد در حالی ارائه میشود که تداخل دادهای در بسیاری از مجموعهدادههای تشخیص جعل باعث شده بود دقت مدلهای تشخیص صوتی به طور کاذب متورم شود. سازوکار فنی این روش شامل موارد زیر است:
- ادغام مستقیم سیگنالهای انتسابی XAI در مدلهای زبانی چندوجهی (Multimodal LLMs).
- استفاده از رویکرد بدون نیاز به آموزش برای حذف وابستگی به مجموعهدادههای برچسبدار عظیم. این متد در تضاد با استراتژیهایی مانند RAT است که در ارزیابیهای ASVspoof 5 برای کاهش نرخ خطا به شدت بر آموزش متکی بودند.
- تأیید صحت خروجیها از طریق ارزیابی انسانی و بررسی میزان وفاداری (Faithfulness) مدل به شواهد.
به نقل از مستندات این پژوهش، محققان با ارائه شواهد اکتشافی (Heuristic) به مدل، توانستند دقت داخلی را بیش از ۴۵٪ نسبت به روشهای بدون مبنیسازی افزایش دهند. این نتیجه، فرضیه قدیمی مبنی بر نیاز به بازآموزی گسترده برای رسیدن به توضیحات دقیق را میشکند؛ در واقع، ارائه «شواهد» درست در لحظهی استنتاج (Inference) کفایت میکند.
گام بعدی شما
- بررسی مقالات مربوط به PartialSpoof برای درک معیارهای ارزیابی جعل صوتی.
- پیادهسازی لایههای XAI در سیستمهای نظارتی برای کاهش وابستگی به توهمات مدل.
- رصد توسعهی سیستمهای تشخیص آنی که از این روش مبنیسازی استفاده میکنند.
اما چالش بعدی این است که آیا این توضیحات میتوانند برای اصلاح خودکار مدلهای تشخیص به کار روند یا خیر؛ تحلیل ما دربارهی حلقههای بازخورد مدلها را دنبال کنید.




گفتگو