اگر با دادههای پراکنده سروکار دارید، میدانید که مدلهای سنتی شبکههای بیزی تقریباً همیشه شکست میخورند. باید بدانید که اکنون راهی برای تبدیل «شهود خبره» یا خروجیهای مدلهای زبانی به راهنماییهای آماری دقیق وجود دارد که در برابر دادههای واقعی منعطف هستند.
یادگیری ساختاری در شبکههای بیزی (Bayesian Network) به دلیل نیاز به مشاهدات مشترک برای امتیازدهی، در دادههای کمحجم با بنبست مواجه میشود. همانطور که در تحلیلهای پیشین ما دربارهی استخراج دانش از مدلهای زبانی اشاره کردیم، چالش اصلی تبدیل متون غیرساختاریافته به محدودیتهای ریاضی است که بدون ایجاد تداخل با واقعیتهای آماری باشد.
طبق گزارشی که در ۱۰ ژوئن ۲۰۲۶ در arxiv.org منتشر شد، متد KG-SoftMAP از گرافهای دانش (Knowledge Graph) به عنوان یک پیشفرض نرم (soft prior) استفاده میکند که توسط دادههای واقعی قابل بازنویسی است. این سیستم با ترکیب امتیاز BDeu و یک پیشفرض بهفرم Logit، هدف MAP را بهینه میکند. نتایج فنی بر اساس مستندات این پژوهش نشان میدهد:
- در تستهای مصنوعی با تراکم داده ۰.۰۵، مدل توانست ساختار جزئی را با امتیاز DF1 بین ۰.۱۴ و ۰.۲۹ بازیابی کند، در حالی که مدلهای پایه نزدیک به صفر بودند.
- با افزایش تراکم داده به ۰.۲ و بیشتر، عملکرد مدل جهش یافت و امتیاز DF1 به بازه ۰.۴۶ تا ۰.۹۶ رسید.
- در دادههای واقعی آموزشی، مدل تنها ۰.۰۳ واحد F1_FAIL با رگرسیون لجستیک فاصله داشت، اما برخلاف آن، احتمالات مشترک کالیبره شده و یالهای سازگار با گراف دانش را ارائه داد.
برای متخصصان، این تغییر پارادایم است: گرافهای دانش دیگر «دیوارهای سخت» نیستند، بلکه «اشارات اطلاعاتی» (informative hints) به شمار میروند. این یعنی میتوان دانش استخراجشده توسط هوش مصنوعی زاینده (Generative AI) را به مدل تزریق کرد بدون اینکه خطاهای احتمالی مدل زبانی، کل ساختار آماری را خراب کند. این مکانیسم ثابت میکند که در حالی که مدلهای تمایزی در پیشبینی خام پیشرو هستند، شبکههای بیزی مولد برای وظایف تشخیصی و استنتاج علی (Causal Inference) از زیرمجموعههای مشاهدهشده برتری دارند.
گام بعدی شما
- بررسی تأثیر کیفیت مدل زبانی مورد استفاده برای استخراج گراف دانش بر نرخ بازیابی نهایی ساختار.
- مقایسه مدلهای مولد بیزی با مدلهای تمایزی در وظایف تشخیص و تحلیل ریشهای.
- مطالعه فرمولبندی کامل ریاضی در مقاله منتشرشده در arxiv.org.
اما این تنها بخشی از پازل است؛ تأثیر این رویکرد بر دقت استنتاج علی در سیستمهای پیچیده را در بررسیهای آینده تحلیل خواهیم کرد.



گفتگو