MODF-SIR: دستیابی به SOTA در استدلال اجتماعی با تنها ۳۰٪ از داده‌ها

اگر تصور می‌کنید برای دستیابی به بالاترین سطح دقت (SOTA) در استدلال‌های اجتماعی، تنها راهکار ممکن افزایش حجم داده‌های آموزشی است، MODF-SIR فرضیات شما را به‌چالش می‌کشد. این چارچوب ثابت می‌کند که دقت در درک پیچیدگی‌های انسانی، بیش از آنکه وابسته به مقیاس باشد، به نحوه مدیریت نویز در لحظه استنتاج بستگی دارد.

درک دینامیک‌های اجتماعی نیازمند شناسایی رویدادهای «دم‌دراز» (Long-tail events) است؛ همان نشانه‌های کمیاب اما حیاتی که معمولاً در فرآیند توکن‌بندی (Tokenization) استاندارد حذف می‌شوند. همان‌طور که در تحلیل‌های پیشین ما درباره‌ی مدل‌های استدلالی اشاره کردیم، چالش اصلی مدل‌های چندوجهی (Multimodal) این است که نمی‌توانند این ظرافت‌ها را از نویزهای محیطی تفکیک کنند و در نتیجه در موقعیت‌های حساس اجتماعی شکست می‌خورند.

طبق گزارش منتشر شده در arXiv در ۱۱ ژوئن ۲۰۲۶، چارچوب MODF-SIR از یک ساختار همکاری میان-عاملی بر پایه یک مدل زبانی کوچک و سبک استفاده می‌کند. جزئیات فنی این پیاده‌سازی شامل موارد زیر است:

تقطیر دانش (Knowledge Distillation): این سازوکار در هر دو مرحله آموزش و استنتاج برای پالایش فرآیند استدلال به‌کار گرفته شده است.
استخراج رویدادهای دم‌دراز: داده‌های حیاتی اجتماعی شناسایی شده و به صورت متن‌های فرمت‌شده و صریح بازنمایی می‌شوند تا توسط رویدادهای رایج (Head Events) پوشانده نشوند.
تطبیق زمان تست (Test-Time Adaptation یا TTA): این مکانیسم که از طریق تطبیق رتبه پایین (Low-Rank Adaptation یا LoRA) تقویت شده، مدل بنیادی را برای استدلال در سطح هر نمونه، در مراحل استخراج، زنجیره تفکر (Chain-of-Thought) و خود-بازتابی بهینه می‌کند.

به نقل از مستندات پروژه، MODF-SIR موفق شده است تنها با استفاده از ۳۰٪ از مجموعه‌داده IntentTrain به عملکرد SOTA دست یابد. این رویکرد، تمرکز صنعت را از مقیاس‌پذیری انبوه داده‌ها به سمت پالایش دقیق در فاز استنتاج (Inference) می‌برد. با تبدیل TTA به یک مسئله تقطیر، ثابت شد که مدل‌های سبک‌وزن می‌توانند بدون نیاز به تنظیم دقیق (Fine-tuning) کامل پارامترها، با رقبای تجاری و سنگین در استدلال‌های اجتماعی رقابت کنند. این دستاورد، مسیری عملی برای استقرار عامل‌های دارای هوش هیجانی بالا روی دستگاه‌های لبه (Edge Devices) با محدودیت محاسباتی می‌گشاید.

گام بعدی شما

بررسی وزن‌های LoRA منتشر شده برای تست روی بنچمارک‌های اجتماعی سفارشی.
تحلیل اثر فرمت‌بندی صریح رویدادهای دم‌دراز در کاهش توهمات مدل‌های چندوجهی.
ارزیابی قابلیت تعمیم خط‌لوله TTA-Distillation برای سایر وظایف استدلالی دقیق.

اما سوال کلیدی این است که آیا این سازوکار برای سایر حوزه‌های استدلالی غیر از هوش اجتماعی نیز پاسخگو است یا خیر؛ تحلیلی در این زمینه را در گزارش‌های آتی بررسی خواهیم کرد.

این گزارش با خط‌لولهٔ خودکار دات‌هوش از منابع معتبر جهانی تدوین و زیر نظر تحریریه منتشر شده است. روش کار ما

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

اخبار روزانه، معرفی ابزارها و مدل‌ها، و آموزشِ کار با هوش مصنوعی؛ همیشه با این پرسش که از ایران چه چیزی کار می‌کند و چه چیزی نه.

تقطیر دانش (Knowledge Distillation): این سازوکار در هر دو مرحله آموزش و استنتاج برای پالایش فرآیند استدلال به‌کار گرفته شده است.
استخراج رویدادهای دم‌دراز: داده‌های حیاتی اجتماعی شناسایی شده و به صورت متن‌های فرمت‌شده و صریح بازنمایی می‌شوند تا توسط رویدادهای رایج (Head Events) پوشانده نشوند.
تطبیق زمان تست (Test-Time Adaptation یا TTA): این مکانیسم که از طریق تطبیق رتبه پایین (Low-Rank Adaptation یا LoRA) تقویت شده، مدل بنیادی را برای استدلال در سطح هر نمونه، در مراحل استخراج، زنجیره تفکر (Chain-of-Thought) و خود-بازتابی بهینه می‌کند.

گام بعدی شما

بررسی وزن‌های LoRA منتشر شده برای تست روی بنچمارک‌های اجتماعی سفارشی.
تحلیل اثر فرمت‌بندی صریح رویدادهای دم‌دراز در کاهش توهمات مدل‌های چندوجهی.
ارزیابی قابلیت تعمیم خط‌لوله TTA-Distillation برای سایر وظایف استدلالی دقیق.

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

MODF-SIR: دستیابی به SOTA در استدلال اجتماعی با تنها ۳۰٪ از داده‌ها

گام بعدی شما

منابع

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

MODF-SIR: دستیابی به SOTA در استدلال اجتماعی با تنها ۳۰٪ از داده‌ها

گام بعدی شما

منابع

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

MODF-SIR: دستیابی به SOTA در استدلال اجتماعی با تنها ۳۰٪ از داده‌ها

گام بعدی شما

منابع

مقاله‌های مرتبطهمه ←

سرمایه‌گذاری سری B: ۳۱۰ میلیون دلار برای شبیه‌سازی فیزیک در Odyssey

هگینگ‌فیس با استاندارد ARD جست‌وجوی ابزارها برای عامل‌ها را خودکار کرد

«پیش‌بینی مسیر از طریق متن»؛ دستاورد جدید مؤسسه AllenAI در فضای سه‌بعدی

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

اصطلاحات این مطلب

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

MODF-SIR: دستیابی به SOTA در استدلال اجتماعی با تنها ۳۰٪ از داده‌ها

گام بعدی شما

منابع

مقاله‌های مرتبطهمه ←

سرمایه‌گذاری سری B: ۳۱۰ میلیون دلار برای شبیه‌سازی فیزیک در Odyssey

هگینگ‌فیس با استاندارد ARD جست‌وجوی ابزارها برای عامل‌ها را خودکار کرد

«پیش‌بینی مسیر از طریق متن»؛ دستاورد جدید مؤسسه AllenAI در فضای سه‌بعدی

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

اصطلاحات این مطلب

راهنمای فارسی هوش مصنوعی — با نگاه به ایران