چگونه RecToM با بازسازی بازگشتی دیدگاه‌ها به دقت ۱۰۰٪ در Hi-ToM رسید؟

اگر تصور می‌کنید حل چالش‌های استدلال اجتماعی تنها با افزایش مقیاس مدل‌ها ممکن است، در اشتباهید. شکاف واقعی در درک «باورهای تودرتو» است؛ جایی که هوش مصنوعی باید تشخیص دهد «من فکر می‌کنم که تو فکر می‌کنی من چه می‌دانم».

طبق یک تحلیل فنی که در ۱۱ ژوئن ۲۰۲۶ منتشر شد، مدل‌های GPT-5.4 و Qwen3.5 توانسته‌اند با دستیابی به دقت ۱۰۰٪ در بنچمارک Hi-ToM، یکی از دشوارترین مسائل استدلال اجتماعی را حل کنند. این موفقیت مدیون چارچوبی به نام RecToM است که در زمان استنتاج (Inference) اجرا می‌شود.

تئوری ذهن (Theory of Mind) توانایی شناختی برای استنتاج باورها و حالات ذهنی دیگران بر اساس اطلاعات ناقص یا نامتقارن است. همان‌طور که در تحلیل قبلی ما درباره‌ی محدودیت‌های استدلال در مدل‌های زبانی اشاره کردیم، تلاش‌های پیشین برای بهبود این قابلیت بر فیلتر کردن رویدادهای مشاهده‌شده یا ایجاد زنجیره‌های باور زمانی متکی بودند؛ اما این روش‌ها در مدل‌سازی صریح باورهای تودرتو شکست می‌خوردند.

به نقل از مستندات RecToM، این چارچوب با پیاده‌سازی «بازسازی بازگشتی دیدگاه‌ها» عمل می‌کند. به جای اینکه پرسش را به عنوان یک پرامپت (Prompt) واحد در نظر بگیرد، دیدگاه هر شخصیت را بر اساس شخصیت پیشین در زنجیره استدلال می‌سازد. این فرآیند باعث می‌شود سؤالات پیچیده درجه‌بالا به سؤالات ساده‌ای درباره جهان واقعی تبدیل شوند که در دل یک دیدگاه بازسازی‌شده قرار گرفته‌اند.

جزئیات فنی این دستاورد شامل موارد زیر است:

ارزیابی جامع در سه بنچمارک کلیدی: Hi-ToM، Big-ToM و FanToM.
اعتبارسنجی عملکرد با استفاده از تحلیل KD45 برای اثبات ایجاد یک مودالیته باور ساختاریافته.
ادغام به عنوان یک لایه‌ی استنتاجی روی مدل‌های مختلف از جمله GPT-5.4 و Qwen3.5.

این نتیجه، فرضیات رایج در میدان AI را تغییر می‌دهد: استدلال اجتماعی صرفاً محصول مقیاس نیست، بلکه نتیجه‌ی مدیریت صحیح دیدگاه‌ها است. RecToM نشان می‌دهد که جایگزینی فیلترهای ساده با یک مودالیته ساختاری در زمان استنتاج، می‌تواند نیاز به آموزش‌های تخصصی و سنگین برای وظایف استدلالی پیچیده را از بین ببرد.

گام بعدی شما

بررسی نحوه ادغام منطق بازگشتی در سیستم‌های عامل‌محور (Agentic) برای بهبود مذاکرات خودکار.
تحلیل اثر کاهش نیاز به Fine-tuning در وظایف استدلالی اجتماعی با استفاده از لایه‌های استنتاجی.
مطالعه مستندات تحلیل KD45 برای درک نحوه سنجش صحت باورها در مدل‌های زبانی.

اما تأثیر این معماری بر تعاملات پیچیده در سیستم‌های چند-عاملی، ابعاد تازه‌ای از همکاری ماشین-انسان را می‌طلبد — منتظر تحلیل ما درباره‌ی ارکستراسیون عامل‌ها باشید.

این گزارش با خط‌لولهٔ خودکار دات‌هوش از منابع معتبر جهانی تدوین و زیر نظر تحریریه منتشر شده است. روش کار ما

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

اخبار روزانه، معرفی ابزارها و مدل‌ها، و آموزشِ کار با هوش مصنوعی؛ همیشه با این پرسش که از ایران چه چیزی کار می‌کند و چه چیزی نه.

جزئیات فنی این دستاورد شامل موارد زیر است:

ارزیابی جامع در سه بنچمارک کلیدی: Hi-ToM، Big-ToM و FanToM.
اعتبارسنجی عملکرد با استفاده از تحلیل KD45 برای اثبات ایجاد یک مودالیته باور ساختاریافته.
ادغام به عنوان یک لایه‌ی استنتاجی روی مدل‌های مختلف از جمله GPT-5.4 و Qwen3.5.

گام بعدی شما

بررسی نحوه ادغام منطق بازگشتی در سیستم‌های عامل‌محور (Agentic) برای بهبود مذاکرات خودکار.
تحلیل اثر کاهش نیاز به Fine-tuning در وظایف استدلالی اجتماعی با استفاده از لایه‌های استنتاجی.
مطالعه مستندات تحلیل KD45 برای درک نحوه سنجش صحت باورها در مدل‌های زبانی.

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

چگونه RecToM با بازسازی بازگشتی دیدگاه‌ها به دقت ۱۰۰٪ در Hi-ToM رسید؟

گام بعدی شما

منابع

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

چگونه RecToM با بازسازی بازگشتی دیدگاه‌ها به دقت ۱۰۰٪ در Hi-ToM رسید؟

گام بعدی شما

منابع

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

چگونه RecToM با بازسازی بازگشتی دیدگاه‌ها به دقت ۱۰۰٪ در Hi-ToM رسید؟

گام بعدی شما

منابع

مقاله‌های مرتبطهمه ←

سرمایه‌گذاری سری B: ۳۱۰ میلیون دلار برای شبیه‌سازی فیزیک در Odyssey

هگینگ‌فیس با استاندارد ARD جست‌وجوی ابزارها برای عامل‌ها را خودکار کرد

«پیش‌بینی مسیر از طریق متن»؛ دستاورد جدید مؤسسه AllenAI در فضای سه‌بعدی

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

مدل‌ها و ابزارهای مرتبط

اصطلاحات این مطلب

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

چگونه RecToM با بازسازی بازگشتی دیدگاه‌ها به دقت ۱۰۰٪ در Hi-ToM رسید؟

گام بعدی شما

منابع

مقاله‌های مرتبطهمه ←

سرمایه‌گذاری سری B: ۳۱۰ میلیون دلار برای شبیه‌سازی فیزیک در Odyssey

هگینگ‌فیس با استاندارد ARD جست‌وجوی ابزارها برای عامل‌ها را خودکار کرد

«پیش‌بینی مسیر از طریق متن»؛ دستاورد جدید مؤسسه AllenAI در فضای سه‌بعدی

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

مدل‌ها و ابزارهای مرتبط

اصطلاحات این مطلب

راهنمای فارسی هوش مصنوعی — با نگاه به ایران