اگر برای تحلیل جداول مالی به مدلهای زبانی اعتماد میکنید، احتمالاً با کابوس «شکستهای خاموش» آشنا هستید؛ جایی که یک اشتباه کوچک در خواندن یک سلول، کل نتیجهی محاسباتی را بهکل تغییر میدهد. MoCA-Agent برای حل این معضل، پارادایم استدلال را از «گفتگوی مدلها» به یک «بازار ادعاکار» تغییر داده است.
استدلال عددی دقیق در دادههای جدولی، مدتها نقطهضعف مدلهای زبانی بزرگ (Large Language Model) بوده است. همانطور که در تحلیلهای پیشین ما دربارهی تولید بازیابیافزا (Retrieval-Augmented Generation) و توهمات مدلها اشاره کردیم، روشهای متداول زنجیره تفکر (Chain-of-Thought) اغلب در حفظ مبنیسازی (Grounding) دادهها طی عملیاتهای مکرر شکست میخورند.
طبق گزارشی که در ۱۱ ژوئن ۲۰۲۶ در arxiv.org منتشر شد، چارچوب MoCA-Agent با استفاده از مدل Qwen3.6-27B به عنوان هسته مرکزی، یک خط لوله چهارمرحلهای را اجرا میکند:
- تجزیه: هر پرسش به ادعاهای اتمی و تایپشده تبدیل میشود.
- پاکسازی بازار: عاملهای متخصص این ادعاها را میخرند یا میفروشند تا تصمیمات پذیرش/رد با وزنِ اطمینان مشخص شوند.
- سنتز کد: یک برنامه پایتون قابل اجرا، تنها بر اساس شواهدی که در بازار تأیید شدهاند، تولید میشود.
- تایید: یک بررسیکننده کد، سازگاری ساختاری را چک کرده و حداکثر یک فرصت برای اصلاح کد میدهد.
به نقل از مستندات این پژوهش، این سیستم در بنچمارک FinChart-Bench به میانگین ۸۵.۶٪ دقت رسیده است. نتایج در سایر آزمونها نیز چشمگیر است: ۷۸.۳٪ در FinQA، ۷۶.۰٪ در FinanceMath و ۸۶.۹٪ در ESGenius.
تحلیل ما نشان میدهد که در این معماری، استدلال از یک «گفتگو» به یک «بازار اجماع» تبدیل شده است. با ایزوله کردن و تأیید ادعاهای اتمی پیش از سنتز نهایی، MoCA-Agent از آبشار خطاهای رایج در عاملهای هوش مصنوعی جلوگیری میکند. این یعنی برای کاربردهای حساس مالی، تجمیع شواهد دانهریز بسیار مؤثرتر از تأیید کلی پاسخ در سطح نهایی است.
گام بعدی شما
- بررسی امکان پیادهسازی مکانیزم «بازار ادعا» برای تحلیل قراردادهای حقوقی یا دوزهای دارویی.
- مقایسه هزینه استنتاج (Inference) این مدل در برابر روشهای سنتی چند-عاملی.
- دنبال کردن بهروزرسانیهای مدلهای سری Qwen در حوزه استدلال عددی.
اما تأثیر این رویکرد بر کاهش نیاز به GPUهای عظیم در محیطهای عملیاتی، موضوعی است که در گزارش بعدی به آن خواهیم پرداخت.



گفتگو