باید بدانید که دوران آموزشهای هزینهبر برای ارتقای عاملهای کدنویس در حال پایان است. تصور کنید بتوانید قابلیت استدلال یک مدل ریاضی پیچیده را، بدون یک ثانیه آموزش مجدد، به یک عامل عملیاتی تزریق کنید.
M2A توانسته است شکاف میان منطق ریاضی در محیطهای بسته و تعاملات عاملمحور (Agentic) در محیطهای باز را پر کند. طبق اعلام پژوهشگران در مقالهای که در ۱۲ مه ۲۰۲۶ در arxiv.org منتشر شد، این متد نرخ حل مسائل در بنچمارک SWE-Bench Verified را برای مدل Qwen3-8B از ۴۴.۰٪ به ۵۱.۲٪ افزایش داده است.
همانطور که در تحلیلهای پیشین ما دربارهی مدلهای استدلالی اشاره کردیم، مدلهای زبانی بزرگ اغلب در ایجاد تعادل میان منطق داخلی و استفاده از ابزارهای خارجی شکست میخورند. دلیل این امر تضاد بنیادین میان دو الگوی استدلال است: یکی برای پاسخ به یک مسئله ریاضی تکمرحلهای و دیگری برای تعاملات چندمرحلهای یک عامل (Agent).
به نقل از مستندات این پژوهش، M2A برای عبور از چالشهای تنظیم دقیق نظارتشده (Supervised Fine-Tuning - SFT) یا یادگیری تقویتشده (Reinforcement Learning - RL)، مستقیماً در فضای پارامتر (Parameter Space) عمل میکند. سازوکار فنی این روش به شرح زیر است:
- شناسایی زیرفضای ویژگیهای حیاتی برای رفتار عامل.
- ادغام بردار وظایف استدلال ریاضی دقیقاً در فضای تهی (Null Space) آن زیرفضای عامل.
- تزریق عمق استدلالی بدون ایجاد اختلال در توانایی مدل برای اقدام (Action).
- استفاده از یک ضریب ادغام به عنوان «پیچ تنظیم» دستی برای کنترل طول استدلال.
برای جامعه فنی، این یک چرخش راهبردی است؛ تمرکز از آموزشهای گرانقیمت به سمت دستکاری دقیق پارامترها تغییر میکند. با نگاه به استدلال به عنوان بردارهایی که میتوانند به صورت عمود بر هم ادغام شوند، M2A نشان میدهد که عمق استدلال میتواند به جای یک رفتار اکتسابی، به عنوان یک لایه ماژولار اضافه شود. این رویکرد نیاز به بهروزرسانی گرادینتها را حذف کرده و هزینه محاسبات (Compute) برای توسعه عاملهای کدنویس را به شدت کاهش میدهد.
گام بعدی شما
- بررسی مقاله M2A در arxiv برای درک نحوه پیادهسازی فضای تهی در مدلهای بازمتن.
- آزمایش متدهای ادغام پارامترها بر روی مدلهای کوچکتر برای کاهش هزینه استنتاج (Inference).
- رصد کاربردهای این تکنیک در ترکیب قابلیتهای متضاد، مانند نویسندگی خلاق و پایبندی سختگیرانه به واقعیات.
اما داستان سختافزاری این تحول حتی شگفتانگیزتر است؛ برای درک اینکه این دستکاریهای پارامتری چگونه با معماریهای جدید سازگار میشوند، به تحلیل ما دربارهی تراشههای Blackwell مراجعه کنید.




گفتگو