تصور کنید مدلهای هوش مصنوعی به جای تلاش بیهوده برای حل هر مسئله با حداکثر توان، دقیقاً بدانند چه زمانی باید سختتر فکر کنند. اگر هنوز تصور میکنید برای رسیدن به پاسخهای دقیقتر در ریاضیات فقط باید تعداد دفعات نمونهبرداری را بالا ببرید، باید بدانید که این استراتژی به بنبست رسیده است.
به نقل از مقالهای که در ۳۰ آوریل ۲۰۲۶ در arxiv.org منتشر شد، یک چارچوب جدید معرفی شده است که استقرار مدلهای استدلالی بزرگ (Large Reasoning Models - LRMs) را متحول میکند. بر اساس مستندات این پژوهش، این سیستم به جای استفاده از روشهای سنتی و پرهزینه، از «مسیریابی مبتنی بر اختلاف» برای مدیریت استنتاج (Inference) استفاده میکند.
این متدولوژی، قوانین مقیاسپذیری (Scaling Laws) را به چالش میکشد و به جای نمونهبرداری کورکورانه، مسائل را به سه سطح تقسیم میکند:
- موارد سازگار: پاسخهای سریع و سبک دریافت میکنند.
- اختلاف متوسط: از طریق رایگیری اکثریت (Majority Voting) حل میشوند.
- موارد مبهم: تحت بازنویسی و فرمولبندی مجدد قرار میگیرند.
همانطور که در تحلیلهای پیشین ما دربارهی محدودیتهای سختافزاری در مدلهای زبانی اشاره کردیم، گلوگاه اصلی همواره هزینه محاسبات (Compute) بوده است. این چارچوب با شناسایی سطح دشواری مسئله از طریق میزان اختلاف بین خروجیها، از اتلاف منابع روی مسائل ساده جلوگیری میکند.
طبق گزارش این مطالعه، آزمایش روی سه مدل مختلف در هفت بنچمارک ریاضی، منجر به افزایش دقت بین ۳ تا ۷ درصد شده است. این یک چرخش راهبردی است؛ چرا که ثابت میکند مدیریت هوشمند منابع، بسیار موثرتر از افزایش سادهی قدرت پردازشی است.
اما این بهینهسازی تنها بخشی از پازل است؛ تأثیر این رویکرد بر کاهش هزینههای عملیاتی مراکز داده را در گزارش بعدی بررسی خواهیم کرد.
گام بعدی شما
- بررسی معماری مسیریابی در مدلهای استدلالی برای کاهش هزینههای API.
- جایگزینی متدهای Tree-of-Thought با استراتژیهای مبتنی بر اختلاف در پروژههای ریاضی.
- تحلیل اثر این متد بر کاهش نرخ توهم (Hallucination) در پاسخهای پیچیده.




گفتگو