
«مالیات استدلال»: کاهش ۲۸ درصدی دقت مدلهای متوسط در خروجیهای JSON
پژوهشی جدید نشان میدهد اجبار مدلهای زبانی متوسط به تولید خروجی ساختاریافته (JSON)، دقت استدلالی آنها را تا ۲۸ درصد کاهش میدهد. این پدیده که «مالیات استدلال» نامیده شده، نشان…
موضوع
Autonomous agents, tool use, planning, multi-step workflows
۱٬۵۲۷ مقاله منتشر شده

پژوهشی جدید نشان میدهد اجبار مدلهای زبانی متوسط به تولید خروجی ساختاریافته (JSON)، دقت استدلالی آنها را تا ۲۸ درصد کاهش میدهد. این پدیده که «مالیات استدلال» نامیده شده، نشان…

رویکرد جدیدی به نام CAHL از طریق یادگیری تقویتشده با پاداشهای قابل تأیید، برنامهریز و اجراکننده مدلهای زبانی را بهطور مشترک بهینه میکند. این روش همراستاسازی ساختاری را که…

معماری FF-JEPA با معرفی یک رویکرد سلسلهمراتبی، مشکل فروپاشی مدلهای جهان در برنامهریزیهای بلندمدت را حل کرده است. این مدل با استفاده از یک برنامهریز نهان برای تعیین زیرهدفها،…

چارچوب جدید MASS از شبیهسازیهای اجتماعی تقویتشده با حافظه استفاده میکند تا عاملهای پژوهشی را از سطح ترکیب متون به استدلال تجربی ارتقا دهد. این سیستم توانست نرخ بینش در تولید…

پژوهشگران چارچوبی عاملمحور برای اتوماسیون طراحی موتورهای همگام مغناطیس داخلی (IPMSM) توسعه دادهاند. این سیستم با ترکیب تولید بازیابیافزا (RAG) و رویکرد هیبریدی AI-FEA،…

چارچوب جدید LATTEArena نشان میدهد که ترکیب زنجیره تفکر و جستجوی درختی مونتکارلو، بهینهترین روش برای خودکارسازی مهندسی ویژگیها در دادههای جدولی است. این مطالعه معیارهای…

چارچوب REFLECT با جایگزینی تشخیصهای غیرفعال با یک چرخه آزمایش-و-خطای فعال، نقاط شکست در سیستمهای عاملمحور را شناسایی میکند. این روش بهویژه برای یافتن «خطاهای خاموش» که از دید…

پژوهشگران چارچوب جدیدی به نام «اقتصاد عاملها» را برای جلوگیری از همگرایی رفتاری عاملهای خودمختار معرفی کردهاند. این سیستم با استفاده از همراستاسازی کثرتگرایانه، تنوع استدلالی…

تحلیل فنی جدیدی نشان میدهد که نوسانات در خروجی عاملهای هوش مصنوعی تنها به دلیل تصادفی بودن مدل نیست، بلکه حاصل زنجیرهای از خطاهای لایهبندی شده است. این پژوهش تفاوت میان تصادفی…

تحلیل جدیدی هشدار میدهد که شخصیسازی مدلهای زبانی از طریق RAG و تنظیم دقیق، ریسکهای «رابطهای» ایجاد میکند که فیلترهای امنیتی استاندارد قادر به شناسایی آنها نیستند. این…

چهارچوب AlloSpatial با تبدیل دیدهای محدود به نقشههای جهانی، مشکل «شکنندگی مکانی» در مدلهای چندوجهی را حل کرده است. این سیستم استدلال فضایی در مدلهایی مانند Qwen3-VL را تا ۱۸٪…

سیستم Baichuan-M4 رویکرد هوش مصنوعی در پزشکی را از پاسخهای تکمرحلهای به «مراقبت مستمر» تغییر میدهد. این سامانه با بهرهگیری از معماری عاملمحور (Agentic) و آموزش تخصصی RL، نرخ…