
سازه ReCoVLA: تبدیل VLM به انتخابگر پاداش برای بازیابی خطاهای رباتیک
چارچوب ReCoVLA با استفاده از مدلهای چندوجهی برای هدایت پاداشها، توانایی رباتها در بازیابی از شکستها را بدون نیاز به بازآموزی سیاست اصلی افزایش میدهد. این روش نرخ موفقیت…
موضوع
Chain-of-thought, reasoning models (o-series, R-series), test-time compute
۶۳۰ مقاله منتشر شده

چارچوب ReCoVLA با استفاده از مدلهای چندوجهی برای هدایت پاداشها، توانایی رباتها در بازیابی از شکستها را بدون نیاز به بازآموزی سیاست اصلی افزایش میدهد. این روش نرخ موفقیت…

چارچوب Anything2Skill با تبدیل دانش خارجی پراکنده به قراردادهای مهارتی ساختاریافته، شکاف بین «خواندن مستندات» و «اجرای وظیفه» را پر میکند. این رویکرد باعث افزایش نرخ موفقیت…

پژوهشگران ابزاری به نام AGENTSERVESIM را معرفی کردهاند که امکان شبیهسازی دقیق عملکرد سختافزاری عاملهای هوش مصنوعی را روی پردازندههای معمولی (CPU) فراهم میکند. این ابزار با…

پژوهشگران چارچوبی برای مدلهای زبانی ابداع کردهاند که به جای امتیازدهی ساده، از منطق فیزیکوشیمیایی برای طراحی مولکولها استفاده میکند. این روش در وظایف متوسط به موفقیت ۱۰۰ درصدی…

چارچوب Reasoning Arena با جایگزینی سیگنالهای باینری با تورنمنتهای مقایسهای، دقت مدلها در ریاضی و کدنویسی را ۷.۶٪ افزایش داد. این متد ضمن ارتقای عملکرد، هزینه محاسبات تولید را…

پژوهشگران مجموعه داده PhysScene را معرفی کردند؛ نخستین گراف صحنه تخصصی برای محیطهای آزمایشگاهی فیزیک. هدف این پروژه تغییر تمرکز مدلها از روابط مکانی ساده به وابستگیهای عملکردی…

پژوهشگران با معرفی PyGeoX و مکانیزم پاداش SAR، نرخ موفقیت مدلهای زبانی در حل مسائل پیچیده هندسی را ۲.۳ برابر کردند. این روش با جلوگیری از «پوشش گرادیانهای پرت»، مانع از توهم مدل…

پژوهشی جدید با معرفی چارچوب SEF-CLGC نشان میدهد که ادغام منطق نمادین در مدلهای زبانی کوچک میتواند سوگیری محتوایی را کاهش دهد. این رویکرد در آزمونهای SemEval-2026 به دقت ۲۷.۸۰…

پژوهشگران با تنظیم دقیق مدل Qwen3-VL-2B و ادغام دادههای مربوط به نگاه چشم و حرکت خودرو، رکورد جدیدی در پیشبینی قصد عابر پیاده ثبت کردند. این روش بر معماریهای تخصصی ترنسفورمری…

مدلهای زبانی بزرگ اکنون میتوانند بدون هیچ آموزشی، اشیاء محیطهای سهبعدی را با دقت ۹۶ درصد به کلاسهای هستیشناسی متصل کنند. این روش با بهرهگیری از نشانههای معنایی در گراف…

معماری جدید FlashMemory-DeepSeek-V4 با معرفی سازوکار «توجه پراکنده پیشرو»، گلوگاه حافظه GPU را در پردازش متون طولانی برطرف کرده است. این متد بدون کاهش دقت، ردپای حافظه KV را به…

چارچوب جدیدی به نام INFUSER با تغییر رویکرد از دادههای «سخت» به دادههای «مؤثر»، مدلهای هوش مصنوعی را قادر میسازد تا برنامه آموزشی خود را بهطور پویا تکامل دهند. این متد باعث…