آموزش کاربردی | دات‌هوش

DARP: افزایش ۴۶ درصدی تعمیم‌پذیری در یادگیری تقلیدی با رویکرد بازیابی محلی

رویکرد DARP با جایگزینی سیاست‌های سراسری با ساختارهای بازیابی محلی، خطاهای انباشته در حالت‌های خارج از توزیع را کاهش می‌دهد. این متد منجر به بهبود ۱۵ تا ۴۶ درصدی عملکرد در کنترل…

تحلیل و بررسی تخصصی۳ هفته پیش

کاهش محاسبات بصری در MLLM با سازوکار ادغام لایه‌های انتهایی DPVR-LF

پژوهشگران دریافتند که توکن‌های بصری در مدل‌های چندوجهی پیش از رسیدن به لایه‌های نهایی اشباع می‌شوند. چارچوب DPVR-LF با مسیریابی این توکن‌ها به یک شاخه جانبی، عملکرد مدل را با تنها…

۲ دقیقه خواندن

تحلیل و بررسی تخصصی۳ هفته پیش

سازه ReCoVLA: تبدیل VLM به انتخابگر پاداش برای بازیابی خطاهای رباتیک

چارچوب ReCoVLA با استفاده از مدل‌های چندوجهی برای هدایت پاداش‌ها، توانایی ربات‌ها در بازیابی از شکست‌ها را بدون نیاز به بازآموزی سیاست اصلی افزایش می‌دهد. این روش نرخ موفقیت…

۱ دقیقه خواندن

تحلیل و بررسی تخصصی۳ هفته پیش

Anything2Skill: تبدیل دانش پراکنده به مهارت‌های اجرایی برای عبور از سد RAG

چارچوب Anything2Skill با تبدیل دانش خارجی پراکنده به قراردادهای مهارتی ساختاریافته، شکاف بین «خواندن مستندات» و «اجرای وظیفه» را پر می‌کند. این رویکرد باعث افزایش نرخ موفقیت…

۲ دقیقه خواندن

تحلیل و بررسی تخصصی۳ هفته پیش

شبیه‌ساز AGENTSERVESIM: کاهش خطای مدل‌سازی سرویس‌دهی عامل‌های LLM به زیر ۶ درصد

پژوهشگران ابزاری به نام AGENTSERVESIM را معرفی کرده‌اند که امکان شبیه‌سازی دقیق عملکرد سخت‌افزاری عامل‌های هوش مصنوعی را روی پردازنده‌های معمولی (CPU) فراهم می‌کند. این ابزار با…

۱ دقیقه خواندن

تحلیل و بررسی تخصصی۳ هفته پیش

PyGeoX: افزایش ۲.۳ برابری دقت حل مسائل هندسی با سیستم پاداش SAR

پژوهشگران با معرفی PyGeoX و مکانیزم پاداش SAR، نرخ موفقیت مدل‌های زبانی در حل مسائل پیچیده هندسی را ۲.۳ برابر کردند. این روش با جلوگیری از «پوشش گرادیان‌های پرت»، مانع از توهم مدل…

۱ دقیقه خواندن

تحلیل و بررسی تخصصی۳ هفته پیش

ArXiv: کاهش ۲۵.۵ درصدی زمان آموزش مدل‌های چند-GPU با روش Shaping حافظه مشترک

پژوهشگران روشی برای هم‌پوشانی (Overlap) محاسبات و ارتباطات در محیط‌های چند-GPU ابداع کرده‌اند که زمان اجرای کل را تا ۲۵.۵٪ کاهش می‌دهد. این دستاورد بدون تغییر در کتابخانه‌های…

۱ دقیقه خواندن

تحلیل و بررسی تخصصی۳ هفته پیش

INFUSER: جایگزینی «سختی مسئله» با «امتیاز تأثیر» در آموزش مدل‌ها

چارچوب جدیدی به نام INFUSER با تغییر رویکرد از داده‌های «سخت» به داده‌های «مؤثر»، مدل‌های هوش مصنوعی را قادر می‌سازد تا برنامه آموزشی خود را به‌طور پویا تکامل دهند. این متد باعث…

۲ دقیقه خواندن

تحلیل و بررسی تخصصی۳ هفته پیش

چگونه SafeRun با تفکیک استنتاج و نظارت به ایمنی ۱۰۰ درصدی رسید؟

چارچوب SafeRun با جداسازی تفسیر زبان طبیعی از اجرای محدودیت‌های سخت، ایمنی کامل در برنامه‌ریزی‌های ورزشی را تضمین می‌کند. این متد در بنچمارک‌های جدید، عملکرد مهندسی پرامپت و…

۱ دقیقه خواندن

تحلیل و بررسی تخصصی۳ هفته پیش

سنجش مدل‌های جهانی در ثانیه‌ها: سازوکار ATM برای حذف شبیه‌سازی‌های زمان‌بر

پژوهشگران ابزاری به نام ATM را معرفی کرده‌اند که ارزیابی مدل‌های جهانی نهفته را به جای اجرای کند شبیه‌سازها، با پروب‌های سبک انجام می‌دهد. این متد با شناسایی سریع شکست‌های…

۱ دقیقه خواندن

تحلیل و بررسی تخصصی۳ هفته پیش

«حلقهٔ هکر-اصلاح‌گر»: متدی برای حذف تقلب در بنچمارک‌های عامل‌محور

پژوهشگران با ابداع یک چرخهٔ چندعاملی شامل «هکر» و «اصلاح‌گر»، نرخ موفقیت حملات پاداش‌جویانه در بنچمارک‌های هوش مصنوعی را به صفر رساندند. این روش با خودکارسازی شناسایی و وصله کردن…

۲ دقیقه خواندن

تحلیل و بررسی تخصصی۳ هفته پیش

PAI: بازیابی اطلاعات دامنه و دستیابی به بهبود ۹۸.۴ درصدی در تشخیص ناهنجاری

چارچوب جدید PAI با هدف رفع نقطه کور مدل‌های تشخیص ناهنجاری در سری‌های زمانی (TSAD) معرفی شده است. این روش با بازیابی اطلاعات دامنه سیگنال، دقت شناسایی ناهنجاری‌های مبتنی بر بزرگی…

۲ دقیقه خواندن