
سازه ReCoVLA: تبدیل VLM به انتخابگر پاداش برای بازیابی خطاهای رباتیک
چارچوب ReCoVLA با استفاده از مدلهای چندوجهی برای هدایت پاداشها، توانایی رباتها در بازیابی از شکستها را بدون نیاز به بازآموزی سیاست اصلی افزایش میدهد. این روش نرخ موفقیت…
موضوع
Autonomous agents, tool use, planning, multi-step workflows
۱٬۵۲۵ مقاله منتشر شده

چارچوب ReCoVLA با استفاده از مدلهای چندوجهی برای هدایت پاداشها، توانایی رباتها در بازیابی از شکستها را بدون نیاز به بازآموزی سیاست اصلی افزایش میدهد. این روش نرخ موفقیت…

چارچوب Anything2Skill با تبدیل دانش خارجی پراکنده به قراردادهای مهارتی ساختاریافته، شکاف بین «خواندن مستندات» و «اجرای وظیفه» را پر میکند. این رویکرد باعث افزایش نرخ موفقیت…

معماری SecureClaw با ایجاد گیتهای دو-مرزی، احتمال نشت دادههای حساس توسط عاملهای هوش مصنوعی را در بنچمارک ASB به صفر رسانده است. این رویکرد، امنیت را از فیلترهای احتمالیِ متنی…

پژوهشگران ابزاری به نام AGENTSERVESIM را معرفی کردهاند که امکان شبیهسازی دقیق عملکرد سختافزاری عاملهای هوش مصنوعی را روی پردازندههای معمولی (CPU) فراهم میکند. این ابزار با…

مدل جدید CT-VAM با استفاده از معماری الهامگرفته از سیستم عصبی انسان، موفق شد با ۶۸ میلیون پارامتر، عملکرد مدلهای عظیم بینایی-زبانی-کنشی (VLA) را در کنترل رباتها بازتولید کند.…

پژوهشگران پیشنهاد دادهاند که میانافزارهای رباتیک به عنوان یک «هارنس» بازتعریف شوند تا سیاستهای یادگیریشدهی هوش مصنوعی را مدیریت کنند. این چارچوب با معرفی توابع نگاشت، جداسازی…

پژوهشگران نوع جدیدی از حمله مسمومسازی داده را شناس کردهاند که مدلهای جهانی را هدف قرار میدهد. این حمله با تزریق محرکهای پنهان به دادههای به ظاهر امن، رباتها را مجبور به…

پژوهشگران نوع جدیدی از حملات به نام «تزریق پرامپت مغزی» را شناسایی کردهاند که از طریق اختلال در سیگنالهای عصبی، عاملهای BCI-LLM را به کنترل درمیآورد. این مطالعه ثابت میکند که…

پژوهشگران چارچوب EgoTactile را معرفی کردند که میتواند فشار گیرش دست را تنها از طریق ویدیوهای اولشخص تخمین بزند. این سیستم با استفاده از مدلهای انتشار، نیاز به سختافزارهای لمسی…

پژوهشگران با ترکیب یادگیری تقویتشدهی SAC و یک برنامه آموزشی خودگردان (SPDL)، سیستمی برای آموزش موتورسیکلتهای مسابقهای خودران توسعه دادهاند. این رویکرد نیاز به طراحی دستی…

مدلهای زبانی بزرگ اکنون میتوانند بدون هیچ آموزشی، اشیاء محیطهای سهبعدی را با دقت ۹۶ درصد به کلاسهای هستیشناسی متصل کنند. این روش با بهرهگیری از نشانههای معنایی در گراف…

شکستهای زیرساختی ابر اکنون سریعتر از واکنش انسانها رخ میدهند. یک معماری جدید هوش مصنوعی عاملمحور در یکی از ارائهدهندگان بزرگ ابر، اکنون بیش از ۹۰ درصد از حوادث رایج شبکه را…