باید بدانید که رباتهای انساننما اکنون میتوانند توپی را با سرعت ۱۳.۱۰ متر بر ثانیه شلیک کنند؛ عددی که ۷۱٪ سرعت ضربات بازیکنان حرفهای در جریان بازی است.
این پیشرفت در حالی رخ میدهد که کنترل حرکات تهاجمی در رباتها همواره با یک تضاد بنیادین روبرو بود. همانطور که در تحلیلهای پیشین ما دربارهی چالشهای کنترل دینامیکی در رباتهای انساننما اشاره کردیم، دسترسی به قدرت انفجاری معمولاً به قیمت از دست رفتن تعادل تمام میشد.
به نقل از مقالهای که در ۱۰ ژوئن ۲۰۲۶ در arxiv.org منتشر شد، چارچوب RoboNaldo با هدف حل ناپایداریهای ذاتی در تعاملات رباتیکی با ضربه بالا طراحی شده است. طبق گزارش پژوهشگران، این سیستم از یک برنامه آموزشی سهمرحلهای (Curriculum RL) استفاده میکند که یک ضربه انسانی را به عنوان الگو قرار میدهد:
- یادگیری یک پیشفرض (Prior) پایدار برای کل بدن در هنگام ضربه.
- تطبیق ضربه با شرایط ضربات آزاد (توپ ساکن در موقعیتهای تصادفی).
- گسترش قابلیتها برای ضربه به توپهای متحرک از طریق رابط فرمان جابهجایی و ماشه ضربه.
در محیط شبیهسازی، RoboNaldo خطای ضربات آزاد را ۴۸.۶٪ کاهش و سرعت شلیک را ۲.۹۶ برابر نسبت به مدلهای قبلی افزایش داد. این سیستم هنگام استقرار روی ربات Unitree G1 با ادراک داخلی، میانگین خطای هدفگیری ۰.۷۳ متر برای ضربات آزاد و ۰.۸۶ متر برای توپهای متحرک را در فاصله ۳ متری ثبت کرد.
این تغییر رویکرد نشان میدهد که ایجاد یک ساختار حمایتی (Scaffolding) — یعنی شروع با الگوهای انسانی و سپس کاهش تدریجی محدودیتها — بسیار مؤثرتر از بهینهسازی پاداش بهصورت سرتاسری (End-to-End) است. این روش یک نقشه فنی برای سایر کارهای با ضربه بالا، مانند ورزشهای تماسی یا دویدن سریع، فراهم میکند.
گام بعدی شما
- بررسی قابلیت تعمیم این رویکرد آموزشی به بازیهای فوتبال چند-عاملی (Multi-agent).
- مطالعه جزئیات پیادهسازی در صفحه پروژه برای تست روی سختافزار G1.
اما تأثیر این رویکرد بر رباتهای امداد و نجات حتی حیاتیتر است — به بررسی ما دربارهی سیستمهای کنترل تعادلی در محیطهای ناهموار مراجعه کنید.



گفتگو