پژوهش انویدیا: کدنویسی خودکار هوش مصنوعی دقت رباتیک را به ۹۹٪ رساند

اگر مدیریت یک آزمایشگاه رباتیک را بر عهده دارید، بزرگ‌ترین گلوگاه شما سخت‌افزار نیست، بلکه ساعت‌های بی‌پایانی است که انسان‌ها صرف بازنشانی صحنه و تغییر دستی کدها می‌کنند. در ۱۷ ژوئن ۲۰۲۶، پژوهشگران انویدیا (Nvidia)، دانشگاه کارنگی ملون و دانشگاه برکلی راهکاری برای خودکارسازی این فرآیند خسته‌کننده با استفاده از عامل‌های کدنویس هوش مصنوعی معرفی کردند.

مهارت‌های ظریف رباتیک مدت‌ها یک چالش «دستی» بوده است. انسان‌ها معمولاً داده‌ها را جمع‌آوری می‌کنند، محیط را بعد از هر شکست بازنشانی می‌کنند و الگوریتم‌ها را دستی تغییر می‌دهند. این سربار باعث می‌شود پیشرفت بسیار کند باشد. پروژه جدیدی به نام ENPIRE، این گلوگاه انسانی را با یک حلقه بازخورد خودبهبوددهنده جایگزین کرده است که مستقیماً روی سخت‌افزار واقعی اجرا می‌شود.

همان‌طور که در تحلیل‌های قبلی ما درباره‌ی خودکارسازی مهندسی نرم‌افزار اشاره کردیم، انتقال قدرت کدنویسی از انسان به عامل‌های هوشمند، سرعت تکرار آزمون و خطا را به‌طرز چشم‌گیری افزایش می‌دهد. در این سیستم، مدل زبانی بزرگ (LLM) — مثل کتابخانه‌داری که میلیاردها صفحه را خوانده و حالا با همان لحن کتاب‌ها جواب می‌دهد — نقش مهندس رباتیک را ایفا می‌کند.

سازوکار ENPIRE

ایده اصلی یک حلقه مداوم است: عامل محیط را بازنشانی می‌کند، یک استراتژی خاص را اجرا می‌کند، نتیجه را بررسی می‌کند و تلاش بعدی را بهبود می‌بخشد. به نقل از گزارش وب‌سایت the-decoder.com، این سامانه در دو مرحله مجزا عمل می‌کند.

در مرحله اول، عامل ابزارهای ارزیابی خودش را می‌سازد. او توابع پاداشی می‌نویسد که بر اساس چند دقیقه ویدئوی نمونه، موفقیت را از شکست تشخیص دهد. این کار نیاز به ارزیابی تک‌تک تلاش‌ها توسط انسان را از بین می‌برد.

جزئیات عملیاتی

برای تأیید موفقیت، عامل بررسی‌های سفارشی را بر اساس هر وظیفه توسعه می‌دهد:

جای‌گذاری پین: عامل ترکیبی از تراز بصری، ارتفاع گیره و نیروی تخمینی را به کار برد.
بستن بست کابل: برای جلوگیری از تشخیص‌های غلط، از دو زاویه دوربین مختلف استفاده کرد و به زمان واکنش زیر ۱۵۰ میلی‌ثانیه رسید.

این ابزارها یک‌بار ساخته شده و بدون تغییر مجدد استفاده می‌شوند.

ربات‌های خودآموز انویدیا با عامل‌های کدنویسی هوش مصنوعی آموزش می‌بینند

در مرحله دوم، عامل‌ها کاملاً خودگردان می‌شوند. آن‌ها مقالات پژوهشی را می‌خوانند، فرضیه می‌سازند و مستقیماً کد آموزش را ویرایش می‌کنند. آن‌ها روش‌های خود را بر اساس سیگنال‌های موفقیت در دنیای واقعی انتخاب می‌کنند؛ مثلاً از کپی رفتار (Behavior Cloning) — شبیه به تقلید کودک از حرکات بزرگترها — یا یادگیری تقویت‌شده (Reinforcement Learning) — مثل یادگیری یک حیوان از طریق جایزه و تنبیه — استفاده می‌کنند.

مقیاس‌پذیری از طریق Git

برای تسریع یادگیری، تیم یک ناوگان متشکل از ۸ ایستگاه رباتیک دو-بازو با نام YAM مستقر کرد. هر ایستگاه سخت‌افزار، کامپیوتر و عامل کدنویس خاص خود را دارد. آن‌ها از طریق Git، ابزار استاندارد کنترل نسخه در نرم‌افزار، با یکدیگر هماهنگ می‌شوند.

وقتی یک ربات دستور پخت موفقیت‌آمیزی برای آموزش پیدا می‌کند، کد را در Git قرار می‌دهد و بقیه ناوگان آن پیشرفت را به‌کار می‌گیرند. ایده‌های بد به‌طور خودکار دور ریخته می‌شوند. این یعنی یک کشف در یک ایستگاه، فوراً در کل ناوگان پخش می‌شود.

ربات‌های خودآموز انویدیا با عامل‌های کدنویسی هوش مصنوعی آموزش می‌بینند

نتایج ملموس هستند. عامل‌ها به نرخ موفقیت ۹۹٪ در کارهای دشوار رسیدند؛ از جمله تست Push-T (لغزاندن یک بلوک T-شکل به موقعیت هدف)، مرتب‌سازی پین‌ها در جعبه و بریدن بست‌های کابل. بر اساس مستندات این پژوهش، در جای‌گذاری پین، استراتژی سیستم سریع‌تر از روش‌های انسانی به موفقیت ۱۰۰٪ رسید.

مقیاس‌پذیری از یک به هشت عامل، زمان رسیدن به موفقیت کامل در تست Push-T را از ۵ ساعت به تنها ۲ ساعت کاهش داد. در جای‌گذاری پین نیز این زمان از ۹۰ دقیقه به حدود ۴۰ دقیقه رسید.

رویارویی مدل‌ها

پژوهشگران سه عامل کدنویس مختلف را برای یافتن بهترین عملکرد آزمایش کردند:

Codex (با GPT-5.5): در بیشتر موارد برنده بود.
Claude Code (با Opus 4.7)
Kimi Code (با Kimi K2.6)

با این حال، دنیای واقعی همچنان محیطی بی‌رحم است. در حالی که هر سه عامل تست Push-T را در شبیه‌ساز حل کردند، دو مورد از آن‌ها هنگام انتقال به محیط فیزیکی به‌دلیل اصطکاک پیش‌بینی‌نشده، دینامیک ربات و جابجایی اشیاء شکست خوردند. در شبیه‌ساز RoboCasa، سیستم ENPIRE از هر دو روش CaP-X (که یک رویکرد ابزار-محور بدون خودپژوهی است) و مدل GR00T (که یک مدل سرتاسری بینایی-زبان-عمل است) پیشی گرفت.

برای تحلیل بهره‌وری، تیم دو معیار جدید معرفی کرد: MRU (میانگین بهره‌وری ربات) برای زمان کار واقعی ربات و MTU (میانگین بهره‌وری توکن) برای هزینه توکن‌های مدل در هر دقیقه. آن‌ها دریافتند که با رشد ناوگان، بهره‌وری هر ربات کاهش می‌یابد چون عامل‌ها زمان بیشتری را صرف خواندن گزارش‌ها و خلاصه‌سازی نتایج یکدیگر می‌کنند.

این تغییر یعنی هزینه توکن‌های محاسباتی سریع‌تر از بهبود عملکرد رشد می‌کند. اگرچه ناوگان زودتر به هدف می‌رسد، اما بودجه را با سرعتی بیشتر می‌سوزاند.

این پیشرفت ثابت می‌کند که هوش مصنوعی اکنون نه‌تنها می‌تواند یک ربات را کنترل کند، بلکه می‌تواند خودِ مهندس رباتیک باشد. ما از «ربات‌های مجهز به هوش مصنوعی» به سمت «مهارت‌های رباتیک طراحی‌شده توسط هوش مصنوعی» حرکت می‌کنیم.

در مورد گام‌های بعدی، باید منتظر ماند و دید این عامل‌ها چگونه «انتقال بین-مهارتی» را مدیریت می‌کنند؛ در همین مطالعه اشاره شد که تجربه جای‌گذاری پین به ربات‌ها کمک کرد تا بتوانند پردازنده‌های گرافیکی (GPU) را در مادربوردها جای‌گذاری کنند.

گام بعدی شما

اگر توسعه‌دهنده رباتیک هستید، بررسی کنید چگونه می‌توانید از Git برای اشتراک‌گذاری سریع استراتژی‌های یادگیری بین چندین عامل استفاده کنید.
روی تفاوت عملکرد مدل‌های کدنویس در شبیه‌ساز در برابر محیط فیزیکی تمرکز کنید تا نقاط ضعف فعلی در درک اصطکاک و دینامیک را بشناسید.

اما داستان سخت‌افزاری این تحول حتی شگفت‌انگیزتر است — به تحلیل ما درباره‌ی تراشه‌های Blackwell مراجعه کنید.

این گزارش با خط‌لولهٔ خودکار دات‌هوش از منابع معتبر جهانی تدوین و زیر نظر تحریریه منتشر شده است. روش کار ما

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

اخبار روزانه، معرفی ابزارها و مدل‌ها، و آموزشِ کار با هوش مصنوعی؛ همیشه با این پرسش که از ایران چه چیزی کار می‌کند و چه چیزی نه.

سازوکار ENPIRE

جزئیات عملیاتی

برای تأیید موفقیت، عامل بررسی‌های سفارشی را بر اساس هر وظیفه توسعه می‌دهد:

جای‌گذاری پین: عامل ترکیبی از تراز بصری، ارتفاع گیره و نیروی تخمینی را به کار برد.
بستن بست کابل: برای جلوگیری از تشخیص‌های غلط، از دو زاویه دوربین مختلف استفاده کرد و به زمان واکنش زیر ۱۵۰ میلی‌ثانیه رسید.

این ابزارها یک‌بار ساخته شده و بدون تغییر مجدد استفاده می‌شوند.

ربات‌های خودآموز انویدیا با عامل‌های کدنویسی هوش مصنوعی آموزش می‌بینند

مقیاس‌پذیری از طریق Git

ربات‌های خودآموز انویدیا با عامل‌های کدنویسی هوش مصنوعی آموزش می‌بینند

رویارویی مدل‌ها

پژوهشگران سه عامل کدنویس مختلف را برای یافتن بهترین عملکرد آزمایش کردند:

Codex (با GPT-5.5): در بیشتر موارد برنده بود.
Claude Code (با Opus 4.7)
Kimi Code (با Kimi K2.6)

گام بعدی شما

اگر توسعه‌دهنده رباتیک هستید، بررسی کنید چگونه می‌توانید از Git برای اشتراک‌گذاری سریع استراتژی‌های یادگیری بین چندین عامل استفاده کنید.
روی تفاوت عملکرد مدل‌های کدنویس در شبیه‌ساز در برابر محیط فیزیکی تمرکز کنید تا نقاط ضعف فعلی در درک اصطکاک و دینامیک را بشناسید.

اما داستان سخت‌افزاری این تحول حتی شگفت‌انگیزتر است — به تحلیل ما درباره‌ی تراشه‌های Blackwell مراجعه کنید.

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

پژوهش انویدیا: کدنویسی خودکار هوش مصنوعی دقت رباتیک را به ۹۹٪ رساند

سازوکار ENPIRE

جزئیات عملیاتی

مقیاس‌پذیری از طریق Git

رویارویی مدل‌ها

گام بعدی شما

منابع

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

پژوهش انویدیا: کدنویسی خودکار هوش مصنوعی دقت رباتیک را به ۹۹٪ رساند

سازوکار ENPIRE

جزئیات عملیاتی

مقیاس‌پذیری از طریق Git

رویارویی مدل‌ها

گام بعدی شما

منابع

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

پژوهش انویدیا: کدنویسی خودکار هوش مصنوعی دقت رباتیک را به ۹۹٪ رساند

سازوکار ENPIRE

جزئیات عملیاتی

مقیاس‌پذیری از طریق Git

رویارویی مدل‌ها

گام بعدی شما

منابع

مقاله‌های مرتبطهمه ←

«تهدید امنیت ملی»؛ هشدار کشورهای G7 به انحصار مدل‌های آمریکایی

سرمایه‌گذاری سری B: ۳۱۰ میلیون دلار برای شبیه‌سازی فیزیک در Odyssey

هگینگ‌فیس با استاندارد ARD جست‌وجوی ابزارها برای عامل‌ها را خودکار کرد

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

مدل‌ها و ابزارهای مرتبط

اصطلاحات این مطلب

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

پژوهش انویدیا: کدنویسی خودکار هوش مصنوعی دقت رباتیک را به ۹۹٪ رساند

سازوکار ENPIRE

جزئیات عملیاتی

مقیاس‌پذیری از طریق Git

رویارویی مدل‌ها

گام بعدی شما

منابع

مقاله‌های مرتبطهمه ←

«تهدید امنیت ملی»؛ هشدار کشورهای G7 به انحصار مدل‌های آمریکایی

سرمایه‌گذاری سری B: ۳۱۰ میلیون دلار برای شبیه‌سازی فیزیک در Odyssey

هگینگ‌فیس با استاندارد ARD جست‌وجوی ابزارها برای عامل‌ها را خودکار کرد

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

مدل‌ها و ابزارهای مرتبط

اصطلاحات این مطلب

راهنمای فارسی هوش مصنوعی — با نگاه به ایران