تصور کنید رباتی که با مجموعهدادههای کاملاً امن آموزش دیده است، در لحظهای حساس و تحت تأثیری نامرئی، رفتاری مرگبار از خود نشان دهد. این کابوس اکنون به دلیل یک حفره امنیتی در جریان تولید دادههای مصنوعی، به واقعیت نزدیکتر شده است.
مدلهای جهانی (World Models) برای کاهش هزینههای گزاف و زمانبرِ هدایت دستی رباتها (Teleoperation)، محیطهای شبیهسازیشدهای میسازند تا رباتها در آنها آموزش ببینند. همانطور که در پوشش پیشین ما از امنیت مدلهای بنیادی دیدیم، هر لایه جدید در استخراج ویژگیها، سطح جدیدی از ریسک را با خود میآورد. بر اساس مستندات پژوهشی، این مدلها با شبیهسازی دینامیکهای دنیای واقعی، وابستگی به دادههای واقعی را کاهش میدهند، اما همین ویژگی، نقطهای برای نفوذ است.
به نقل از مقالهای که در ۹ ژوئن ۲۰۲۶ در arxiv.org منتشر شد، مهاجمان میتوانند با تزریق دستورات مخرب یا تغییر دینامیکهای گذار در دادههای اولیه، «دربهای پشتی» (Backdoors) ایجاد کنند. این محرکها در دادههای خام غیرفعال میمانند اما پس از پردازش توسط مدل جهانی، فعال شده و سیاستهای رفتاری ربات را مسموم میکنند. یافتههای کلیدی این پژوهش عبارتند از:
- ایجاد موفقیتآمیز دربهای پشتی در سیاستهای یادگیری تقویتشده عمیق (Deep Reinforcement Learning - DRL).
- اثبات مفهوم (PoC) برای مدلهای بینایی-زبان-عمل (Vision-Language-Action - VLA).
- اثربخشی حمله بر مدلهای جهانیِ وابسته به متن و وابسته به عمل.
این کشف، تمرکز امنیتی را از «مجموعهدادههای آموزشی» به «خط لوله تولید داده» منتقل میکند. در حوزه فنی، این یافته این فرض را میشکند که دادههای مصنوعی مشتقشده از حقایق امن (Ground Truth)، ذاتاً ایمن هستند. در واقع، بهرهوری مدلهای جهانی هزینهای پنهان دارد: یک «مالیات امنیتی» که میتواند منجر به شکستهای فیزیکی فاجعهبار در هنگام استقرار ربات شود.
گام بعدی شما
- اولویت دادن به توسعه متدهای تأیید صلاحیت (Verification) برای دینامیکهای گذار در مدلهای جهانی.
- رصد بنچمارکهای جدیدی که دادههای مصنوعی رباتیک را پیش از آموزش، برای یافتن محرکهای پنهان بازرسی (Audit) میکنند.
این تنها آغاز ماجراست؛ بررسی اینکه چگونه سختافزارهای نسل جدید میتوانند این حملات را در سطح لبه شناسایی کنند، در گزارش بعدی ما درباره تراشههای عصبی بررسی خواهد شد.
گفتگو