چگونه مدل‌های جهانی در تولید داده‌های رباتیک، «درب‌های پشتی» مخفی ایجاد می‌کنند؟

تصور کنید رباتی که با مجموعه‌داده‌های کاملاً امن آموزش دیده است، در لحظه‌ای حساس و تحت تأثیری نامرئی، رفتاری مرگبار از خود نشان دهد. این کابوس اکنون به دلیل یک حفره امنیتی در جریان تولید داده‌های مصنوعی، به واقعیت نزدیک‌تر شده است.

مدل‌های جهانی (World Models) برای کاهش هزینه‌های گزاف و زمان‌برِ هدایت دستی ربات‌ها (Teleoperation)، محیط‌های شبیه‌سازی‌شده‌ای می‌سازند تا ربات‌ها در آن‌ها آموزش ببینند. همان‌طور که در پوشش پیشین ما از امنیت مدل‌های بنیادی دیدیم، هر لایه جدید در استخراج ویژگی‌ها، سطح جدیدی از ریسک را با خود می‌آورد. بر اساس مستندات پژوهشی، این مدل‌ها با شبیه‌سازی دینامیک‌های دنیای واقعی، وابستگی به داده‌های واقعی را کاهش می‌دهند، اما همین ویژگی، نقطه‌ای برای نفوذ است.

به نقل از مقاله‌ای که در ۹ ژوئن ۲۰۲۶ در arxiv.org منتشر شد، مهاجمان می‌توانند با تزریق دستورات مخرب یا تغییر دینامیک‌های گذار در داده‌های اولیه، «درب‌های پشتی» (Backdoors) ایجاد کنند. این محرک‌ها در داده‌های خام غیرفعال می‌مانند اما پس از پردازش توسط مدل جهانی، فعال شده و سیاست‌های رفتاری ربات را مسموم می‌کنند. یافته‌های کلیدی این پژوهش عبارتند از:

ایجاد موفقیت‌آمیز درب‌های پشتی در سیاست‌های یادگیری تقویت‌شده عمیق (Deep Reinforcement Learning - DRL).
اثبات مفهوم (PoC) برای مدل‌های بینایی-زبان-عمل (Vision-Language-Action - VLA).
اثربخشی حمله بر مدل‌های جهانیِ وابسته به متن و وابسته به عمل.

این کشف، تمرکز امنیتی را از «مجموعه‌داده‌های آموزشی» به «خط لوله تولید داده» منتقل می‌کند. در حوزه فنی، این یافته این فرض را می‌شکند که داده‌های مصنوعی مشتق‌شده از حقایق امن (Ground Truth)، ذاتاً ایمن هستند. در واقع، بهره‌وری مدل‌های جهانی هزینه‌ای پنهان دارد: یک «مالیات امنیتی» که می‌تواند منجر به شکست‌های فیزیکی فاجعه‌بار در هنگام استقرار ربات شود.

گام بعدی شما

اولویت دادن به توسعه متدهای تأیید صلاحیت (Verification) برای دینامیک‌های گذار در مدل‌های جهانی.
رصد بنچمارک‌های جدیدی که داده‌های مصنوعی رباتیک را پیش از آموزش، برای یافتن محرک‌های پنهان بازرسی (Audit) می‌کنند.

این تنها آغاز ماجراست؛ بررسی اینکه چگونه سخت‌افزارهای نسل جدید می‌توانند این حملات را در سطح لبه شناسایی کنند، در گزارش بعدی ما درباره تراشه‌های عصبی بررسی خواهد شد.

این گزارش با خط‌لولهٔ خودکار دات‌هوش از منابع معتبر جهانی تدوین و زیر نظر تحریریه منتشر شده است. روش کار ما

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

اخبار روزانه، معرفی ابزارها و مدل‌ها، و آموزشِ کار با هوش مصنوعی؛ همیشه با این پرسش که از ایران چه چیزی کار می‌کند و چه چیزی نه.

ایجاد موفقیت‌آمیز درب‌های پشتی در سیاست‌های یادگیری تقویت‌شده عمیق (Deep Reinforcement Learning - DRL).
اثبات مفهوم (PoC) برای مدل‌های بینایی-زبان-عمل (Vision-Language-Action - VLA).
اثربخشی حمله بر مدل‌های جهانیِ وابسته به متن و وابسته به عمل.

گام بعدی شما

اولویت دادن به توسعه متدهای تأیید صلاحیت (Verification) برای دینامیک‌های گذار در مدل‌های جهانی.
رصد بنچمارک‌های جدیدی که داده‌های مصنوعی رباتیک را پیش از آموزش، برای یافتن محرک‌های پنهان بازرسی (Audit) می‌کنند.

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

چگونه مدل‌های جهانی در تولید داده‌های رباتیک، «درب‌های پشتی» مخفی ایجاد می‌کنند؟

گام بعدی شما

منابع

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

چگونه مدل‌های جهانی در تولید داده‌های رباتیک، «درب‌های پشتی» مخفی ایجاد می‌کنند؟

گام بعدی شما

منابع

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

چگونه مدل‌های جهانی در تولید داده‌های رباتیک، «درب‌های پشتی» مخفی ایجاد می‌کنند؟

گام بعدی شما

منابع

مقاله‌های مرتبطهمه ←

سرمایه‌گذاری سری B: ۳۱۰ میلیون دلار برای شبیه‌سازی فیزیک در Odyssey

هگینگ‌فیس با استاندارد ARD جست‌وجوی ابزارها برای عامل‌ها را خودکار کرد

«پیش‌بینی مسیر از طریق متن»؛ دستاورد جدید مؤسسه AllenAI در فضای سه‌بعدی

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

اصطلاحات این مطلب

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

چگونه مدل‌های جهانی در تولید داده‌های رباتیک، «درب‌های پشتی» مخفی ایجاد می‌کنند؟

گام بعدی شما

منابع

مقاله‌های مرتبطهمه ←

سرمایه‌گذاری سری B: ۳۱۰ میلیون دلار برای شبیه‌سازی فیزیک در Odyssey

هگینگ‌فیس با استاندارد ARD جست‌وجوی ابزارها برای عامل‌ها را خودکار کرد

«پیش‌بینی مسیر از طریق متن»؛ دستاورد جدید مؤسسه AllenAI در فضای سه‌بعدی

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

اصطلاحات این مطلب

راهنمای فارسی هوش مصنوعی — با نگاه به ایران