تصور کنید رباتی با وزن صد کیلوگرم در کنار شما در خط تولید حرکت میکند؛ در این لحظه تنها چیزی که مانع از یک حادثه مرگبار میشود، نه لایهی نرمافزاری، بلکه یک معماری سختافزاری تأییدشده است. انویدیا با معرفی Halos، ایمنی را از یک «آپشن لوکس» به پیششرط بنیادین برای ورود رباتها به محیطهای صنعتی تبدیل کرد. شرکت انویدیا با عرضه Halos، نخستین سیستم ایمنی کاملپشته (full-stack) صنعت را معرفی کرد که بهطور خاص برای هوش مصنوعی فیزیکی طراحی شده است. هدف این سیستم، بسط دادن معماریهای ایمنی با درجهی خودرو (automotive-grade) به حوزه رباتیک است.
این تحول در حالی رخ میدهد که صنعت رباتیک از نمونههای آزمایشگاهی مجزا به سمت استقرار گسترده در کارخانهها حرکت میکند. در حالی که «مغز» (مدلهای زبانی بزرگ LLMs و مدلهای بینایی-زبانی-عملگری VLAs) و «بدن» (سختافزار انساننما) پیشرفتهای سریعی داشتهاند، «لایهی ایمنی» همواره یک گلوگاه بزرگ بوده است. بدون یک چارچوب استاندارد برای ایمنی، استقرار رباتهای انساننما در محیطهای کاری مشترک با انسان، همچنان یک ریسک بسیار بالا تلقی میشود.
همانطور که در تحلیلهای پیشین ما دربارهی امنیت مدلهای بازمتن اشاره کردیم، اعتماد به سیستمهای خودکار بدون داشتن لایههای نظارتی سختافزاری، در دنیای فیزیکی به قیمت جانی انسانها تمام میشود. این چالشها با چرخش سریع اکوسیستم AI به سمت عاملهای خودگردان که ریسکهای امنیتی جدیدی را به همراه میآورد، پیچیدگی بیشتری یافته است.
معماری سامانه Halos
طبق گزارش GlobeNewswire در ۲۲ ژوئن ۲۰۲۶، سامانه Halos برای تضمین اینکه ماشینها بتوانند بهصورت ایمن ادراک کنند، تصمیم بگیرند و عمل کنند، در سه لایهی مجزا عمل میکند:
- محاسبات و دریافت دادهها (Compute and Ingestion): این لایه از IGX Thor و Holoscan Sensor Bridge برای پردازشهای سنگین هوش مصنوعی و جذب دادههای حسگرها استفاده میکند.
- پشته نرمافزاری (Software Stack): سیستمعامل Halos OS وظیفهی مدیریت توابع اصلی ایمنی و برنامههای کاربردی حیاتی (mission-critical) را بر عهده دارد.
- گواهینامهسازی (Certification): آزمایشگاه بازرسی سیستمهای هوش مصنوعی Halos، شرکای تجاری را به نهادهای تأیید ثالث (third-party) متصل میکند تا ادعاهای مربوط به ایمنی را بهطور رسمی اعتبارسنجی کنند.
شرکت Agility Robotics نخستین مجموعهای است که این سیستم را در ناوگان انساننمای خود ادغام کرده است. سایر پذیرندگان اولیه عبارتند از شرکت Hesai Technology که به آزمایشگاه بازرسی پیوست و شرکت FORT Robotics که در حال افزودن قابلیتهای ایمنی «خارج به داخل» (Outside-In) به سیستمهای خود است. با ورود انساننماها به انبارها، این استانداردها در حال تبدیل شدن به میدان نبرد استراتژیک جدید هستند.
موج سرمایهگذاری در رباتهای انساننما
به موازات این فشار بر ایمنی، سرمایههای کلانی به سمت رباتیک کاملپشته سرازیر شده است. شرکت NEURA Robotics بهتازگی دور تأمین مالی سری C خود را تا سقف ۱.۴ میلیارد دلار به پایان رساند و ارزش بازار آن به حدود ۷ میلیارد دلار رسید. این بزرگترین دور تأمین مالی افشاششده برای یک شرکت رباتیک کاملپشته در سطح جهان تا به امروز است. سرمایهگذاران این دور شامل Nvidia، Amazon، Qualcomm، Bosch، Schaeffler و بانک سرمایهگذاری اروپا هستند. لازم به ذکر است که کل این مبلغ مشروط به دستیابی به نقاط عطف عملکردی (performance milestones) است. این شرکت اعلام کرده است که حجم سفارشات معوق و خط لوله استقرار آن در حال حاضر بیش از ۱ میلیارد دلار است و هدفگذاری کرده است که تا سال ۲۰۳۰ میلیونها واحد ربات تولید کند.
در دیگر جابهجاییهای استراتژیک، شرکت Bear Robotics که یک شرکت فعال در زمینه رباتهای انساننما و تحویلدهنده (AMR) با بیش از ۱۶ هزار واحد مستقر در جهان است، شرکت بریتانیایی Kinisi Robotics را خرید. این ادغام باعث شد ربات انساننمای KR1 و یک تیم مهندسی مستقر در بریستول به Bear بپیوندند. برنان پیرس، مؤسس Kinisi، اکنون به عنوان مدیر ارشد رباتیک در Bear فعالیت خواهد کرد. این اکتساب، لایهی «دستورزی دقیق» (dexterous manipulation) را به پشتهی موجودِ «تحرک و تحویل» شرکت Bear اضافه میکند و یک پلتفرم جامع هوش مصنوعی فیزیکی ایجاد میکند.
سایر دورهای تأمین مالی استراتژیک
- Jiangxing Intelligence: این استارتآپ چینی در زمینه هوش مصنوعی لبه (edge-AI) و اتوماسیون صنعتی، دورهای استراتژیک سری C و D خود را با مجموع صدها میلیون یوان (RMB) به پایان رساند. تمرکز این شرکت بر «هوش مصنوعی فیزیکی در مقیاس بزرگ» است که از هوش لبه و خودمختاری دستگاهها در سایتهای صنعتی آغاز شده است. این سرمایهگذاری نشاندهندهی تغییر رویکرد به سمت لایهی کاربردی استقرار هوش مصنوعی فیزیکی در محیطهای واقعی کارخانه است.
- LISSOME: یک استارتآپ چینی ربات آشپزخانه با تمرکز بر دستورزی تجسمیافته ساختاریافته. این شرکت دور سری A خود را با دهها میلیون یوان به پایان رساند و بخش خدمات غذایی و عملیات پشتیبانی آشپزخانه (back-of-house) را که تمایل بالایی به پرداخت هزینه دارند، هدف قرار داده است.
- استارتآپ رباتهای همراه (Companion Robot): تیمی متشکل از مدیران سابق Moody (برند لوازم الکترونیکی مصرفی چین) و کارکنان کلیدی DJI، دور سرمایهگذاری فرشته (angel round) خود را با دهها میلیون یوان به رهبری صندوق Jinqiu به پایان رساندند. این تیم با بهرهگیری از پیشینه زنجیره تأمین لوازم الکترونیکی و پهپادها، بازار رباتهای همراه با قابلیتهای عاطفی را هدف قرار داده است.
پیشرفتها در تحقیقات هوش مصنوعی فیزیکی
تحقیقات جدید در حال پرداختن به سختترین بخش رباتیک، یعنی دستورزی (manipulation) است. پروژهی $Ψ_0$ یک ستون فقرات VLA (مدل بینایی-زبانی-عملگری) متنباز برای انساننماها معرفی کرده است که میتواند مهارتهای جدید را تنها با ۸۰ نمایش واقعی ربات یاد بگیرد. این مدل ابتدا مفاهیم کلی دستورزی را از ویدیوهای انسانی در مقیاس بزرگ (اولشخص و سومشخص) میآموزد و سپس از طریق یک خط لوله تبدیل شبیهساز به واقعیت (sim-to-real)، روی ربات Unitree G1 پیاده میشود. این رویکرد، دستورزی هماهنگ پایه متحرک و بازوهای فوقانی را پوشش میدهد و مانع ورود برای بازتولید نتایج انساننما را بهطور قابل توجهی کاهش میدهد. این تلاشها برای بهینهسازی آموزش، در راستای رویکردهای جسورانهای مانند سرمایهگذاری XDOF برای رفع گلوگاه دادههای رباتیک است تا سرعت یادگیری ماشینها در محیطهای واقعی افزایش یابد.
مدلهای پیشرفته VLA و دستورزی
- DeMaVLA: این مدل توسط تیم Midea AIR-C توسعه یافته و اشیایی را هدف قرار میدهد که شکل ثابتی ندارند (تغییر شکل پذیر). از آنجا که تغییرات بینهایت شکل، طراحی سیاستهای دستهبندیشده را دشوار میکند، DeMaVLA از یک ستون فقرات VLA واحد برای مدیریت تا کردن لباسها در دستههای مختلف استفاده میکند. این مدل توالیهای طولانی «گرفتن $
ightarrow$ باز کردن $
ightarrow$ تراز کردن $
ightarrow$ تا کردن» را اجرا میکند تا پارادایم مهندسی «هر دسته یک سیاست» را جایگزین کند. - GenHOI: چارچوبی است که ویدیوهای تولیدشده از تعامل انسان و شیء را به اقدامات اجرایی ربات تبدیل میکند. این مدل مسیرهای تعاملی را از ویدیوهای تولیدی تجزیه و بازطراحی (retarget) میکند و رویکردی را میکاود که در آن «ویدیو به عنوان داده / ویدیو به عنوان برنامهریزی» عمل میکند تا شکاف بین مدلهای جهان و اجرای واقعی ربات پر شود.
- UDHM / UniDexTok: مدل یکپارچه دستهای ظریف (Unified Dexterous Hand Model) دستهای انسان و ربات را در یک فضای مختصاتی ۲۲ بُعدی مشترک از مفاصل فعال، بر اساس آناتومی انسان، نگاشت میکند. این ابعاد بهعنوان مفاصل معنایی تعریف شدهاند. این امر به دستهایی با درجات آزادی متفاوت اجازه میدهد تا تحت یک نمایش واحد، وضعیتها را بیان، منتقل و تراز کنند و بازاستفاده از دادهها را در ریختشناسیهای (morphology) مختلف تسهیل میکند.
- DeFI: یک مقاله در ICLR 2026 که به موضوع «عدم تراز هدف» (objective misalignment) میپردازد؛ جایی که مدلها فریمهای بصری را پیشبینی میکنند اما اقدامات اجرایی را یاد نمیگیرند. این مدل پیشبینی حالت پیشرو (forward state prediction) را از دینامیک معکوس (استخراج اقدامات از تغییرات حالت) جدا میکند.
مدلهای جهان و دادههای مصنوعی
- COMAP: سیستمی است که از مدلهای جهان برای جبران ضعفهای LLM در استدلال پویا استفاده میکند. این سیستم حالتهای آینده را برای اقدامات کاندید پیشبینی میکند و مسیرهای حاصل از آن از طریق خود-تقطیری (self-distillation) برای بهروزرسانی مدل جهان در یک حلقه بسته بازگردانده میشوند. این مدل بهبود نسبی ۱۶.۷۵ درصدی را در Qwen3-4B در بنچمارکهای برنامهریزی تسکهای تجسمیافته، ناوبری وب و استفاده از ابزار گزارش کرده است.
- دانشگاه تکنولوژی نانیانگ (NTU): نخستین مدل مولد سهبعدی را توسعه داد که از شبیهسازی فیزیکی پشتیبانی میکند. این مدل داراییهای هندسی را همراه با ویژگیهای قابل استفاده برای شبیهسازی فیزیکی تولید میکند و اجازه میدهد اشیاء تولید شده مستقیماً وارد آموزش ربات شوند، نه اینکه فقط بهعنوان داراییهای بصری عمل کنند.
- PAIWorld: این مدل جهان توسط تیم هوش مصنوعی فیزیکی در مؤسسه هوش مصنوعی صنعتی آکادمی علوم چین تولید شده و ادعای رتبهی اول در جدول امتیازات WorldArena را دارد.
تحقیقات و ابزارهای تکمیلی
- villa-X (Microsoft): از یک مدل اقدام پنهان (Latent Action Model) برای فشردهسازی تغییرات بصری بین فریمها به توکنهای اقدام پنهان استفاده میکند که انتقال صفر-شات (zero-shot) به بدنههای دیدهنشده را ممکن میسازد.
- Fast-dVLA (ECCV 2026): بر شتابدهی استنتاج VLA پخش (diffusion) گسسته و در زمان واقعی متمرکز است.
- LabVLA (دانشگاه ژجیانگ): بهطور خاص برای ابزارهای آزمایشگاهی علمی و مایعات شفاف طراحی شده است.
- EVO-1: یک VLA سبک با ۰.۷۷ میلیارد پارامتر که تنها به ۲.۳ گیگابایت VRAM نیاز دارد و نرخ ۱۶.۴ هرتز دارد؛ این مدل در حال حاضر از طریق Qingcang Robotics در خطوط تولید L'Oréal مستقر شده است.
- Unitree RL Lab: یک محیط آموزشی RL متنباز بر پایه IsaacLab است که از پلتفرمهای Go2، H1 و G1 با یک خط لوله کامل sim-to-real پشتیبانی میکند.
- ACE-Ego: یک VLA با رویکرد «یک مغز، چندین بدن» که توسط Daxiao Robotics و CUHK MMLab متنباز شده و ادعای نتایج برتر در دو بنچمارک تجسمیافته دارد.
نقاط عطف تجاری و اصطکاکهای استقرار
استقرار تجاری در حال برخورد با اصطکاکهای دنیای واقعی و موفقیتهای همزمان است. Pony.ai سرویس روبوتاکسی خود را در سنگاپور از طریق ادغام در اپلیکیشن تاکسی Zig بهطور کامل برای عموم باز کرد و از «عملیات آزمایشی» به دسترسی عمومی در جنوب شرق آسیا منتقل شد.
در همین حال، WeRide در نمایشگاه خودروی هنگکنگ با Geely Yuancheng و Kwoon Chung Bus قراردادی امضا کرد تا بهطور مشترک روبوتاکسیهای راستگرد (right-hand-drive) تولید انبوه را برای سنگاپور، بریتانیا، ژاپن و استرالیا توسعه دهند.
تنشهای صنعتی در دیترویت به اوج رسیده است. General Motors حدود ۵۰ ربات را در کارخانه خودروهای الکتریکی Factory Zero مستقر کرد. این اقدام پس از حذف بیش از ۱۰۰۰ شغل صورت گرفت و باعث اعتراضات شدید اتحادیه کارکنان خودرو (UAW) شد. در حالی که اتحادیه این ۵۰ ربات را جایگزین مستقیم برای بیش از ۱۰۰۰ شغل میبیند، این موضوع بحثهای اجتماعی را درباره جابجایی نیروی کار ناشی از اتوماسیون شدت بخشیده است.
عرضهها و استقرار عمومی
- Alibaba Logistics: ربات انبارداری جدیدی را رونمایی کرد که قادر است از قفسهها بالا برود تا کالاها را بازیابی یا جایگذاری کند؛ هدفی که دسترسی به ذخیرهسازیهای ارتفاع بالا و بهینهسازی فضا را دنبال میکند.
- Zhiyuan Robotics: ربات انساننمای Elf G2 را معرفی کرد. این شرکت از ۲۳ تا ۲۸ ژوئن، یک پخش زنده مشترک با Longqi Technology برگزار کرد که در آن ربات در ۸ ایستگاه بازرسی تبلت در یک خط تولید در شهر لویانگ به نمایش درآمد.
- UBTECH: ربات انساننمای خدمات تجاری Walker C1 را در نمایشگاه زنجیره تأمین بینالمللی چین برای پذیرش، راهنمایی، سرگرمی و تحقیقات آموزشی عرضه کرد. بهطور جداگانه، ربات انساننمای فوق-بایونیک «YouWorld» این شرکت بیش از ۵۰۰۰ پیشسفارش در JD.com جمعآوری کرده است.
رویدادهای بازار و برنامهریزیهای دولتی
در آسیا، شرکت Haiqing Zhiyuan (01392.HK) در بورس هنگکنگ عرضه شد. این عرضه که «اولین IPO هوش مصنوعی فیزیکی» نامیده شد، منجر به جهش بیش از ۳۰۰ درصدی سهام در بازگشایی شد و ارزش بازار آن در یک روز به حدود ۲۲.۵ میلیارد دلار هنگکنگ رسید. تخصص این شرکت در حسگریهای چندطیفی (مادون قرمز/فرابنفش) و تلفیق الگوریتمهای هوش مصنوعی است.
ژاپن با یک پاسخ گسترده در سطح دولتی واکنش نشان داده است. طبق گزارش Nikkei، دولت ژاپن قصد دارد تا سال مالی ۲۰۴۰، حدود ۶۵ میلیارد دلار (۱۰.۵ تریلیون ین) را در حوزه هوش مصنوعی فیزیکی در ۱۷ بخش استراتژیک تزریق کند. هدف این است که بیش از ۳۰ درصد از بازار جهانی رباتیک هوش مصنوعی تصاحب شود؛ اقدامی که باعث شد شاخص نیکئی بهطور موقت از ۷۲,۰۰۰ واحد فراتر رود.
اکوسیستمهای پلتفرم صنعتی
در نمایشگاه Automate 2026، چندین اتحاد صنعتی برای تسریع استقرار شکل گرفت:
- Vention با FANUC America و Teradyne Robotics (UR) شریک شد تا رباتهای صنعتی و دوقلوهای دیجیتال (digital twins) را به پلتفرم هوش مصنوعی خود متصل کند تا استقرار سلولهای UR شتاب یابد.
- Intrinsic (متعلق به Alphabet) نسل بعدی مونتاژ صنعتی ماژولار با هوش مصنوعی را به نمایش گذاشت.
- Doosan Robotics یک راهکار پالتگذاری مبتنی بر هوش مصنوعی معرفی کرد.
- Proxie Gen 2 از شرکت Cobot، قابلیتهای سازماندهی خودکار تسکها و دستورزی متحرک را اضافه کرد.
علاوه بر این، Ruqi Mobility یک پلتفرم دادهای هوش مصنوعی تجسمیافته را با تأکید بر «قابلیت استفاده فوری» (out-of-the-box) برای کاهش هزینه نهایی دادههای اولشخص راهاندازی کرد و شرکت Yuanqi Innovation بهعنوان همسازنده، سهم استراتژیکی در آن گرفت.
واقعیتهای زنجیره تأمین و اقتصاد قطعات
Pشت این شور و هیجان، هزینه سختافزار همچنان یک مانع است. دستهای ظریف در حال حاضر حدود ۱۷ درصد از کل هزینه مواد اولیه (BOM) یک ربات انساننما را تشکیل میدهند.
- کاهش هزینه: گزارش شده است که تأمینکنندگان چینی قیمت برخی پیکربندیها را از حدود ۲ میلیون یوان به تقریباً ۵۰ هزار یوان کاهش دادهاند.
- شکاف تأمین مالی: صنعت دستهای ظریف در مجموع حدود ۸.۷ میلیارد یوان سرمایه جذب کرده است، با این حال هیچ شرکتی هنوز به سودآوری نرسیده و در یک «سهگانه دشوار» بین عملکرد، هزینه و قابلیت اطمینان گرفتار شده است.
- تولید انبوه: شرکت Hamm Electronics در تولید انبوه ماژولهای محرک پیشرفت کرده و از ماه مه، روزانه حداقل ۶۰۰ موتور را برای مشتریانی چون Lingxin Qiaoshou، Yinshi، Qiangnao و Zibianliang ارسال میکند.
- قطعات غیرفعال: شرکت Shangluo Electronics تأمین مقاومتها و خازنها برای Unitree Robotics را آغاز کرده است.
این همگرایی استانداردهای ایمنی، سرمایههای کلان و تحقیقات مدل جهان نشان میدهد که صنعت از «مرحله نمایش» عبور کرده است. میدان نبرد دیگر این نیست که چه کسی رباتی میسازد که راه برود، بلکه این است که چه کسی رباتی میسازد که بهاندازه کافی ایمن و ارزان باشد تا در کنار انسانها در کارخانه کار کند.
منتظر اولین گواهینامههای ایمنی ثالثی باشید که تحت چارچوب Halos صادر میشوند، زیرا اینها احتمالاً به استاندارد طلایی صنعت برای استقرار انساننماها تبدیل خواهند شد.
گام بعدی شما
- دنبال کردن نخستین گواهینامههای ایمنی صادر شده تحت چارچوب Halos برای درک استانداردهای جدید استقرار صنعتی.
- بررسی مستندات پروژه متنباز $Ψ_0$ برای توسعهدهندگانی که به دنبال کاهش دادههای آموزشی رباتیک هستند.
- تحلیل اثر جایگزینی نیروی کار در مدلهای اقتصادی کارخانههای اتوماتیزه شده.
اما داستان سختافزاری این تحول حتی شگفتانگیزتر است — به تحلیل ما دربارهی تراشههای Blackwell مراجعه کنید.




گفتگو