تصور کنید رباتی در محیطی پویا، تنها به دلیل چند میلیثانیه تأخیر در پردازش، در برخورد با یک مانع متحرک شکست بخورد. این دقیقاً همان نقطهی شکست معماریهای فعلی است که در آن ربات باید ابتدا یک توالی عملیاتی را پیشبینی و سپس اجرا کند.
معماریهای تکهای (Chunk-based) که تا امروز استاندارد بودهاند، در مواجهه با تغییرات سریع محیطی کند عمل میکنند. همانطور که در تحلیلهای پیشین ما دربارهی چالشهای استقرار عاملهای هوش مصنوعی در دنیای فیزیکی اشاره کردیم، شکاف میان ادراک و اجرا همواره گلوگاه اصلی بوده است.
به نقل از مقالهای که در ۱۱ مه ۲۰۲۶ در arXiv منتشر شد، سیستم Streaming Stochastic Interpolant Policy (SSIP) برای حل این مشکل طراحی شده است. این مدل با استفاده از یک رانش (Drift) اصلاحشده بر اساس معادله کولموگوروف معکوس (Backward Kolmogorov Equation)، نمونهبرداری از توزیع هدف را تضمین میکند. این چارچوب دو سازوکار هدایتی معرفی میکند:
- هدایت مجموعهای مسیر استوکاستیک (STEG): روشی بدون نیاز به آموزش که گرادینتها را بهصورت آنی برای انطباق صفر-شات (Zero-shot) محاسبه میکند.
- هدایت منتقد شرطی (CCG): روشی مبتنی بر آموزش برای افزایش کارایی استنتاج (Inference) خردشده.
این تغییر رویکرد، فرضهای بنیادین دربارهی توازن میان هدایت (Guidance) و تأخیر را میشکند. SSIP کنترل ربات را از یک چرخه «پیشبینی-سپس-اجرا» به یک جریان واکنش مستمر تبدیل میکند و اجازه میدهد مسیرهای فیزیکی معتبر در محیطهای ساختارنیافته بهطور آنی اصلاح شوند.
گام بعدی شما
- رصد انتشار کد منبع SSIP برای بنچمارک کردن سیاستهای جریانی در برابر مدلهای جریان قطعی.
- بررسی پایداری این چارچوب در سختافزارهای انساننما با درجه آزادی بالا.
اما تأثیر این تحول بر سختافزارهای نسل بعد حتی حیاتیتر است؛ به تحلیل ما دربارهی تراشههای Blackwell مراجعه کنید.




گفتگو