تصور کنید سیستم رانندگی خودکار شما در یک بزرگراه خلوت، همان مقدار انرژی محاسباتی را مصرف کند که در یک تقاطع شلوغ شهری؛ این یعنی اتلاف شدید منابع و افزایش تأخیر در واکنش.
بیشتر مدلهای فعلی از بودجه محاسباتی ثابتی برای تشخیص سهبعدی استفاده میکنند و تفاوتی بین یک فضای خالی و یک محیط پرتراکم قائل نیستند. همانطور که در تحلیل قبلی ما دربارهی GuardAD و استفاده آن از منطق مارکوف برای کاهش تصادفات اشاره کردیم، صنعت اکنون به سمت لایههای ایمنی پویا و حساس به متن حرکت میکند تا بهرهوری را بالا ببرد.
به نقل از پژوهشگران در مقالهای که ۱۲ مه ۲۰۲۶ در arXiv منتشر شد، معماری Enhanced HOPE از یک تخمینگر آماری بدون نظارت (Unsupervised Statistical Estimator) برای سنجش پیچیدگی هندسی فریمهای لیدار (LiDAR) استفاده میکند. این سازوکار، دادهها را بر اساس میزان پیچیدگی به دو مسیر پردازشی «کمعمق» یا «عمیق» هدایت میکند. برای حل مشکل مقیاسپذیری درجهدوم در ترنسفورمرها، تیم توسعهدهنده یک شبکه مبتنی بر زیرفضا با زمان خطی (Linear-time Subspace-based Network) طراحی کردند که اشیاء نزدیک را خوشهبندی میکند. طبق گزارش این پژوهش، نتایج در بنچمارکهای nuScenes و CARLA عبارتند از:
- کاهش ۳۸ درصدی تأخیر در صحنههای ساده.
- افزایش ۲.۷ امتیازی در میانگین دقت متوسط (mAP) برای سناریوهای نادر (Long-tail).
- ردیابی موفق اشیاء در زمان انسداد (Occlusion) بیش از ۵ ثانیه.
این رویکرد، فرض سنتی مبنی بر اینکه ادراک (Perception) باید یک عملیات با هزینه ثابت باشد را به چالش میکشد. با جداسازی محاسبات از نرخ فریم و استفاده از یک ماژول حافظه زمانی پایدار، مشکل «فراموشی» در هنگام انسداد اشیاء عملاً حذف شده است. برای متخصصان این حوزه، این یعنی دستیابی به حاشیه ایمنی بالاتر در محیطهای شهری پیچیده، بدون نیاز به ارتقای سختافزاری گسترده.
گام بعدی شما
- بررسی قابلیت انتقال این مسیریابی تطبیقی به ترنسفورمرهای بینایی مبتنی بر دوربین (Camera-only Vision Transformers).
- رصد جایگزینی مکانیسمهای توجه (Attention Mechanisms) استاندارد با شبکههای زیرفضای زمانخطی در سایر کاربردهای رباتیک بلادرنگ.
اما تأثیر این بهینهسازی بر مصرف انرژی در سختافزارهای لبه، ابعاد جدیدی از این بحث را میگشاید — به تحلیل ما دربارهی تراشههای نسل جدید مراجعه کنید.




گفتگو