تثبیت مسیرهای رانندگی خودکار با DFP: گذار از کپی‌برداری تاریخچه به کنترل پویا

تصور کنید خودروی خودرانی که مدام در حال اصلاح‌های ریز و لرزشیِ فرمان است و باعث سرگیجه مسافران می‌شود؛ این همان بحران «ناپایداری زمانی» در برنامه‌ریزان مسیر است که ایمنی و راحتی در رانندگی حلقه‌بسته (Closed-loop) را به مخاطره می‌اندازد.

ناپایداری در مدل‌های یادگیری‌محور باعث می‌شود اغتشاشات کوچک در هر فریم، در طول زمان انباشته شده و منجر به رفتارهای نامتعارف خودرو شوند. همان‌طور که در تحلیل قبلی ما درباره‌ی GuardAD و کاهش نرخ تصادفات با استفاده از منطق مارکوف اشاره کردیم، صنعت سال‌ها با چالش «انباشت اغتشاش» دست‌وپنجه نرم کرده است. پیش از این، تلاش‌ها برای تثبیت خروجی‌ها از طریق تزریق تاریخچه به عنوان یک سیگنال استاتیک انجام می‌شد، اما این مدل‌ها اغلب دچار خطای «کپی‌برداری از تاریخچه» می‌شدند و به‌جای انطباق با محیط، صرفاً الگوهای گذشته را تکرار می‌کردند.

در ۱۰ ژوئن ۲۰۲۶، پژوهشگران جزئیات چارچوب Diffusion Forcing Planner (DFP) را منتشر کردند. طبق مستندات منتشرشده در arXiv، این سیستم مسیرها را به سه بخش تاریخچه، وضعیت فعلی و آینده تجزیه می‌کند و برای هر بخش، سطوح نویز مستقلی را از طریق یک فرآیند مدل انتشار (Diffusion Model) مشترک و ناهمگن اختصاص می‌دهد. به‌کارگیری مدل‌های انتشار برای تثبیت سیستم‌ها، تنها محدود به برنامه‌ریزی مسیر نیست و پیش‌تر در راهکار BSTabDiff برای غلبه بر نفرین ابعاد در تولید داده‌های مصنوعی نیز برای کنترل پایداری خروجی‌ها به کار گرفته شده بود.

اجزای فنی کلیدی این معماری عبارتند از:

• حذف نویز مشترک (Joint Denoising) برای بخش‌های تاریخچه و آینده.
• به‌کارگیری راهنمای بدون طبقه‌بندی (Classifier-Free Guidance یا CFG) در مرحله‌ی استنتاج (Inference).
• استفاده از «تاریخچه آنیل‌شده» (Annealed History) برای هدایت نمونه‌برداری آینده به شکلی کنترل‌پذیر.

کارایی این سیستم از طریق ارزیابی‌های حلقه‌بسته و تحلیل‌های گسترده روی بنچمارک nuPlan تأیید شده است. این بنچمارک‌ها نیازمند داده‌های محیطی دقیقی هستند؛ در همین راستا، مدل STRP با استفاده از کانولوشن اتساعی معکوس استانداردهای جدیدی را برای بازسازی تفصیلی داده‌های ترافیکی ارائه داده است.

این رویکرد، این فرض قدیمی را که داده‌های تاریخی باید یک شرط استاتیک باشند، به چالش می‌کشد. با تبدیل تاریخچه به یک سیگنال پویا و وابسته به نویز، DFP اجازه می‌دهد تداوم مسیر بدون صلبیتِ کپی‌برداری ایجاد شود. برای متخصصان این حوزه، این بدان معناست که مسیر دستیابی به برنامه‌ریزی پایدار، در گذار کنترل‌شده میان محدودیت‌های تاریخی و انعطاف‌پذیری آینده نهفته است. در کنار این تلاش‌ها برای بهینه‌سازی مسیرهای فردی، چالش پیش‌بینی جریان کلی شهر نیز با مدل‌هایی نظیر MoE-FedTP و معماری خبره‌های فدرال در حال تکامل است.

گام بعدی شما

بررسی نحوه پیاده‌سازی متغیرهای نویز مستقل برای هر بازه زمانی در مدل‌های انتشار.
تحلیل اثرات CFG بر کاهش لرزش مسیر در محیط‌های شبیه‌سازی شده.
رصد ادغام متدهای آنیلینگ (Annealing) در مدل‌های جهان چندوجهی برای یکپارچه‌سازی درک محیطی و برنامه‌ریزی.

اما داستان سخت‌افزاری اجرای این مدل‌های سنگین در لبه، ابعاد دیگری دارد؛ در گزارش بعدی به تحلیل بهینه‌سازی استنتاج در تراشه‌های نسل جدید خواهیم پرداخت.

این گزارش با خط‌لولهٔ خودکار دات‌هوش از منابع معتبر جهانی تدوین و زیر نظر تحریریه منتشر شده است. روش کار ما

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

اخبار روزانه، معرفی ابزارها و مدل‌ها، و آموزشِ کار با هوش مصنوعی؛ همیشه با این پرسش که از ایران چه چیزی کار می‌کند و چه چیزی نه.

اجزای فنی کلیدی این معماری عبارتند از:

گام بعدی شما

بررسی نحوه پیاده‌سازی متغیرهای نویز مستقل برای هر بازه زمانی در مدل‌های انتشار.
تحلیل اثرات CFG بر کاهش لرزش مسیر در محیط‌های شبیه‌سازی شده.
رصد ادغام متدهای آنیلینگ (Annealing) در مدل‌های جهان چندوجهی برای یکپارچه‌سازی درک محیطی و برنامه‌ریزی.

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

تثبیت مسیرهای رانندگی خودکار با DFP: گذار از کپی‌برداری تاریخچه به کنترل پویا

گام بعدی شما

منابع

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

تثبیت مسیرهای رانندگی خودکار با DFP: گذار از کپی‌برداری تاریخچه به کنترل پویا

گام بعدی شما

منابع

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

تثبیت مسیرهای رانندگی خودکار با DFP: گذار از کپی‌برداری تاریخچه به کنترل پویا

گام بعدی شما

منابع

مقاله‌های مرتبطهمه ←

سرمایه‌گذاری سری B: ۳۱۰ میلیون دلار برای شبیه‌سازی فیزیک در Odyssey

هگینگ‌فیس با استاندارد ARD جست‌وجوی ابزارها برای عامل‌ها را خودکار کرد

«پیش‌بینی مسیر از طریق متن»؛ دستاورد جدید مؤسسه AllenAI در فضای سه‌بعدی

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

اصطلاحات این مطلب

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

تثبیت مسیرهای رانندگی خودکار با DFP: گذار از کپی‌برداری تاریخچه به کنترل پویا

گام بعدی شما

منابع

مقاله‌های مرتبطهمه ←

سرمایه‌گذاری سری B: ۳۱۰ میلیون دلار برای شبیه‌سازی فیزیک در Odyssey

هگینگ‌فیس با استاندارد ARD جست‌وجوی ابزارها برای عامل‌ها را خودکار کرد

«پیش‌بینی مسیر از طریق متن»؛ دستاورد جدید مؤسسه AllenAI در فضای سه‌بعدی

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

اصطلاحات این مطلب

راهنمای فارسی هوش مصنوعی — با نگاه به ایران