تصور کنید خودروی خودرانی که مدام در حال اصلاحهای ریز و لرزشیِ فرمان است و باعث سرگیجه مسافران میشود؛ این همان بحران «ناپایداری زمانی» در برنامهریزان مسیر است که ایمنی و راحتی در رانندگی حلقهبسته (Closed-loop) را به مخاطره میاندازد.
ناپایداری در مدلهای یادگیریمحور باعث میشود اغتشاشات کوچک در هر فریم، در طول زمان انباشته شده و منجر به رفتارهای نامتعارف خودرو شوند. همانطور که در تحلیل قبلی ما دربارهی GuardAD و کاهش نرخ تصادفات با استفاده از منطق مارکوف اشاره کردیم، صنعت سالها با چالش «انباشت اغتشاش» دستوپنجه نرم کرده است. پیش از این، تلاشها برای تثبیت خروجیها از طریق تزریق تاریخچه به عنوان یک سیگنال استاتیک انجام میشد، اما این مدلها اغلب دچار خطای «کپیبرداری از تاریخچه» میشدند و بهجای انطباق با محیط، صرفاً الگوهای گذشته را تکرار میکردند.
در ۱۰ ژوئن ۲۰۲۶، پژوهشگران جزئیات چارچوب Diffusion Forcing Planner (DFP) را منتشر کردند. طبق مستندات منتشرشده در arXiv، این سیستم مسیرها را به سه بخش تاریخچه، وضعیت فعلی و آینده تجزیه میکند و برای هر بخش، سطوح نویز مستقلی را از طریق یک فرآیند مدل انتشار (Diffusion Model) مشترک و ناهمگن اختصاص میدهد. بهکارگیری مدلهای انتشار برای تثبیت سیستمها، تنها محدود به برنامهریزی مسیر نیست و پیشتر در راهکار BSTabDiff برای غلبه بر نفرین ابعاد در تولید دادههای مصنوعی نیز برای کنترل پایداری خروجیها به کار گرفته شده بود.
اجزای فنی کلیدی این معماری عبارتند از:
• حذف نویز مشترک (Joint Denoising) برای بخشهای تاریخچه و آینده.
• بهکارگیری راهنمای بدون طبقهبندی (Classifier-Free Guidance یا CFG) در مرحلهی استنتاج (Inference).
• استفاده از «تاریخچه آنیلشده» (Annealed History) برای هدایت نمونهبرداری آینده به شکلی کنترلپذیر.
کارایی این سیستم از طریق ارزیابیهای حلقهبسته و تحلیلهای گسترده روی بنچمارک nuPlan تأیید شده است. این بنچمارکها نیازمند دادههای محیطی دقیقی هستند؛ در همین راستا، مدل STRP با استفاده از کانولوشن اتساعی معکوس استانداردهای جدیدی را برای بازسازی تفصیلی دادههای ترافیکی ارائه داده است.
این رویکرد، این فرض قدیمی را که دادههای تاریخی باید یک شرط استاتیک باشند، به چالش میکشد. با تبدیل تاریخچه به یک سیگنال پویا و وابسته به نویز، DFP اجازه میدهد تداوم مسیر بدون صلبیتِ کپیبرداری ایجاد شود. برای متخصصان این حوزه، این بدان معناست که مسیر دستیابی به برنامهریزی پایدار، در گذار کنترلشده میان محدودیتهای تاریخی و انعطافپذیری آینده نهفته است. در کنار این تلاشها برای بهینهسازی مسیرهای فردی، چالش پیشبینی جریان کلی شهر نیز با مدلهایی نظیر MoE-FedTP و معماری خبرههای فدرال در حال تکامل است.
گام بعدی شما
- بررسی نحوه پیادهسازی متغیرهای نویز مستقل برای هر بازه زمانی در مدلهای انتشار.
- تحلیل اثرات CFG بر کاهش لرزش مسیر در محیطهای شبیهسازی شده.
- رصد ادغام متدهای آنیلینگ (Annealing) در مدلهای جهان چندوجهی برای یکپارچهسازی درک محیطی و برنامهریزی.
اما داستان سختافزاری اجرای این مدلهای سنگین در لبه، ابعاد دیگری دارد؛ در گزارش بعدی به تحلیل بهینهسازی استنتاج در تراشههای نسل جدید خواهیم پرداخت.



گفتگو