تصور کنید خودروی شما پیش از آنکه حتی پدال ترمز را لمس کنید، متوجه وحشت یا تردید شما شود. این دیگر یک سناریوی علمی-تخیلی نیست، بلکه هدف از طراحی Driver-WM است.
به نقل از تحلیل فنی منتشر شده در arxiv.org در ۷ مه ۲۰۲۶، پژوهشگران سیستمی را توسعه دادهاند که فراتر از شناسایی سادهی وضعیت فعلی عمل میکند. در حالی که هوش مصنوعیهای متداول در کابین تنها وضعیت لحظهای را تشخیص میدهند، Driver-WM یک مدل جهانی نهفته (Latent World Model) است که میتواند با اجرای «شبیهسازیهای آیندهنگر» (Rollouts)، واکنش راننده به شرایط متغیر جاده را پیشبینی کند.
بر اساس مستندات این پژوهش، این مدل از یک معماری دو جریانی (Dual-stream architecture) استفاده میکند تا ترافیک بیرونی و وضعیت داخلی راننده را بهطور مجزا کدگذاری کند. این دو جریان از طریق یک مکانیسم تزریق علّی گیتدار (Gated causal injection mechanism) به هم متصل میشوند؛ سیستمی که با استفاده از یک بردار گیت یادگرفتهشده، اثر تغییرات بیرونی بر راننده را مدیریت کرده و در عین حال، علّیت زمانی را بهطور دقیق حفظ میکند.
مشخصات فنی کلیدی این مدل عبارتند از:
- استفاده از یک فضای نهفتهی فشرده بر پایه ویژگیهای زبان-بینایی منجمد (Frozen vision-language features).
- پیشبینی یکپارچهی کینماتیک (Kinematics) فیزیکی در کنار شناسایی معنایی رفتارها و احساسات.
- پیشبینی هندسی بلندمدت و مقاوم، بهویژه برای مانورهای واکنشی با شدت حرکتی بالا.
همانطور که در تحلیلهای پیشین ما دربارهی مدلهای جهانی اشاره کردیم، پیشبینی محیط بیرونی تنها نیمی از مسیر است. Driver-WM با تغییر تمرکز به درون کابین، متلاطمترین متغیر در اتوماسیون L2/L3 یعنی «انسان در حلقه» (Human-in-the-loop) را هدف قرار داده است. پژوهشگران خاطرنشان کردند که این شرطیسازی صریح «بیرون به درون»، امکان مداخلات کنترلشده در زمان تست را فراهم میکند تا دقیقاً مشخص شود کدام رویداد ترافیکی باعث چه واکنشی در راننده میشود.
اما چالش اصلی اکنون سختافزار است؛ برای درک نحوه اجرای این مدلهای پیچیده روی تراشههای لبه، تحلیل ما دربارهی رایانش لبه (Edge Computing) را بخوانید.
گام بعدی شما
- مطالعهی مقاله کامل در Arxiv برای درک نحوه پیادهسازی گیتهای علّی.
- بررسی استانداردهای جدید ایمنی در سیستمهای L3 با تمرکز بر پیشبینی رفتار انسانی.
- تحلیل اثر مدلهای جهانی نهفته بر کاهش نرخ تصادفات در لحظهی انتقال کنترل.
گفتگو