تصور کنید شهری را که در آن پهپادها تنها پرواز نمیکنند، بلکه در لحظه اشتباهات خود را میشناسند و اصلاح میکنند. اگر در حال طراحی زیرساختهای نسل بعدی شهرهای هوشمند هستید، توانایی اصلاح پویا و آنی تخصیص منابع، همان مزیت رقابتی است که نمیتوانید نادیده بگیرید.
به نقل از گزارش arxiv.org که در ۷ مه ۲۰۲۶ منتشر شد، پژوهشگران یک سیستم بهینهسازی مشترک برای اینترنت وسایل نقلیه (Internet of Vehicles - IoV) با کمک پهپادها طراحی کردهاند. طبق اعلام این تیم، هدف اصلی این سیستم، به حداقل رساندن تأخیر و مصرف انرژی در محیطهای متراکم شهری از طریق جداسازی یک مسئله پیچیده بهینهسازی به یک چارچوب اجرایی سلسلهمراته است.
این معماری فنی بر سه لایه متمرکز است:
- کنترل مسیر: استفاده از یک الگوریتم بهینهسازی توزیعشده بر پایه برنامهریزی مخروطی درجه دوم (Second-Order Cone Programming - SOCP) برای بهینهسازی مسیرهای پرواز سهبعدی.
- زمانبندی ترکیبی: یک عامل (Agent) مبتنی بر یادگیری تقویتشده عمیق (Deep Reinforcement Learning - DRL) تخصیص اولیه منابع را مدیریت میکند، در حالی که یک مدل زبانی بزرگ (Large Language Model - LLM) به عنوان یک زمانبند کلان معنایی، ناهماهنگیهای مربوط به وظایف شکستخورده یا مازاد را اصلاح میکند.
- برونسپاری وظایف: استفاده از برنامهریزی خطی (Linear Programming - LP) در یک حلقه بهینهسازی متناوب برای تعیین دقیق نسبتهای برونسپاری.
همانطور که در تحلیلهای پیشین ما دربارهی عاملهای هوش مصنوعی (AI Agents) اشاره کردیم، گذار از مدلهای متنی به کنترلرهای فیزیکی، نقطه عطف این دهه است. بر اساس مستندات این پژوهش، برای حفظ پایداری سیستم، یک مکانیسم «جداسازی پاداش» معرفی شده است تا مداخلات LLM با آموزش DRL تداخل نکند و همگرایی سیاستها تضمین شود.
اگرچه در چکیده مقاله به درصدهای دقیق اشاره نشده، اما نتایج شبیهسازی نشان میدهد که این متد در نرخ موفقیت و بهرهوری، بهطور قابلتوجهی از مدلهای پایه یادگیری تقویتشده چند-عاملی پیشی گرفته است. این رویکرد، LLM را از یک چتبات ساده به یک کنترلر سطح بالا تبدیل میکند که میتواند نقاط کور DRL را بپوشاند.
اما سوال بزرگ این است که آیا تأخیر در استنتاج (Inference) مدلهای زبانی، سرعت واکنش پهپادها را در دنیای واقعی میگیرد؟ به تحلیل ما دربارهی رایانش لبه (Edge Computing) مراجعه کنید.
گام بعدی شما
- بررسی متدولوژی SOCP برای بهینهسازی مسیرهای پویا در محیطهای شهری.
- مطالعه نحوه پیادهسازی لایههای اصلاحی (Corrective Layers) با استفاده از LLM در سیستمهای کنترل.
- تحلیل تأثیر تأخیر استنتاج بر سیستمهای Real-time در مقیاس شهری.




گفتگو