درون معماری جدید: وقتی LLM فرمانده پهپادهای شهری می‌شود

تصور کنید شهری را که در آن پهپادها تنها پرواز نمی‌کنند، بلکه در لحظه اشتباهات خود را می‌شناسند و اصلاح می‌کنند. اگر در حال طراحی زیرساخت‌های نسل بعدی شهرهای هوشمند هستید، توانایی اصلاح پویا و آنی تخصیص منابع، همان مزیت رقابتی است که نمی‌توانید نادیده بگیرید.

به نقل از گزارش arxiv.org که در ۷ مه ۲۰۲۶ منتشر شد، پژوهشگران یک سیستم بهینه‌سازی مشترک برای اینترنت وسایل نقلیه (Internet of Vehicles - IoV) با کمک پهپادها طراحی کرده‌اند. طبق اعلام این تیم، هدف اصلی این سیستم، به حداقل رساندن تأخیر و مصرف انرژی در محیط‌های متراکم شهری از طریق جداسازی یک مسئله پیچیده بهینه‌سازی به یک چارچوب اجرایی سلسله‌مراته است.

این معماری فنی بر سه لایه متمرکز است:

کنترل مسیر: استفاده از یک الگوریتم بهینه‌سازی توزیع‌شده بر پایه برنامه‌ریزی مخروطی درجه دوم (Second-Order Cone Programming - SOCP) برای بهینه‌سازی مسیرهای پرواز سه‌بعدی.
زمان‌بندی ترکیبی: یک عامل (Agent) مبتنی بر یادگیری تقویت‌شده عمیق (Deep Reinforcement Learning - DRL) تخصیص اولیه منابع را مدیریت می‌کند، در حالی که یک مدل زبانی بزرگ (Large Language Model - LLM) به عنوان یک زمان‌بند کلان معنایی، ناهماهنگی‌های مربوط به وظایف شکست‌خورده یا مازاد را اصلاح می‌کند.
برون‌سپاری وظایف: استفاده از برنامه‌ریزی خطی (Linear Programming - LP) در یک حلقه بهینه‌سازی متناوب برای تعیین دقیق نسبت‌های برون‌سپاری.

همان‌طور که در تحلیل‌های پیشین ما درباره‌ی عامل‌های هوش مصنوعی (AI Agents) اشاره کردیم، گذار از مدل‌های متنی به کنترلرهای فیزیکی، نقطه عطف این دهه است. بر اساس مستندات این پژوهش، برای حفظ پایداری سیستم، یک مکانیسم «جداسازی پاداش» معرفی شده است تا مداخلات LLM با آموزش DRL تداخل نکند و همگرایی سیاست‌ها تضمین شود.

اگرچه در چکیده مقاله به درصدهای دقیق اشاره نشده، اما نتایج شبیه‌سازی نشان می‌دهد که این متد در نرخ موفقیت و بهره‌وری، به‌طور قابل‌توجهی از مدل‌های پایه یادگیری تقویت‌شده چند-عاملی پیشی گرفته است. این رویکرد، LLM را از یک چت‌بات ساده به یک کنترلر سطح بالا تبدیل می‌کند که می‌تواند نقاط کور DRL را بپوشاند.

اما سوال بزرگ این است که آیا تأخیر در استنتاج (Inference) مدل‌های زبانی، سرعت واکنش پهپادها را در دنیای واقعی می‌گیرد؟ به تحلیل ما درباره‌ی رایانش لبه (Edge Computing) مراجعه کنید.

گام بعدی شما

بررسی متدولوژی SOCP برای بهینه‌سازی مسیرهای پویا در محیط‌های شهری.
مطالعه نحوه پیاده‌سازی لایه‌های اصلاحی (Corrective Layers) با استفاده از LLM در سیستم‌های کنترل.
تحلیل تأثیر تأخیر استنتاج بر سیستم‌های Real-time در مقیاس شهری.

این گزارش با خط‌لولهٔ خودکار دات‌هوش از منابع معتبر جهانی تدوین و زیر نظر تحریریه منتشر شده است. روش کار ما

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

اخبار روزانه، معرفی ابزارها و مدل‌ها، و آموزشِ کار با هوش مصنوعی؛ همیشه با این پرسش که از ایران چه چیزی کار می‌کند و چه چیزی نه.

این معماری فنی بر سه لایه متمرکز است:

کنترل مسیر: استفاده از یک الگوریتم بهینه‌سازی توزیع‌شده بر پایه برنامه‌ریزی مخروطی درجه دوم (Second-Order Cone Programming - SOCP) برای بهینه‌سازی مسیرهای پرواز سه‌بعدی.
زمان‌بندی ترکیبی: یک عامل (Agent) مبتنی بر یادگیری تقویت‌شده عمیق (Deep Reinforcement Learning - DRL) تخصیص اولیه منابع را مدیریت می‌کند، در حالی که یک مدل زبانی بزرگ (Large Language Model - LLM) به عنوان یک زمان‌بند کلان معنایی، ناهماهنگی‌های مربوط به وظایف شکست‌خورده یا مازاد را اصلاح می‌کند.
برون‌سپاری وظایف: استفاده از برنامه‌ریزی خطی (Linear Programming - LP) در یک حلقه بهینه‌سازی متناوب برای تعیین دقیق نسبت‌های برون‌سپاری.

گام بعدی شما

بررسی متدولوژی SOCP برای بهینه‌سازی مسیرهای پویا در محیط‌های شهری.
مطالعه نحوه پیاده‌سازی لایه‌های اصلاحی (Corrective Layers) با استفاده از LLM در سیستم‌های کنترل.
تحلیل تأثیر تأخیر استنتاج بر سیستم‌های Real-time در مقیاس شهری.

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

درون معماری جدید: وقتی LLM فرمانده پهپادهای شهری می‌شود

گام بعدی شما

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

درون معماری جدید: وقتی LLM فرمانده پهپادهای شهری می‌شود

گام بعدی شما

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

درون معماری جدید: وقتی LLM فرمانده پهپادهای شهری می‌شود

گام بعدی شما

مقاله‌های مرتبطهمه ←

سرمایه‌گذاری سری B: ۳۱۰ میلیون دلار برای شبیه‌سازی فیزیک در Odyssey

هگینگ‌فیس با استاندارد ARD جست‌وجوی ابزارها برای عامل‌ها را خودکار کرد

«پیش‌بینی مسیر از طریق متن»؛ دستاورد جدید مؤسسه AllenAI در فضای سه‌بعدی

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

اصطلاحات این مطلب

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

درون معماری جدید: وقتی LLM فرمانده پهپادهای شهری می‌شود

گام بعدی شما

مقاله‌های مرتبطهمه ←

سرمایه‌گذاری سری B: ۳۱۰ میلیون دلار برای شبیه‌سازی فیزیک در Odyssey

هگینگ‌فیس با استاندارد ARD جست‌وجوی ابزارها برای عامل‌ها را خودکار کرد

«پیش‌بینی مسیر از طریق متن»؛ دستاورد جدید مؤسسه AllenAI در فضای سه‌بعدی

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

اصطلاحات این مطلب

راهنمای فارسی هوش مصنوعی — با نگاه به ایران