یک تیم پژوهشی فریمورک جدیدی با نام گاید (Guided Updates for In-context Decision Evolution) معرفی کردهاند که یکی از محدودیتهای مهم استفاده از مدلهای زبانی بزرگ در عملیات فضایی را برطرف میکند: ناتوانی این مدلها در بهبود عملکرد پس از اجراهای مکرر. اگرچه مدلهای زبانی بهعنوان ناظر در مأموریتهای فضایی پیشنهاد شدهاند، رویکردهای موجود به پرسشهای ایستا و بدون تغییر متکی هستند که صرفنظر از نتایج یا تجربیات قبلی، ثابت باقی میمانند.
گاید رویکردی غیرپارامتری برای بهبود سیاست تصمیمگیری ارائه میدهد که امکان تطبیق بین اجراهای مختلف را بدون نیاز به بهروزرسانی وزنها یا بازآموزی مدل فراهم میکند. این فریمورک از دو بخش مکمل تشکیل شده است: یک مدل سبکوزن برای تصمیمگیری بلادرنگ و یک مکانیزم بازاندیشی آفلاین که مجموعهای ساختاریافته از قوانین تصمیمگیری بر اساس دادههای تجربی قبلی بهروزرسانی میکند.
پژوهشگران عملکرد گاید را در یک任务 مقابلهای در محیط شبیهسازی کربال اسپیس پرگرام (Kerbal Space Program) ارزیابی کردند. نتایج نشان داد رویکرد تکاملی این فریمورک بهطور مداوم از روشهای پایه ایستا بهتر عمل کرده و با کسب تجربه بیشتر، بهبود قابل اندازهگیری در کیفیت تصمیمگیری مشاهده شده است.
پیامدهای این تحقیق برای جامعه هوافضا و هوش مصنوعی قابل توجه است. عملیات فضایی شامل سناریوهای تصمیمگیری حساس و بلادرنگ هستند که شرایط آنها بهندرت دقیقاً تکرار میشود. روشهای سنتی مدلهای زبانی یک منطق تصمیمگیری ثابت را بدون توجه به نتایج قبلی اعمال میکنند، اما رویکرد گاید به سیستم اجازه میدهد بر اساس تجربیات تجمعی، مجموعه قوانین خود را اصلاح کند. این شیوه شبیه به نحوهای است که اپراتورهای انسانی از طریق بررسی مأموریتها و تمرین سناریوها، غریزههای بهتری توسعه میدهند.
نوآوری فنی اصلی این پژوهش در تبدیل تکامل زمینهای به جستجوی سیاست بر روی قوانین تصمیمگیری ساختاریافته نهفته است. این چارچوب به مجموعهای رو به رشد از پژوهشها میافزاید که نشان میدهند مدلهای زبانی میتوانند خروجیهای خود را نه تنها از طریق دستورالعملهای صریح، بلکه از طریق بازاندیشی نظامند بر عملکرد گذشته بهبود بخشند. پژوهشهای آینده برای اعتبارسنجی این یافتهها در سناریوهای مداری پیچیدهتر و ارزیابی سربار محاسباتی برای یکپارچهسازی در فضاپیماهای واقعی مورد نیاز است.

گفتگو