اگر در حال تنظیم کنترلکنندههای صنعتی پیچیده هستید، باید بدانید که گلوگاه اصلی نه در قدرت بهینهسازها، بلکه در نقطه شروع آنهاست. تصور کنید بتوانید زمان آزمون و خطا در محیطهای صنعتی را به جای هفتهها، به چند روز کاهش دهید.
طبق مطالعهای که در ۱۰ ژوئن ۲۰۲۶ توسط پژوهشکری به نام یانگ شو (Yang Shu) منتشر شد، مدلهای زبانی بزرگ (LLM) باز-وزن، در تنظیم سیستمهای صنعتی ۳x۳ توانستهاند تعداد ارزیابیهای مورد نیاز را تا ۶ برابر کاهش دهند. نکته کلیدی این است که این مدلها نه با محاسبات عددی، بلکه از طریق استدلال درباره جفتشدگی ساختاری در فرآیندهای چندورودی-چندخروجی (MIMO) عمل میکنند.
همانطور که در پوشش پیشین ما دربارهی امنیت مدلهای بازمتن اشاره کردیم، انعطافپذیری این مدلها در محیطهای محلی (On-premise) یک مزیت استراتژیک است. تنظیم فرآیندهای جفتشده صنعتی به دلیل تعاملات حلقهای، چشماندازهای غیرمحدب (Non-convex) ایجاد میکند که در آن بهینهسازیهای محلی اغلب متوقف میشوند.
بر اساس مستندات این پژوهش، مدلها در برابر روشهای کلاسیک relay-feedback و بهینهسازهای جهانی با استفاده از یک راکتور تانک همزن مداوم (CSTR) و سیستم چهار-تانک مورد سنجش قرار گرفتند. یافتههای فنی به شرح زیر است:
- در حلقههای ساده، روشهای کلاسیک با IAE معادل ۰.۱۰۶ برتری داشتند، در حالی که مقدار LLM برابر ۰.۱۶۲ بود.
- در سیستمهای شدیداً جفتشده، بهینهسازهای محلی در ۱۰ مورد از ۱۰ اجرا شکست خوردند، اما یک LLM با ساختارپذیری (Scaffolded)، ساختاری نامتقارن پیشنهاد داد که به هزینه جریمهشده (J) حدود ۱۶.۹ رسید.
- وقتی پیشنهاد LLM توسط یک بهینهساز کلاسیک پالایش شد، در ۱۰۰٪ آزمایشها به بهینه جهانی (Global Optimum) با J حدود ۱۲.۰ دست یافت.
- مدل زبانی تنها با ۱۸ ارزیابی، کنترلکنندهی کاربردی ارائه داد؛ در حالی که بهینهسازهای جهانی مانند تکامل تفاضلی (Differential Evolution) به نمونههای بسیار بیشتری نیاز داشتند.
این نتیجه، این فرض فنی را که LLMها باید به عنوان بهینهسازهای سرتاسری (End-to-End) عمل کنند تا مفید باشند، میشکند. در واقع، مدل زبانی در اینجا به عنوان یک پیشفرض ساختاری (Structural Prior) کارآمد و تفسیرپذیر عمل میکند که بر اساس استدلال فیزیکی، یک «حدس اولیه» باکیفیت ارائه میدهد. این رویکرد به مهندسان اجازه میدهد نقاط شکست بهینهسازی عددی را دور بزنند و در عین حال دقت روشهای کلاسیک را حفظ کنند.
گام بعدی شما
- بررسی قابلیت مقیاسپذیری این پیشفرضهای ساختاری برای سیستمهای فراتر از ابعاد ۳x۳.
- مطالعه روی تقطیر (Distillation) این توانایی استدلالی در مدلهای زبانی کوچک (SLM) برای تنظیمات آنی روی دستگاه (On-device).
- تست ترکیب مدلهای باز-وزن با بهینهسازهای کلاسیک در محیطهای شبیهسازی شده صنعتی.
اما داستان سختافزاری اجرای این مدلها در لبههای صنعتی حتی پیچیدهتر است؛ به تحلیل ما دربارهی تراشههای تخصصی استنتاج مراجعه کنید.


گفتگو