تصور کنید برنامهای داشته باشید که هوشمندی یک شبکه عصبی را دارد، اما با سرعت یک کد سادهی C++ اجرا میشود. اگر هنوز برای بهینهسازیهای پیچیده به استنتاج مدلهای زبانی در زمان اجرا متکی هستید، باید بدانید که دوران «مدل به عنوان موتور» در حال گذار به «مدل به عنوان معمار» است.
به نقل از مقالهای که در ۱۱ می ۲۰۲۶ منتشر شد، گوئوکیانگ لی (Guoqiang Li) و تیمش چارچوبی را معرفی کردهاند که میتواند بهینهسازی ترکیبی (Combinatorial Optimization) را بدون نیاز به سختافزارهای گرانقیمت در لحظهی اجرا، مدیریت کند. همانطور که در تحلیلهای پیشین ما دربارهی ادغام سیستمهای نمادین و عصبی اشاره کردیم، چالش همیشگی، تضاد میان انعطافپذیری مدلهای عصبی و سرعت کدهای استاتیک بوده است.
طراحی الگوریتمهای اکتشافی با استفاده از مدلهای زبانی بزرگ (LLM) معمولاً با مشکل «بازخورد تأخیری» روبروست؛ یعنی سیستم تنها پس از پایان کامل فرآیند میفهمد که برنامه موفق بوده یا نه. این موضوع باعث ایجاد پاداشهای پراکنده میشود و یادگیری مدل را دشوار میکند. طبق اعلام تیم پژوهشی، سازوکار جدید برای حل این مشکل به شرح زیر است:
- استفاده از سیاستهای بهینهسازیشده (Learned Optimization Policies) به عنوان معلمان رفتاری.
- استعلام وضعیتهای خاص از مدل معلم در حین اجرای برنامههای کاندید.
- تبدیل ترجیحات مدل معلم به بازخوردهای محلی برای هدایت جستوجوی تکاملی.
- تولید برنامههای استاتیک و اجرایی که در زمان استقرار، نیاز به استنتاج (Inference) عصبی ندارند.
این رویکرد در بنچمارکهای مربوط به زمانبندی، مسیریابی و بهینهسازی گراف، عملکرد بهتری نسبت به مدلهای پایه LLM داشته است. در واقع، هوشمندی مدل عصبی در مرحلهی تکامل «تزریق» شده و در نهایت، آنچه اجرا میشود یک کد سریع و سبک است.
گام بعدی شما
- بررسی امکان استفاده از این متد برای تبدیل مدلهای تخصصی به توابع ریاضی سریع.
- تحلیل مقیاسپذیری این رویکرد در وظایف مهندسی نرمافزار که بازخوردهای انتهایی در آنها پراکنده است.
- رصد پیشرفتهای مشابه در زمینه تقطیر دانش (Knowledge Distillation) از مدلهای استدلالی به کدهای سخت.
اما داستان سختافزاری این تحول حتی شگفتانگیزتر است؛ اثر این حذف استنتاج بر کاهش نیاز به GPUهای لبه را در گزارش بعدی بررسی خواهیم کرد.
گفتگو