باید با این فرض که برای رسیدن به دقت بالاتر در بهینهسازیهای ترکیبی، پرداخت مالیاتی سنگین در قالب زمان محاسباتی لازم است، خداحافظی کنید. استنتاج سازگاری تصویر شده (Projected Consistency Inference یا PCI) ثابت کرد که میتوان بدون بازآموزی مدل، سرعت را به شدت افزایش داد و دقت را ارتقا بخشید.
در سالهای اخیر، حل مسئله فروشنده دورهگرد (Traveling Salesman Problem یا TSP) به سمت مدلهای زایندهای مانند مدلهای انتشار (Diffusion Models) و مدلهای سازگاری حرکت کرده است. همانطور که در تحلیلهای پیشین ما دربارهی بهینهسازیهای عصبی اشاره کردیم، چالش همیشگی، تضاد میان ماهیت گسستهی مسیرهای همیلتونی و فضای پیوستهی گرادیانها بوده است.
طبق گزارشی که در ۹ ژوئن ۲۰۲۶ در arxiv.org منتشر شد، چارچوب PCI به عنوان یک افزونهی آماده (Plug-and-play) عمل میکند و نیازی به بازآموزی ندارد. به نقل از مستندات این پژوهش، PCI به جای تکیه بر بازبینیهای گرانقیمت گرادیانی که در مدلهایی مثل FT2T دیده میشود، از دو گام کلیدی استفاده میکند:
• رمزگشایی مسیرهای همیلتونی معتبر از خروجیهای مدل سازگاری
• اعمال یک جستجوی محلی سبکوزن 2-opt
بر اساس دادههای این گزارش، نتایج در دو مقیاس کلیدی چنین است:
- TSP-500: کاهش شکاف بهینگی به ۰.۱۷ درصد (در مقایسه با ۰.۲۲ درصد در FT2T)
- TSP-1000: رسیدن به شکاف بهینگی ۰.۳۱ درصد (در مقایسه با ۰.۳۶ درصد در FT2T)
- سرعت: کاهش ۳۰ تا ۴۰ درصدی زمان استنتاج (Inference) در کنار کاهش مصرف حافظه و واریانس.
این تحول نشان میدهد که عملیاتهای آگاه از ساختار (Structure-aware) در زمان استنتاج، بسیار مؤثرتر از تلاش برای تحمیل نزول گرادیان پیوسته به یک مسئلهی گسسته هستند. در واقع، محدودیتهای ساختاری سبکوزن میتوانند نتایجی بهتر از اهداف پیچیده در زمان آموزش یا بازبینیهای سنگین گرادیانی ارائه دهند.
گام بعدی شما
- پژوهشگران باید منطق تصویرسازی PCI را روی سایر مسائل سخت (NP-hard) فراتر از TSP آزمایش کنند.
- بررسی امکان ادغام این محدودیتهای ساختاری در تابع زیان (Loss Function) برای کاهش بیشتر شکاف بهینگی.
اما اثر این بهینهسازیها بر سختافزارهای نسل بعد حتی تکاندهندهتر است؛ به تحلیل ما دربارهی تراشههای Blackwell مراجعه کنید.
گفتگو