گلوگاه زبانی در استدلال مدلهای زبانی بزرگ (LLM) در حال فروپاشی است. تصور کنید مدلی که بدون تلف کردن حتی یک توکن برای کلمات میانی، مستقیماً و با دقت بسیار بالاتر به پاسخ نهایی میرسد.
بر اساس مستندات منتشرشده، مدلهای فعلی برای رسیدن به پاسخهای پیچیده مجبور به تولید متنهای میانی هستند تا گامهای منطقی خود را پیش ببرند. همانطور که در تحلیلهای پیشین ما دربارهی مدلهای استدلالی (Reasoning Models) اشاره کردیم، این وابستگی به توکنها باعث ایجاد یک تنگنای استنتاجی میشود؛ زیرا هر «فکر» باید به صورت زنجیرهای از توکنها پردازش و رمزگشایی شود.
در ۱۶ ژوئن ۲۰۲۶، چارچوب Latent Thought Flow (LTF) معرفی شد تا این مشکل را حل کند. طبق گزارش پژوهشگران در arxiv.org، این سیستم بهجای تولید متن، استدلال را به شکل مسیرهای پیوسته با طول متغیر مدلسازی میکند. این معماری از یک GFlowNet پیوسته با گذارهای پنهان استوکاستیک استفاده میکند.
برای غلبه بر مشکل نظارت پراکنده (Sparse Supervision)، نویسندگان دو سازوکار کلیدی را معرفی کردهاند:
- یک هدف «توازن زیرمسیر با وزندهی انتروپی» برای پاداشهای میانی.
- یک منظمکننده «پیشفرض مرجع» (Reference-prior regularizer) برای مهار اکتشاف مدل.
این مکانیسمها به مدل اجازه میدهند تا کیفیت پاسخ و هزینه محاسبات را بهطور همزمان بهینه کند. در آزمایشهای رودررو، LTF دقت را ۹.۵٪ افزایش و طول استدلال را ۲۷.۲٪ نسبت به مدلهای پایه کاهش داد.
این تحول، فرض رایج مبنی بر «الزامی بودن خواناییِ انسانی برای اثربخشی استدلال» را به چالش میکشد. LTF ثابت میکند که استدلال «ساکت» یا پنهان، میتواند دقیقتر و بهینهتر از زنجیره تفکر (Chain-of-Thought) متنی باشد.
گام بعدی شما
- دنبال کردن پژوهشهای مربوط به تقطیری کردن (Distillation) مسیرهای پیوسته برای استقرار در مدلهای کوچک روی دستگاه (On-device).
- بررسی جایگزینی نمونهبرदारों (Samplers) سنتی با نمونهبرदारों مبتنی بر GFlowNet در موتورهای استنتاج تولیدی.
اما اثر این بهینهسازی بر بهرهوری سختافزاری حتی شگفتانگیزتر است؛ برای درک تغییرات در لایهی زیرساختی، به تحلیل ما دربارهی تراشههای Blackwell مراجعه کنید.




گفتگو