آیا میتوان منطق گسستهٔ تصمیمگیری را به عنوان یک جریان پیوسته مدل کرد؟ یک چارچوب ریاضی جدید که توسط سای نیرانجان راماچانداران (Sai Niranjan Ramachandran) و سووریت اسرا (Suvrit Sra) توسعه یافته است، ثابت میکند که درختهای تصمیم (Decision Tree) سلسلهمراتب و مدلهای انتشار (Diffusion Model) در رژیمهای حدی خاص، از نظر عملکردی معادل هستند.
به نقل از مقاله این پژوهش که برای چهل و سومین کنفرانس بینالمللی یادگیری ماشین (ICML) ۲۰۲۶ پذیرفته شده است، این کشف دیدگاه پژوهشگران را نسبت به ساختارهای داده تغییر میدهد. برای سالها، جامعهٔ یادگیری ماشین با درختهای تقویتشدهٔ گرادیان به عنوان استاندارد طلایی برای دادههای جدولی و مدلهای انتشار را به عنوان نقطه اوج هوش مصنوعی زاینده (Generative AI) میشناخت.
همانطور که در تحلیلهای پیشین ما دربارهی تضاد میان مدلهای نمادین و اتصالگرایان اشاره کردیم، این شکاف همواره یک چالش بود. اما اکنون نویسندگان فاش میکنند که هر دو معماری بر پایه یک اصل بهینهسازی مشترک به نام تطبیق امتیاز مسیر جهانی (Global Trajectory Score Matching یا GTSM) استوارند. این رویکرد بهینهسازی امتیازها، یادآور متدهای پیشرفتهای است که در مدل INFUSER برای جایگزینی سختی مسئله با امتیاز تأثیر به کار رفتهاند تا بازدهی آموزش مدلها افزایش یابد. بر اساس یافتههای این محققان، تقویت گرادیان در واقع برای این اصل مشترک، بهینگی مجانبی دارد.

طبق مستندات پژوهش، این یافته در قالب دو پیادهسازی فنی ارائه شده است:
- TreeFlow: یک مدل مولد برای دادههای جدولی که کیفیت رقابتی را با دقت بالاتر و سرعت محاسباتی ۲ برابر بیشتر نسبت به مدلهای پایه به دست میآورد.
- DSMTree: یک متد تقطیر (Distillation) که برای انتقال مستقیم منطق تصمیمگیری سلسلهمراتب به شبکههای عصبی (Neural Network) طراحی شده است.
در آزمونهای محک، DSMTree توانست عملکرد مدل معلم را با حاشیه خطای تنها ۲٪ بازتولید کند. جزئیات کامل این ادعاها در یک مقاله اصلی ۱۲ صفحهای و یک پیوست مفصل ۶۸ صفحهای که در ۲۲ ژوئن ۲۰۲۶ در arXiv منتشر شد، در دسترس است.
این یکپارچهسازی این فرض را میشکند که منطق نمادین گسسته و گرادیانهای عصبی پیوسته اساساً از هم جدا هستند. برای متخصصان، این به معنای امکان تزریق تفسیرپذیری و منطق ساختارمند درختهای تصمیم به معماریهای منعطف و ظرفیت بالای مدلهای انتشار است، بدون آنکه عملکرد مدل کاهش یابد. توسعهدهندگان با بهینهسازی از طریق GTSM میتوانند زمان آموزش مولدهای جدولی را کاهش دهند و در عین حال مرزهای تصمیمگیری سختگیرانهای که در جنگلهای تصادفی (Random Forest) یا XGBoost دیده میشود را حفظ کنند.
گام بعدی شما
- بررسی فایل PDF کامل در arXiv برای پیادهسازی GTSM در خطلولههای داده خود.
- ارزیابی جایگزینی مدلهای فعلی تولید دادههای جدولی با TreeFlow برای افزایش سرعت استنتاج.
- مطالعه روی ادغام منطقهای گسسته در مدلهای انتشار برای بهبود تفسیرپذیری خروجیها.
اما تأثیر این رویکرد بر کاهش هزینههای محاسباتی در مقیاس کلان حتی تعیینکنندهتر است؛ به تحلیل ما دربارهی بهینهسازیهای لایه استنتاج مراجعه کنید.




گفتگو