چطور اصل بهینه‌سازی مشترک، سرعت تولید داده‌های جدولی را افزایش می‌دهد؟

آیا می‌توان منطق گسستهٔ تصمیم‌گیری را به عنوان یک جریان پیوسته مدل کرد؟ یک چارچوب ریاضی جدید که توسط سای نیرانجان راماچانداران (Sai Niranjan Ramachandran) و سووریت اسرا (Suvrit Sra) توسعه یافته است، ثابت می‌کند که درخت‌های تصمیم (Decision Tree) سلسله‌مراتب و مدل‌های انتشار (Diffusion Model) در رژیم‌های حدی خاص، از نظر عملکردی معادل هستند.

به نقل از مقاله این پژوهش که برای چهل و سومین کنفرانس بین‌المللی یادگیری ماشین (ICML) ۲۰۲۶ پذیرفته شده است، این کشف دیدگاه پژوهشگران را نسبت به ساختارهای داده تغییر می‌دهد. برای سال‌ها، جامعهٔ یادگیری ماشین با درخت‌های تقویت‌شدهٔ گرادیان به عنوان استاندارد طلایی برای داده‌های جدولی و مدل‌های انتشار را به عنوان نقطه اوج هوش مصنوعی زاینده (Generative AI) می‌شناخت.

همان‌طور که در تحلیل‌های پیشین ما درباره‌ی تضاد میان مدل‌های نمادین و اتصال‌گرایان اشاره کردیم، این شکاف همواره یک چالش بود. اما اکنون نویسندگان فاش می‌کنند که هر دو معماری بر پایه یک اصل بهینه‌سازی مشترک به نام تطبیق امتیاز مسیر جهانی (Global Trajectory Score Matching یا GTSM) استوارند. این رویکرد بهینه‌سازی امتیازها، یادآور متدهای پیشرفته‌ای است که در مدل INFUSER برای جایگزینی سختی مسئله با امتیاز تأثیر به کار رفته‌اند تا بازدهی آموزش مدل‌ها افزایش یابد. بر اساس یافته‌های این محققان، تقویت گرادیان در واقع برای این اصل مشترک، بهینگی مجانبی دارد.

درخت‌ها به جریان‌ها و بازگشت: یکپارچه‌سازی درخت‌های تصمیم و مدل‌های انتشار

طبق مستندات پژوهش، این یافته در قالب دو پیاده‌سازی فنی ارائه شده است:

TreeFlow: یک مدل مولد برای داده‌های جدولی که کیفیت رقابتی را با دقت بالاتر و سرعت محاسباتی ۲ برابر بیشتر نسبت به مدل‌های پایه به دست می‌آورد.
DSMTree: یک متد تقطیر (Distillation) که برای انتقال مستقیم منطق تصمیم‌گیری سلسله‌مراتب به شبکه‌های عصبی (Neural Network) طراحی شده است.

در آزمون‌های محک، DSMTree توانست عملکرد مدل معلم را با حاشیه خطای تنها ۲٪ بازتولید کند. جزئیات کامل این ادعاها در یک مقاله اصلی ۱۲ صفحه‌ای و یک پیوست مفصل ۶۸ صفحه‌ای که در ۲۲ ژوئن ۲۰۲۶ در arXiv منتشر شد، در دسترس است.

این یکپارچه‌سازی این فرض را می‌شکند که منطق نمادین گسسته و گرادیان‌های عصبی پیوسته اساساً از هم جدا هستند. برای متخصصان، این به معنای امکان تزریق تفسیرپذیری و منطق ساختارمند درخت‌های تصمیم به معماری‌های منعطف و ظرفیت بالای مدل‌های انتشار است، بدون آنکه عملکرد مدل کاهش یابد. توسعه‌دهندگان با بهینه‌سازی از طریق GTSM می‌توانند زمان آموزش مولدهای جدولی را کاهش دهند و در عین حال مرزهای تصمیم‌گیری سخت‌گیرانه‌ای که در جنگل‌های تصادفی (Random Forest) یا XGBoost دیده می‌شود را حفظ کنند.

گام بعدی شما

بررسی فایل PDF کامل در arXiv برای پیاده‌سازی GTSM در خط‌لوله‌های داده خود.
ارزیابی جایگزینی مدل‌های فعلی تولید داده‌های جدولی با TreeFlow برای افزایش سرعت استنتاج.
مطالعه روی ادغام منطق‌های گسسته در مدل‌های انتشار برای بهبود تفسیرپذیری خروجی‌ها.

اما تأثیر این رویکرد بر کاهش هزینه‌های محاسباتی در مقیاس کلان حتی تعیین‌کننده‌تر است؛ به تحلیل ما درباره‌ی بهینه‌سازی‌های لایه استنتاج مراجعه کنید.

این گزارش با خط‌لولهٔ خودکار دات‌هوش از منابع معتبر جهانی تدوین و زیر نظر تحریریه منتشر شده است. روش کار ما

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

اخبار روزانه، معرفی ابزارها و مدل‌ها، و آموزشِ کار با هوش مصنوعی؛ همیشه با این پرسش که از ایران چه چیزی کار می‌کند و چه چیزی نه.

درخت‌ها به جریان‌ها و بازگشت: یکپارچه‌سازی درخت‌های تصمیم و مدل‌های انتشار

طبق مستندات پژوهش، این یافته در قالب دو پیاده‌سازی فنی ارائه شده است:

TreeFlow: یک مدل مولد برای داده‌های جدولی که کیفیت رقابتی را با دقت بالاتر و سرعت محاسباتی ۲ برابر بیشتر نسبت به مدل‌های پایه به دست می‌آورد.
DSMTree: یک متد تقطیر (Distillation) که برای انتقال مستقیم منطق تصمیم‌گیری سلسله‌مراتب به شبکه‌های عصبی (Neural Network) طراحی شده است.

گام بعدی شما

بررسی فایل PDF کامل در arXiv برای پیاده‌سازی GTSM در خط‌لوله‌های داده خود.
ارزیابی جایگزینی مدل‌های فعلی تولید داده‌های جدولی با TreeFlow برای افزایش سرعت استنتاج.
مطالعه روی ادغام منطق‌های گسسته در مدل‌های انتشار برای بهبود تفسیرپذیری خروجی‌ها.

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

چطور اصل بهینه‌سازی مشترک، سرعت تولید داده‌های جدولی را افزایش می‌دهد؟

گام بعدی شما

منابع

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

چطور اصل بهینه‌سازی مشترک، سرعت تولید داده‌های جدولی را افزایش می‌دهد؟

گام بعدی شما

منابع

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

چطور اصل بهینه‌سازی مشترک، سرعت تولید داده‌های جدولی را افزایش می‌دهد؟

گام بعدی شما

منابع

مقاله‌های مرتبطهمه ←

سرمایه‌گذاری سری B: ۳۱۰ میلیون دلار برای شبیه‌سازی فیزیک در Odyssey

هگینگ‌فیس با استاندارد ARD جست‌وجوی ابزارها برای عامل‌ها را خودکار کرد

«پیش‌بینی مسیر از طریق متن»؛ دستاورد جدید مؤسسه AllenAI در فضای سه‌بعدی

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

چطور اصل بهینه‌سازی مشترک، سرعت تولید داده‌های جدولی را افزایش می‌دهد؟

گام بعدی شما

منابع

مقاله‌های مرتبطهمه ←

سرمایه‌گذاری سری B: ۳۱۰ میلیون دلار برای شبیه‌سازی فیزیک در Odyssey

هگینگ‌فیس با استاندارد ARD جست‌وجوی ابزارها برای عامل‌ها را خودکار کرد

«پیش‌بینی مسیر از طریق متن»؛ دستاورد جدید مؤسسه AllenAI در فضای سه‌بعدی

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

راهنمای فارسی هوش مصنوعی — با نگاه به ایران