اگر برای پیشبینی تقاضای محصولات جدید به مدلهای بنیادی تکیه میکنید، باید بدانید که این مدلها در مواجهه با دادههای صفر (Cold-Start) اساساً ناکارآمد هستند. در واقع، تقریباً تمام مدلهای فعلی پیشبینی سری زمانی در این سناریوها با شکست مواجه میشوند چون برای یافتن همبستگیها، لزوماً به یک پنجره تاریخچه نیاز دارند.
این محدودیت، گلوگاه اصلی صنایعی مانند تجارت الکترونیک و بازارهای مالی است که هر روز با داراییها یا محصولات جدیدی روبهرو هستند. همانطور که در تحلیلهای پیشین ما دربارهی مدلهای بنیادی (Foundation Models) اشاره کردیم، وابستگی شدید به دادههای گذشته، انعطافپذیری این مدلها را در محیطهای پویا بهشدت کاهش میدهد. به همین دلیل، چارچوب RAID (Retrieval-Augmented Iterative Diffusion) با تغییر محوریت از «وابستگی به توالی» به «وابستگی معنایی»، این شکاف را پر میکند.
بر اساس مستندات پژوهشی منتشرشده در ۱۶ ژوئن ۲۰۲۶، سیستم RAID از طریق یک خط لوله چندمرحلهای عمل میکند:
- نگاشت معنایی: استفاده از یک مدل بردار معنایی (Embedding) چندزبانه و ثابت برای انتقال متادیتای متنی به یک فضای مشترک.
- ساخت گراف استقرایی: ایجاد یک گراف بازیابی که به مدل اجازه میدهد با شناسایی همسایگان مرتبط از نظر معنایی، برای آیتمهای دیدهنشده تعمیم یابد.
- پالایش تکرارشونده: تولید یک پیشبینی پایه از طریق تجمیع همسایگان و سپس بهکارگیری یک ماژول مدل انتشار (Diffusion Model) گیتشده برای مدلسازی عدم قطعیتهای باقیمانده.
طبق اعلام پژوهشگران، این معماری به دلیل استفاده از فرآیند رمزگشایی غیرخودگردان (non-autoregressive)، تأخیر در استنتاج (Inference) را در مقایسه با مدلهای پایه، یک مرتبه بزرگی (order of magnitude) کاهش داده است.
برای جامعه فنی، این دستاورد به معنای تغییر معیار سنجش پیشبینی است: طول تاریخچه دیگر پیششرط اصلی کیفیت نیست. همچنین قابلیت انتقال متقاطع زبانی (zero-shot cross-lingual transfer) باعث میشود مدلی که با توصیفات انگلیسی آموزش دیده، بتواند پیشبینیهای دقیقی برای آیتمهایی با توصیفات به زبانهای دیگر ارائه دهد.
گام بعدی شما
- بررسی جایگزینی مدلهای خودگردان با مدلهای مبتنی بر انتشار در محیطهای با نوسان بالا.
- ارزیابی کیفیت متادیتای متنی محصولات خود برای بهبود نتایج بازیابی معنایی.
- تست قابلیتهای انتقال زبانی RAID برای بازارهای جهانی.
اما داستان بهینهسازی سختافزاری برای این مدلها حتی پیچیدهتر است؛ در تحلیلهای آتی، اثر این معماری بر مصرف حافظه GPU را بررسی خواهیم کرد.




گفتگو