در پلتفرمهای تبلیغات آنلاین، تبلیغات تازهمعرفیشده اغلب با مشکل شروع سرد مواجه میشوند. دلیل؟ دادههای کافی از بازخورد کاربران برای آموزش مدل وجود ندارد.
LLM-HYPER راهکاری متفاوت ارائه میدهد. این سیستم، مدلهای زبانی بزرگ (Large Language Models) را بهعنوان ابرشبکه (Hypernetwork) بهکار میگیرد. هدف؟ تولید مستقیم پارامترهای تخمینگر نرخ کلیک (CTR) بدون نیاز به فرآیند آموزش سنتی.
{{img:0}}
چارچوب کاری از روش چAIN-OF-THOUGHT (زنجیره تفکر) با شاتهای اندک استفاده میکند. ورودیها شامل محتوای چندوجهی تبلیغات هستند: متن و تصویر. سیستم وزنهای مدل ویژگیمحور را برای پیشبین خطی CTR استنتاج میکند. نتیجه؟ تطبیق سریع برای کمپینهای جدید.
روش کار به این صورت است: سیستم کمپینهای مشابه گذشته را با استفاده از جاسازیهای CLIP (یک مدل مقایسه تصویر و متن) بازیابی میکند. سپس آنها را بهصورت نمونههای پرامپتمحور قالببندی میکند. این کار به LLM اجازه میدهد درباره قصد مشتری، تأثیر ویژگیها و ارتباط محتوا استدلال کند.
برای اطمینان از پایداری عددی و آمادگی تولید، چارچوب از تکنیکهای نرمالسازی و کالیبراسیون استفاده میکند. این تکنیکها وزنهای تولیدشده را با توزیعهای واقعی CTR هماهنگ میکنند.
آزمایشهای آفلاین گسترده نشان دادهاند که LLM-HYPER بهطور قابلتوجهی از خطوط پایه شروع سرد بهتر عمل میکند. بهبود ۵۵.۹ درصدی در NDCG@10 ثبت شده است.
تست A/B آنلاین در یک پلتفرم تجارت الکترونیک پیشرو آمریکایی عملکرد قوی را تأیید کرده است. دورههای شروع سرد بهشدت کاهش یافتهاند. سیستم با موفقیت در تولید مستقر شده و نقطه عطفی مهم در شخصیسازی تبلیغات مبتنی بر هوش مصنوعی محسوب میشود.

گفتگو