اگر از سیستمهای تشخیص ناهنجاری بدون نظارت استفاده میکنید، احتمالاً مدل شما در حال یادگیری همان خطاهایی است که باید آنها را شناسایی کند. این نقص ساختاری باعث میشود مدلها در محیط واقعی، ناهنجاریها را به اشتباه به عنوان «الگوهای نرمال» بپذیرند و دقت خود را از دست بدهند.
این مشکل زمانی رخ میدهد که تعریف دادههای نرمال بین مرحله آموزش و استقرار تغییر میکند. همانطور که در تحلیلهای پیشین ما دربارهی رانش مفهومی (Concept Drift) در یادماشین اشاره کردیم، مدلهای ایستا نمیتوانند با تغییرات محیطی سازگار شوند. در نتیجه، توسعهدهندگان یا باید با یک مدل سختگیرانه که الگوهای جدید نرمال را نمیشناسد کنار بیایند، یا از تطبیق زمان تست (Test-Time Adaptation) استفاده کنند که ریسک «آلودگی» مدل را به شدت افزایش میدهد.
به نقل از مقالهای که در ۱۲ مه ۲۰۲۶ در arXiv منتشر شد، چارچوب RTTAD برای حل این چالش از یک سازوکار دو مرحلهای استفاده میکند:
- مرحله آموزش: استفاده از یادگیری مشترک دو-وظیفهای (Collaborative Dual-Task Learning) برای ایجاد یک پیشفرض مقاوم از دادههای نرمال.
- مرحله تست: پیادهسازی ماژول یادگیری تقابلی زمان تست (TTCL) که تنها نمونههای «شبه-نرمال» با اطمینان بالا را برای بهروزرسانی مدل انتخاب میکند.
- پالایش توزیع: بهکارگیری یک هدف تقابلی مبتنی بر k-nearest neighbor (k-NN) برای دقیقتر کردن بردار معنایی (Embedding) دادهها.
بر اساس مستندات این پژوهش، این رویکرد توانسته است در ۱۵ مجموعه داده جدولی مختلف، عملکرد پیشرو یا SOTA را به دست آورد. این تحول، فرض قدیمی مبنی بر ریسک ذاتی تطبیق زمان تست در وظایف بدون نظارت را میشکند. RTTAD با تبدیل فرآیند تطبیق از یک بهینهسازی کور به یک مسئله مدیریت ریسک، اجازه میدهد مدلها در محیط عملیاتی تکامل یابند بدون اینکه قدرت تشخیص خود را از دست بدهند.
گام بعدی شما
- بررسی امکان ادغام لایه فیلترینگ RTTAD در سیستمهای نظارت بر زیرساختهای ابری.
- ارزیابی اثرگذاری یادگیری تقابلی (Contrastive Learning) بر کاهش نرخ مثبت کاذب در دادههای مالی.
- مطالعه قابلیت مقیاسپذیری این روش برای دادههای سری زمانی با ابعاد بالا.
اما چالش بعدی، پیادهسازی این مدل در جریانهای دادهای زنده است — به بررسی ما درباره معماریهای Streaming مراجعه کنید.




گفتگو