برچسبگذاری دستی کادرهای محدودکننده (Bounding Boxes) یکی از گرانترین مراحل در خط لولهی بینایی ماشین است. اما تصور کنید بتوانید بدون تغییر در معماری مدل، حجم دادههای مورد نیاز برای آموزش را به شدت کاهش دهید.
این تحول در حالی رخ میدهد که صنعت به سوی بهینهسازیهای «پویا» و مستقل از معماری حرکت میکند. همانطور که در تحلیل قبلی ما دربارهی استفاده از آنتروپی توجه (Attention Entropy) برای اصلاح تشخیص اشیاء کوچک اشاره کردیم، هدف نهایی حذف نیاز به بازآموزیهای هزینهبر است.
طبق مقالهای که در ۱۱ می ۲۰۲۶ در arxiv.org منتشر شد، چارچوب Portable Active Learning (PAL) با تکیه بر خروجیهای استنتاج (Inference) عمل میکند. این سیستم از یک فرآیند دو مرحلهای بهره میبرد: ابتدا طبقهبندیکنندههای لجستیکی سبکوزن برای تفکیک مثبتهای واقعی از مثبتهای کاذب آموزش میبینند تا امتیازات عدم قطعیت مبتنی بر آنتروپی تولید کنند. در مرحله دوم، این کاندیدها با استفاده از معیارهای زیر پالایش میشوند:
- آنتروپی جهانی تصویر
- تنوع کلاسی
- شباهت تصویری
این رویکرد بر روی مجموعهدادههای COCO، PASCAL VOC و BDD100K اعتبارسنجی شده است. به نقل از نویسندگان مقاله، این متد بهبودهای مستمری در بهرهوری برچسبگذاری و دقت تشخیص نسبت به خطهای cơ bản (Baselines) موجود ایجاد کرده است.
این رویکرد، پارادایم یادگیری فعال (Active Learning) را از «وابسته به مدل» به «وابسته به خروجی» تغییر میدهد. برای تیمهای فنی، این یعنی خط لولهی انتخاب داده اکنون از معماری آشکارساز (Detector) جدا شده است؛ بنابراین میتوان مدل را از یک نسخهی قدیمی به یک مدل پیشرو ارتقا داد، بدون آنکه نیاز باشد روش انتخاب دادههای آموزشی را از ابتدا طراحی کرد.
گام بعدی شما
- بررسی قابلیت مقیاسپذیری PAL در جریانهای ویدئویی زنده (Real-time Video Streams).
- ارزیابی اثر ثبات زمانی (Temporal Consistency) بر دقت انتخاب دادهها.
- تست جایگزینی متدهای فعلی انتخاب داده با PAL در پروژههای بینایی ماشین.
ama داستان سختافزاری این تحول حتی شگفتانگیزتر است — به تحلیل ما دربارهی زیرساختهای پردازشی لبه مراجعه کنید.




گفتگو