تصور کنید بتوانید مدل تشخیص شیء خود را ۲۰ درصد سبکتر کنید، بدون اینکه حتی یک درصد از دقت آن قربانی شود. اگر هنوز از معماریهای کلاسیک برای فشردهسازی مدلها استفاده میکنید، باید بدانید که قواعد بازی در حال تغییر است.
طبق اعلام پژوهشگران در مقالهای که در ۳۰ آوریل ۲۰۲۶ در arxiv.org منتشر شد، مدل QYOLO توانسته است با جایگزینی گلوگاههای کلاسیک و سنگین، پارامترهای مدل را به شدت کاهش دهد. این رویکرد بر پایه استفاده از میکسینگ الهامگرفته از کوانتوم است که اجازه میدهد مدلها با ساختاری بسیار مینیمال، همان خروجیهای دقیق را تولید کنند.
{{img:0}}
نوآوری اصلی این مدل، معرفی QMixBlock است. این بلوک جایگزین دو مورد از عمیقترین ماژولهای C2f در ستون فقرات (Backbone) مدل در مراحل P4/16 و P5/32 میشود. بر اساس مستندات این پژوهش، این بلوک از یک مکانیسم میکسینگ سینوسی برای بازتنظیم کانالها در سطح جهانی استفاده میکند. با به اشتراکگذاری پارامترهای یادگیرنده در هر دو مرحله، مدل میتواند اهمیت کانالها را بدون نیاز به مجموعههای مستقل از پارامترها، بهطور سازگار اعمال کند.
ارزیابیهای انجامشده روی بنچمارک VisDrone2019 نتایج خیرهکنندهای را نشان میدهد:
- QYOLOv8n: تعداد پارامترها از ۳.۰۱ میلیون به ۲.۴۰ میلیون رسید (کاهش ۲۰.۲ درصدی) و GFLOPs (عملیات ضرب و جمع اعشاری) ۱۲.۳ درصد کاهش یافت، در حالی که افت دقت تنها ۰.۴ واحد بود.
- QYOLOv8s: کاهش ۲۱.۸ درصدی پارامترها با افت بسیار ناچیز ۰.۱ واحد.
- بازیابی دقت: با ترکیب این روش و تقطیر دانش (Knowledge Distillation)، پژوهشگران توانستند دقت مدل را بدون هیچ هزینه اضافی در فشردهسازی، به سطح کامل بازگردانند.
همانطور که در تحلیلهای پیشین ما دربارهی بهینهسازی مدلهای رایانش لبه (Edge Computing) اشاره کردیم، چالش اصلی همیشه توازن بین سرعت و دقت بوده است. QYOLO با هدف قرار دادن مقیاس درجهدوم عرض کانال در مراحل عمیق، سربار محاسباتی را به شدت کاهش میدهد.
{{img:1}}
این معماری ثابت میکند که ساختارهای ریاضی الهامگرفته از کوانتوم میتوانند بهطور مؤثری افزونگیها را در مدلهای بینایی حذف کنند. با افزایش تقاضا برای بهرهوری در دستگاههای لبه، این چرخش به سمت میکسینگ غیرکلاسیک احتمالاً بهزودی از صفحات مقالات پژوهشی به محصولات تجاری هوش مصنوعی موبایلی منتقل خواهد شد.
اما آیا این رویکرد در مدلهای بزرگتر و ترنسفورمر-محور هم جواب میدهد؟ پاسخ این پرسش در گزارشهای آینده ما نهفته است.
گام بعدی شما
- اگر روی مدلهای YOLOv8 کار میکنید، ساختار QMixBlock را برای کاهش حافظه در استنتاج (Inference) بررسی کنید.
- برای بازیابی دقت در مدلهای فشرده، از تکنیکهای تقطیر دانش استفاده کنید.
- بررسی کنید که آیا مدلهای شما در مراحل P4 و P5 دچار سربار محاسباتی بیش از حد هستند یا خیر.
گفتگو