QYOLO: جادوی میکسینگ کوانتومی برای حذف ۲۰ درصدی پارامترهای YOLOv8

تصور کنید بتوانید مدل تشخیص شیء خود را ۲۰ درصد سبک‌تر کنید، بدون اینکه حتی یک درصد از دقت آن قربانی شود. اگر هنوز از معماری‌های کلاسیک برای فشرده‌سازی مدل‌ها استفاده می‌کنید، باید بدانید که قواعد بازی در حال تغییر است.

طبق اعلام پژوهشگران در مقاله‌ای که در ۳۰ آوریل ۲۰۲۶ در arxiv.org منتشر شد، مدل QYOLO توانسته است با جایگزینی گلوگاه‌های کلاسیک و سنگین، پارامترهای مدل را به شدت کاهش دهد. این رویکرد بر پایه استفاده از میکسینگ الهام‌گرفته از کوانتوم است که اجازه می‌دهد مدل‌ها با ساختاری بسیار مینیمال، همان خروجی‌های دقیق را تولید کنند.

نوآوری اصلی این مدل، معرفی QMixBlock است. این بلوک جایگزین دو مورد از عمیق‌ترین ماژول‌های C2f در ستون فقرات (Backbone) مدل در مراحل P4/16 و P5/32 می‌شود. بر اساس مستندات این پژوهش، این بلوک از یک مکانیسم میکسینگ سینوسی برای بازتنظیم کانال‌ها در سطح جهانی استفاده می‌کند. با به اشتراک‌گذاری پارامترهای یادگیرنده در هر دو مرحله، مدل می‌تواند اهمیت کانال‌ها را بدون نیاز به مجموعه‌های مستقل از پارامترها، به‌طور سازگار اعمال کند.

ارزیابی‌های انجام‌شده روی بنچ‌مارک VisDrone2019 نتایج خیره‌کننده‌ای را نشان می‌دهد:

QYOLOv8n: تعداد پارامترها از ۳.۰۱ میلیون به ۲.۴۰ میلیون رسید (کاهش ۲۰.۲ درصدی) و GFLOPs (عملیات ضرب و جمع اعشاری) ۱۲.۳ درصد کاهش یافت، در حالی که افت دقت تنها ۰.۴ واحد بود.
QYOLOv8s: کاهش ۲۱.۸ درصدی پارامترها با افت بسیار ناچیز ۰.۱ واحد.
بازیابی دقت: با ترکیب این روش و تقطیر دانش (Knowledge Distillation)، پژوهشگران توانستند دقت مدل را بدون هیچ هزینه اضافی در فشرده‌سازی، به سطح کامل بازگردانند.

همان‌طور که در تحلیل‌های پیشین ما درباره‌ی بهینه‌سازی مدل‌های رایانش لبه (Edge Computing) اشاره کردیم، چالش اصلی همیشه توازن بین سرعت و دقت بوده است. QYOLO با هدف قرار دادن مقیاس درجه‌دوم عرض کانال در مراحل عمیق، سربار محاسباتی را به شدت کاهش می‌دهد.

این معماری ثابت می‌کند که ساختارهای ریاضی الهام‌گرفته از کوانتوم می‌توانند به‌طور مؤثری افزونگی‌ها را در مدل‌های بینایی حذف کنند. با افزایش تقاضا برای بهره‌وری در دستگاه‌های لبه، این چرخش به سمت میکسینگ غیرکلاسیک احتمالاً به‌زودی از صفحات مقالات پژوهشی به محصولات تجاری هوش مصنوعی موبایلی منتقل خواهد شد.

اما آیا این رویکرد در مدل‌های بزرگ‌تر و ترنسفورمر-محور هم جواب می‌دهد؟ پاسخ این پرسش در گزارش‌های آینده ما نهفته است.

گام بعدی شما

اگر روی مدل‌های YOLOv8 کار می‌کنید، ساختار QMixBlock را برای کاهش حافظه در استنتاج (Inference) بررسی کنید.
برای بازیابی دقت در مدل‌های فشرده، از تکنیک‌های تقطیر دانش استفاده کنید.
بررسی کنید که آیا مدل‌های شما در مراحل P4 و P5 دچار سربار محاسباتی بیش از حد هستند یا خیر.

این گزارش با خط‌لولهٔ خودکار دات‌هوش از منابع معتبر جهانی تدوین و زیر نظر تحریریه منتشر شده است. روش کار ما

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

اخبار روزانه، معرفی ابزارها و مدل‌ها، و آموزشِ کار با هوش مصنوعی؛ همیشه با این پرسش که از ایران چه چیزی کار می‌کند و چه چیزی نه.

ارزیابی‌های انجام‌شده روی بنچ‌مارک VisDrone2019 نتایج خیره‌کننده‌ای را نشان می‌دهد:

QYOLOv8n: تعداد پارامترها از ۳.۰۱ میلیون به ۲.۴۰ میلیون رسید (کاهش ۲۰.۲ درصدی) و GFLOPs (عملیات ضرب و جمع اعشاری) ۱۲.۳ درصد کاهش یافت، در حالی که افت دقت تنها ۰.۴ واحد بود.
QYOLOv8s: کاهش ۲۱.۸ درصدی پارامترها با افت بسیار ناچیز ۰.۱ واحد.
بازیابی دقت: با ترکیب این روش و تقطیر دانش (Knowledge Distillation)، پژوهشگران توانستند دقت مدل را بدون هیچ هزینه اضافی در فشرده‌سازی، به سطح کامل بازگردانند.

گام بعدی شما

اگر روی مدل‌های YOLOv8 کار می‌کنید، ساختار QMixBlock را برای کاهش حافظه در استنتاج (Inference) بررسی کنید.
برای بازیابی دقت در مدل‌های فشرده، از تکنیک‌های تقطیر دانش استفاده کنید.
بررسی کنید که آیا مدل‌های شما در مراحل P4 و P5 دچار سربار محاسباتی بیش از حد هستند یا خیر.

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

QYOLO: جادوی میکسینگ کوانتومی برای حذف ۲۰ درصدی پارامترهای YOLOv8

گام بعدی شما

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

QYOLO: جادوی میکسینگ کوانتومی برای حذف ۲۰ درصدی پارامترهای YOLOv8

گام بعدی شما

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

QYOLO: جادوی میکسینگ کوانتومی برای حذف ۲۰ درصدی پارامترهای YOLOv8

گام بعدی شما

مقاله‌های مرتبطهمه ←

سرمایه‌گذاری سری B: ۳۱۰ میلیون دلار برای شبیه‌سازی فیزیک در Odyssey

هگینگ‌فیس با استاندارد ARD جست‌وجوی ابزارها برای عامل‌ها را خودکار کرد

«پیش‌بینی مسیر از طریق متن»؛ دستاورد جدید مؤسسه AllenAI در فضای سه‌بعدی

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

اصطلاحات این مطلب

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

QYOLO: جادوی میکسینگ کوانتومی برای حذف ۲۰ درصدی پارامترهای YOLOv8

گام بعدی شما

مقاله‌های مرتبطهمه ←

سرمایه‌گذاری سری B: ۳۱۰ میلیون دلار برای شبیه‌سازی فیزیک در Odyssey

هگینگ‌فیس با استاندارد ARD جست‌وجوی ابزارها برای عامل‌ها را خودکار کرد

«پیش‌بینی مسیر از طریق متن»؛ دستاورد جدید مؤسسه AllenAI در فضای سه‌بعدی

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

اصطلاحات این مطلب

راهنمای فارسی هوش مصنوعی — با نگاه به ایران