موبی: اولین چارچوب دودویی‌سازی برای مدل‌های مبتنی بر MoE

پژوهشگران چارچوب موبی (MoBiE) را توسعه داده‌اند. این نخستین چارچوب دودویی‌سازی مخصوص مدل‌های زبانی بزرگ مبتنی بر مخلوط کارشناسان (Mixture-of-Experts / MoE) است. این پژوهش که در arXiv منتشر شده، به همت ژیشیونگ ژائو انجام گرفته است.

دودویی‌سازی وزن، کارایی چشمگیری برای مدل‌های متراکم فراهم می‌کند. اما روش‌های موجود با چالش‌های خاص MoE دست‌وپنجه نرم می‌کنند. نخست، افزونگی بین کارشناسان: اطلاعات مشابه در کارشناسان مختلف ذخیره می‌شود. دوم، تخمین اهمیت وزن بدون توجه به وظیفه، ارزش واقعی وزن‌ها در مسیریابی را نادیده می‌گیرد. سوم، تغییر مسیر ناشی از کوانتیزاسیون، توانایی مدل برای هدایت صحیح ورودی‌ها را مختل می‌کند.

موبی سه نوآوری اساسی معرفی می‌کند. نخست، تجزیه SVD (SVD) مشترک برای کاهش افزونگی بین کارشناسان به‌کار می‌رود. دوم، گرادیان‌های سراسری تابع خطا در معیارهای هاین (Hessian) ادغام می‌شوند تا تخمین اهمیت وزن بهبود یابد. سوم، قید خطای هدایت‌شده توسط فضای تهی ورودی، اعوجاج مسیریابی را کاهش می‌دهد.

این بهینه‌سازی‌ها بدون سربار حافظه اضافی به دست می‌آیند. تعادل مؤثری بین کارایی و عملکرد مدل برقرار شده است.

در آزمایش‌های گسترده روی مدل‌های مختلف و معیارهای متنوع، موبی عملکرد بهتری نسبت به روش‌های دودویی پیشرو نشان داد. روی کوان۳-30B-A3B (Qwen3-30B-A3B)، کاهش سردرگمی 52.2 درصد، بهبود 43.4 درصدی عملکرد صفروشل، شتاب بیش از دو برابری استنتاج، و کوتاه‌تر شدن زمان کوانتیزاسیون ثبت شد. کد این پژوهش در گیت‌هاب (GitHub) در دسترس عموم است.

این پژوهش گامی بلند در قابل استقرار کردن مدل‌های بزرگ MoE است. به‌ویژه برای محیط‌هایی با منابع محدود اهمیت دارد. با افزایش محبوبیت معماری MoE به دلیل عملکرد قوی، تکنیک‌های کوانتیزاسیون کارآمدی چون موبی می‌توانند دسترسی به این مدل‌های قدرتمند را دموکراتیزه کنند.

این گزارش با خط‌لولهٔ خودکار دات‌هوش از منابع معتبر جهانی تدوین و زیر نظر تحریریه منتشر شده است. روش کار ما

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

اخبار روزانه، معرفی ابزارها و مدل‌ها، و آموزشِ کار با هوش مصنوعی؛ همیشه با این پرسش که از ایران چه چیزی کار می‌کند و چه چیزی نه.

این بهینه‌سازی‌ها بدون سربار حافظه اضافی به دست می‌آیند. تعادل مؤثری بین کارایی و عملکرد مدل برقرار شده است.

موبی: اولین چارچوب دودویی‌سازی برای مدل‌های مبتنی بر MoE

منابع

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

موبی: اولین چارچوب دودویی‌سازی برای مدل‌های مبتنی بر MoE

منابع

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

موبی: اولین چارچوب دودویی‌سازی برای مدل‌های مبتنی بر MoE

منابع

مقاله‌های مرتبطهمه ←

سرمایه‌گذاری سری B: ۳۱۰ میلیون دلار برای شبیه‌سازی فیزیک در Odyssey

هگینگ‌فیس با استاندارد ARD جست‌وجوی ابزارها برای عامل‌ها را خودکار کرد

«پیش‌بینی مسیر از طریق متن»؛ دستاورد جدید مؤسسه AllenAI در فضای سه‌بعدی

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

مدل‌ها و ابزارهای مرتبط

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

موبی: اولین چارچوب دودویی‌سازی برای مدل‌های مبتنی بر MoE

منابع

مقاله‌های مرتبطهمه ←

سرمایه‌گذاری سری B: ۳۱۰ میلیون دلار برای شبیه‌سازی فیزیک در Odyssey

هگینگ‌فیس با استاندارد ARD جست‌وجوی ابزارها برای عامل‌ها را خودکار کرد

«پیش‌بینی مسیر از طریق متن»؛ دستاورد جدید مؤسسه AllenAI در فضای سه‌بعدی

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

مدل‌ها و ابزارهای مرتبط

راهنمای فارسی هوش مصنوعی — با نگاه به ایران