CoM-PT: روشی نوین برای تسریع آموزش مدل‌های بنیادین بینایی

تیمی از پژوهشگران روش «پیش‌آموزش زنجیره‌ای مدل‌ها» (CoM-PT) را توسعه داده‌اند که آموزش مدل‌های بنیادین بینایی را به شکل چشمگیری تسریع می‌کند. برخلاف رویکردهای سنتی که هر مدل را به‌صورت مستقل بهینه‌سازی می‌کنند، این روش از ساختار خانواده مدل‌ها بهره می‌برد و دانش را به‌صورت زنجیره‌ای از مدل‌های کوچک به مدل‌های بزرگ منتقل می‌کند. در این فرآیند، کوچک‌ترین مدل آموزش استاندارد را طی می‌کند و مدل‌های بزرگ‌تر با استفاده مجدد از پارامترها و ویژگی‌های آموخته‌شده توسط مدل‌های پیشین، به‌طور کارآمدی توانمندی‌ها را کسب می‌کنند. این شیوه انتقال معکوس دانش باعث می‌شود همه مدل‌ها به عملکردی قابل مقایسه یا حتی بهتر از مدل‌های آموزش‌دیده مستقل دست یابند. این روش با دامنه وسیعی از مجموعه داده‌ها سازگار است و نشان می‌دهد که آموزش هم‌زمان مدل‌های بیشتر در واقع بهره‌وری کلی را افزایش می‌دهد. هنگامی که این روش بر روی ViT-L به‌عنوان بزرگ‌ترین مدل اعمال شد، پیچیدگی محاسباتی را تا ۷۲ درصد کاهش داد. همچنین با افزایش تعداد مدل‌های خانواده از ۳ به ۷ مدل، نسبت شتاب از ۴.۱۳ برابر به ۷.۰۹ برابر صعود کرد. از آنجا که این روش مستقل از پارادایم‌های خاص پیش‌آموزش عمل می‌کند، پژوهشگران کد منبع آن را به‌صورت متن‌باز منتشر کرده‌اند تا علاقه‌مندان بتوانند در حوزه‌های محاسباتی سنگین مانند پیش‌آموزش مدل‌های زبانی بزرگ به کاوش بپردازند.

این گزارش با خط‌لولهٔ خودکار دات‌هوش از منابع معتبر جهانی تدوین و زیر نظر تحریریه منتشر شده است. روش کار ما

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

اخبار روزانه، معرفی ابزارها و مدل‌ها، و آموزشِ کار با هوش مصنوعی؛ همیشه با این پرسش که از ایران چه چیزی کار می‌کند و چه چیزی نه.

CoM-PT: روشی نوین برای تسریع آموزش مدل‌های بنیادین بینایی

منابع

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

CoM-PT: روشی نوین برای تسریع آموزش مدل‌های بنیادین بینایی

منابع

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

CoM-PT: روشی نوین برای تسریع آموزش مدل‌های بنیادین بینایی

منابع

مقاله‌های مرتبطهمه ←

سرمایه‌گذاری سری B: ۳۱۰ میلیون دلار برای شبیه‌سازی فیزیک در Odyssey

هگینگ‌فیس با استاندارد ARD جست‌وجوی ابزارها برای عامل‌ها را خودکار کرد

«پیش‌بینی مسیر از طریق متن»؛ دستاورد جدید مؤسسه AllenAI در فضای سه‌بعدی

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

CoM-PT: روشی نوین برای تسریع آموزش مدل‌های بنیادین بینایی

منابع

مقاله‌های مرتبطهمه ←

سرمایه‌گذاری سری B: ۳۱۰ میلیون دلار برای شبیه‌سازی فیزیک در Odyssey

هگینگ‌فیس با استاندارد ARD جست‌وجوی ابزارها برای عامل‌ها را خودکار کرد

«پیش‌بینی مسیر از طریق متن»؛ دستاورد جدید مؤسسه AllenAI در فضای سه‌بعدی

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

راهنمای فارسی هوش مصنوعی — با نگاه به ایران