تیمی از پژوهشگران روش «پیشآموزش زنجیرهای مدلها» (CoM-PT) را توسعه دادهاند که آموزش مدلهای بنیادین بینایی را به شکل چشمگیری تسریع میکند. برخلاف رویکردهای سنتی که هر مدل را بهصورت مستقل بهینهسازی میکنند، این روش از ساختار خانواده مدلها بهره میبرد و دانش را بهصورت زنجیرهای از مدلهای کوچک به مدلهای بزرگ منتقل میکند. در این فرآیند، کوچکترین مدل آموزش استاندارد را طی میکند و مدلهای بزرگتر با استفاده مجدد از پارامترها و ویژگیهای آموختهشده توسط مدلهای پیشین، بهطور کارآمدی توانمندیها را کسب میکنند. این شیوه انتقال معکوس دانش باعث میشود همه مدلها به عملکردی قابل مقایسه یا حتی بهتر از مدلهای آموزشدیده مستقل دست یابند. این روش با دامنه وسیعی از مجموعه دادهها سازگار است و نشان میدهد که آموزش همزمان مدلهای بیشتر در واقع بهرهوری کلی را افزایش میدهد. هنگامی که این روش بر روی ViT-L بهعنوان بزرگترین مدل اعمال شد، پیچیدگی محاسباتی را تا ۷۲ درصد کاهش داد. همچنین با افزایش تعداد مدلهای خانواده از ۳ به ۷ مدل، نسبت شتاب از ۴.۱۳ برابر به ۷.۰۹ برابر صعود کرد. از آنجا که این روش مستقل از پارادایمهای خاص پیشآموزش عمل میکند، پژوهشگران کد منبع آن را بهصورت متنباز منتشر کردهاند تا علاقهمندان بتوانند در حوزههای محاسباتی سنگین مانند پیشآموزش مدلهای زبانی بزرگ به کاوش بپردازند.

گفتگو