روش جدید هزینه آموزش تخاصمی ترانسفورمرهای بینایی را کاهش می‌دهد

ترانسفورمرهای بینایی (ViT) به عنوان مدل‌هایی قدرتمند برای وظایف بینایی کامپیوتری ظهور کرده‌اند و قابلیت‌های مقیاس‌پذیری و تعمیم‌دهی قابل توجهی ارائه می‌دهند. با این حال، مقاومت آن‌ها در برابر نمونه‌های تخاصمی — ورودی‌هایی که با هدف ایجاد خطای مدل طراحی شده‌اند — با افزایش اندازه مدل بهبود متناسبی نمی‌یابد. این موضوع چالشی جدی در تقویت معماری‌های بزرگ ترانسفورمر بینایی در برابر چنین حملاتی ایجاد می‌کند.

آموزش تخاصمی (AT) یکی از مؤثرترین تکنیک‌ها برای افزایش مقاومت مدل است. رویکردهای سنتی نیازمند تنظیم دقیق کل مدل هستند که این فرآیند را برای معماری‌های بزرگ ترانسفورمر بینایی از نظر محاسباتی غیرعملی می‌سازد. روش پیشنهادی جدید با نام آموزش تخاصمی آگاه از اهمیت (CAAT) این گلوگاه را با شناسایی هوشمندانه و تنظیم صرفاً پارامترهایی که بیشترین سهم را در مقاومت تخاصمی دارند، برطرف می‌کند.

این روش از تکنیک‌های تنظیم دقیق کارآمد پارامتری (PEFT) برای اصلاح مقاوم وزن‌ها بهره می‌برد، اما این کار را انتخابی و تنها در مواردی انجام می‌دهد که تعداد پارامترهای بحرانی از یک آستانه از پیش تعیین‌شده فراتر رود. این تخصیص تطبیقی منابع به رویکرد اجازه می‌دهد تا مقاومت رقابتی را با کاهش چشمگیر نیازمندی‌های محاسباتی به دست آورد.

آزمایش‌های انجام‌شده روی سه معیار معروف یادگیری تخاصمی نشان می‌دهد که CAAT از روش‌های موجود آموزش تخاصمی سبک‌وزن عملکرد بهتری دارد. این تکنیک عملکرد مقاومتی را در فاصله ۴٫۳ درصدی از آموزش تخاصمی کامل حفظ می‌کند و در عین حال تنها حدود ۶ درصد از پارامترهای مدل را تنظیم می‌کند. علاوه بر این، CAAT رفتار مقیاس‌پذیری مطلوبی در هنگام اعمال روی معماری‌های بزرگ‌تر ترانسفورمر بینایی از خود نشان می‌دهد.

پیامدهای این رویکرد برای جامعه هوش مصنوعی قابل توجه است. با ادامه رشد مدل‌های بینایی، عملی کردن آموزش تخاصمی و مقرون‌به‌صرفه ساختن آن برای کاربردهای حساس از نظر امنیتی اهمیت فزاینده‌ای پیدا می‌کند. CAAT بالقوه آموزش تخاصمی در مقیاس بزرگ را بدون نیاز به منابع محاسباتی هنگفت ممکن می‌سازد و دسترسی به مدل‌های بینایی مقاوم را دموکراتیزه می‌کند. این رویکرد گامی به سوی استراتژی‌های کارآمدتر تقویت مقاومت محسوب می‌شود، هرچند بررسی‌های بیشتر درباره آستانه‌های بهینه پارامترهای بحرانی و قابلیت اعمال در وظایف مختلف بینایی همچنان ضروری است.

این گزارش با خط‌لولهٔ خودکار دات‌هوش از منابع معتبر جهانی تدوین و زیر نظر تحریریه منتشر شده است. روش کار ما

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

اخبار روزانه، معرفی ابزارها و مدل‌ها، و آموزشِ کار با هوش مصنوعی؛ همیشه با این پرسش که از ایران چه چیزی کار می‌کند و چه چیزی نه.

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

روش جدید هزینه آموزش تخاصمی ترانسفورمرهای بینایی را کاهش می‌دهد

منابع

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

روش جدید هزینه آموزش تخاصمی ترانسفورمرهای بینایی را کاهش می‌دهد

منابع

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

روش جدید هزینه آموزش تخاصمی ترانسفورمرهای بینایی را کاهش می‌دهد

منابع

مقاله‌های مرتبطهمه ←

سرمایه‌گذاری سری B: ۳۱۰ میلیون دلار برای شبیه‌سازی فیزیک در Odyssey

هگینگ‌فیس با استاندارد ARD جست‌وجوی ابزارها برای عامل‌ها را خودکار کرد

«پیش‌بینی مسیر از طریق متن»؛ دستاورد جدید مؤسسه AllenAI در فضای سه‌بعدی

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

روش جدید هزینه آموزش تخاصمی ترانسفورمرهای بینایی را کاهش می‌دهد

منابع

مقاله‌های مرتبطهمه ←

سرمایه‌گذاری سری B: ۳۱۰ میلیون دلار برای شبیه‌سازی فیزیک در Odyssey

هگینگ‌فیس با استاندارد ARD جست‌وجوی ابزارها برای عامل‌ها را خودکار کرد

«پیش‌بینی مسیر از طریق متن»؛ دستاورد جدید مؤسسه AllenAI در فضای سه‌بعدی

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

راهنمای فارسی هوش مصنوعی — با نگاه به ایران