RePAIR: چارچوبی برای حذف دانش ناخواسته از مدل‌های زبانی بزرگ

پژوهشگران مؤسسه فناوری بمبئی (IIT Bombay) چارچوبی نوین با نام RePAIR توسعه داده‌اند که به کاربران نهایی امکان می‌دهد دانش ناخواسته را از مدل‌های زبانی بزرگ (LLM) به‌صورت انتخابی حذف کنند، بدون آنکه نیازی به تکیه بر ارائه‌دهندگان سرویس مدل باشد. این رویکرد تازه که «یادگیری معکوس تعاملی ماشین» نامیده شده، به کاربران اجازه می‌دهد تا از طریق دستورات زبان طبیعی و در زمان استنتاج، مدل‌های زبانی بزرگ را به فراموشی اطلاعات خاصی هدایت کنند. سیستم مذکور از سه جزء کلیدی تشکیل شده است: مدل نگهبان (watchdog) برای شناسایی درخواست‌های یادگیری معکوس، مدل جراح (surgeon) برای تولید رویه‌های ترمیم، و مدل بیمار (patient) که پارامترهای خود را به‌صورت خودمختار به‌روزرسانی می‌کند. در هسته اصلی این چارچوب، روشی بدون نیاز به آموزش به نام STAMP به‌کار گرفته شده که فعال‌سازی‌های شبکه عصبی را با استفاده از به‌روزرسانی‌های شبه‌معکوس بسته، به سمت زیرفضای انصراف هدایت می‌کند. این تکنیک پیچیدگی محاسباتی را از مقیاس مکعبی به تقریباً درجه دوم کاهش می‌دهد و امکان یادگیری معکوس کارآمد روی دستگاه را با عملکرد تقریباً سه برابر سریع‌تر نسبت به رویکردهای سنتی مبتنی بر آموزش فراهم می‌سازد. نتایج آزمایشی نشان‌دهنده نمرات فراموشی نزدیک به کامل همراه با حفظ کارآیی مدل است، به‌طوری‌که دقت نگهداری به ۸۴.۴۷ درصد و معیارهای یادگیری پاداش به ۰.۸۸ رسیده است. این پژوهش به نگرانی‌های اساسی درباره دانش مضر، اطلاعات نادرست و داده‌های شخصی تعبیه‌شده در سیستم‌های هوش مصنوعی طی پیش‌آموزش می‌پردازد. با ارائه mecanismos شفاف و عملی برای ویرایش مدل به فرمان کاربر، این کار امکان کنترل روی دستگاه بر دانش آموخته‌شده را پیش می‌برد و پتانسیل گسترش به مدل‌های بنیادی چندوجهی را دارد.

این گزارش با خط‌لولهٔ خودکار دات‌هوش از منابع معتبر جهانی تدوین و زیر نظر تحریریه منتشر شده است. روش کار ما

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

اخبار روزانه، معرفی ابزارها و مدل‌ها، و آموزشِ کار با هوش مصنوعی؛ همیشه با این پرسش که از ایران چه چیزی کار می‌کند و چه چیزی نه.

RePAIR: چارچوبی برای حذف دانش ناخواسته از مدل‌های زبانی بزرگ

منابع

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

RePAIR: چارچوبی برای حذف دانش ناخواسته از مدل‌های زبانی بزرگ

منابع

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

RePAIR: چارچوبی برای حذف دانش ناخواسته از مدل‌های زبانی بزرگ

منابع

مقاله‌های مرتبطهمه ←

سرمایه‌گذاری سری B: ۳۱۰ میلیون دلار برای شبیه‌سازی فیزیک در Odyssey

هگینگ‌فیس با استاندارد ARD جست‌وجوی ابزارها برای عامل‌ها را خودکار کرد

«پیش‌بینی مسیر از طریق متن»؛ دستاورد جدید مؤسسه AllenAI در فضای سه‌بعدی

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

اصطلاحات این مطلب

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

RePAIR: چارچوبی برای حذف دانش ناخواسته از مدل‌های زبانی بزرگ

منابع

مقاله‌های مرتبطهمه ←

سرمایه‌گذاری سری B: ۳۱۰ میلیون دلار برای شبیه‌سازی فیزیک در Odyssey

هگینگ‌فیس با استاندارد ARD جست‌وجوی ابزارها برای عامل‌ها را خودکار کرد

«پیش‌بینی مسیر از طریق متن»؛ دستاورد جدید مؤسسه AllenAI در فضای سه‌بعدی

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

اصطلاحات این مطلب

راهنمای فارسی هوش مصنوعی — با نگاه به ایران