Safe-FedLLM محافظ یادگیری فدرال مدل‌های زبانی در برابر کلاینت‌های مخرب

تیمی پژوهشی مطالعه‌ای را منتشر کرده که چارچوب Safe-FedLLM را معرفی می‌کند؛ راهکاری نوآورانه برای رفع آسیب‌پذیری‌های امنیتی در آموزش فدرال مدل‌های زبانی بزرگ (FedLLM). این پژوهش که در arxiv.org منتشر شده، نگاهی مقدماتی اما قابل‌توجه به جنبه‌ای کم‌توجه از یادگیری فدرال است.

یادگیری فدرال به سازمان‌ها اجازه می‌دهد مدل‌های زبانی را به‌صورت مشترک آموزش دهند و داده‌ها را محلی نگه دارند. با این حال، بیشتر پژوهش‌های موجود بر بهبود بهره‌وری تمرکز کرده‌اند و مسائل امنیتی را نادیده گرفته‌اند.

Safe-FedLLM این خلأ را با بررسی سطوح حمله احتمالی و توسعه سازوکارهای دفاعی هدفمند پر می‌کند.

پژوهشگران دو ویژگی بحرانی را شناسایی کردند. نخست، مدل‌های زبانی در برابر حملات کلاینت‌های مخرب آسیب‌پذیرند. دوم، به‌روزرسانی‌های LoRA (تطبیق رتبه پایین) الگوهای رفتاری متمایزی نشان می‌دهند.

این کشف کلیدی به Safe-FedLLM امکان می‌دهد با تحلیل این به‌روزرسانی‌ها، رفتار کلاینت‌ها را ارزیابی کند.

معماری دفاعی سه‌سطحی این چارچوب شامل تحلیل در سطح گام (Step-Level)، ارزیابی مشارکت هر شرکت‌کننده (Client-Level)، و مقایسه با خطوط پایه (Shadow-Level) است. با تبدیل به‌روزرسانی‌های LoRA به نشانگرهای رفتاری چندبعدی، سیستم می‌تواند قبل از ادغام در مدل جهانی تشخیص دهد آیا کلاینتی مخربانه عمل می‌کند.

نتایج آزمایشی نشان می‌دهد Safe-FedLLM مقاومت در برابر کلاینت‌های مخرب را بهبود می‌دهد و عملکرد رقابتی روی داده‌های سالم حفظ می‌کند. این روش تأثیر داده‌های مخرب را بدون کاهش محسوس سرعت آموزش سرکوب می‌کند و حتی با نسبت‌های بالای کلاینت مخرب مؤثر باقی می‌ماند.

این پژوهش را Mingxiang Tao و همکارانش انجام داده‌اند. نسخه اول در ۱۲ ژانویه ۲۰۲۶ و نسخه بازنگری‌شده در ۱۴ آوریل ۲۰۲۶ ارائه شده است.

این گزارش با خط‌لولهٔ خودکار دات‌هوش از منابع معتبر جهانی تدوین و زیر نظر تحریریه منتشر شده است. روش کار ما

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

اخبار روزانه، معرفی ابزارها و مدل‌ها، و آموزشِ کار با هوش مصنوعی؛ همیشه با این پرسش که از ایران چه چیزی کار می‌کند و چه چیزی نه.

Safe-FedLLM این خلأ را با بررسی سطوح حمله احتمالی و توسعه سازوکارهای دفاعی هدفمند پر می‌کند.

این کشف کلیدی به Safe-FedLLM امکان می‌دهد با تحلیل این به‌روزرسانی‌ها، رفتار کلاینت‌ها را ارزیابی کند.

Safe-FedLLM محافظ یادگیری فدرال مدل‌های زبانی در برابر کلاینت‌های مخرب

منابع

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

Safe-FedLLM محافظ یادگیری فدرال مدل‌های زبانی در برابر کلاینت‌های مخرب

منابع

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

Safe-FedLLM محافظ یادگیری فدرال مدل‌های زبانی در برابر کلاینت‌های مخرب

منابع

مقاله‌های مرتبطهمه ←

سرمایه‌گذاری سری B: ۳۱۰ میلیون دلار برای شبیه‌سازی فیزیک در Odyssey

هگینگ‌فیس با استاندارد ARD جست‌وجوی ابزارها برای عامل‌ها را خودکار کرد

«پیش‌بینی مسیر از طریق متن»؛ دستاورد جدید مؤسسه AllenAI در فضای سه‌بعدی

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

Safe-FedLLM محافظ یادگیری فدرال مدل‌های زبانی در برابر کلاینت‌های مخرب

منابع

مقاله‌های مرتبطهمه ←

سرمایه‌گذاری سری B: ۳۱۰ میلیون دلار برای شبیه‌سازی فیزیک در Odyssey

هگینگ‌فیس با استاندارد ARD جست‌وجوی ابزارها برای عامل‌ها را خودکار کرد

«پیش‌بینی مسیر از طریق متن»؛ دستاورد جدید مؤسسه AllenAI در فضای سه‌بعدی

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

راهنمای فارسی هوش مصنوعی — با نگاه به ایران