
گزارش arxiv.org: شکست کامل SafeLoRA در برابر استاندارد چهارگانه Acceptance Cards
پژوهشگران پروتکل سختگیرانه Acceptance Cards را برای تأیید دفاعهای تنظیم دقیق معرفی کردند. نتایج اولیه نشان میدهد SafeLoRA در مدل Gemma-2-2B-it شکست خورده و ادعاهای ایمنی فعلی…










