
چرا مکانیسمهای خوداصلاحی مدلهای زبانی در برابر حملات M³Att شکست میخورند؟
پژوهشگران چارچوب M³Att را معرفی کردند که با استفاده از محرکهای بصری و اطلاعات گمراهکننده، سیستمهای RAG پزشکی را هدف قرار میدهد. این حمله مدلها را فریب میدهد تا تشخیصهای…










