شبکههای عصبی گرافی (GNNs) به ابزاری ضروری برای یادگیری ماشینی مبتنی بر گراف تبدیل شدهاند، اما پژوهشهای تازه آسیبپذیری بحرانی آنها را آشکار کرده است: حملات بکدور. روشهای سنتی با تزریق محرکها به گرههای آموزشی و تغییر برچسبهای آنها به کلاس هدف، مدل را وادار میکنند تا گرههای آزمایشی دارای محرک را در آن کلاس پیشبینی کند. با این حال، تغییر برچسبهای آموزشی در کاربردهای واقعی، جایی که یکپارچگی دادهها اهمیت حیاتی دارد، عملی نیست.
این پژوهش به بررسی حملات بکدور با برچسب تمیز میپردازد، یعنی سناریویی که برچسبهای آموزشی دستنخورده باقی میمانند. نکته قابل توجه اینکه روشهای موجود در این شرایط واقعبینانه ناکام میشوند. محققان کشف کردند که رویکردهای فعلی نمیتوانند منطق پیشبینی مدلهای GNN را بهطور مؤثری مسموم کنند و این باعث میشود مدل، محرکها را به عنوان ویژگیهای بیاهمیت تلقی کند.
این مطالعه روش BA-Logic را معرفی میکند، رویکردی نوآورانه که منطق پیشبینی داخلی GNNها را مسموم میسازد. BA-Logic دو مؤلفه را هماهنگ میکند: انتخابگر گره مسموم و تولیدکننده محرک مسمومکننده منطق. با انتخاب هوشمندانه گرهها و تولید محرکهایی که استدلال داخلی مدل را فاسد میکنند، این روش رفتار GNN را با موفقیت دستکاری میکند.
نتایج آزمایشها بر مجموعه دادههای واقعی، اثربخشی BA-Logic را تأیید میکند. این رویکرد نرخ موفقیت حمله را در مقایسه با رقبای پیشرفته در شرایط برچسب تمیز بهطور چشمگیری بهبود میبخشد. این پژوهش نشان میدهد که مسمومسازی مکانیسمهای پیشبینی داخلی مؤثرتر از تکیه بر تغییرات برچسب است و افقهای تازهای برای درک و دفاع در برابر حملات پیچیده مبتنی بر گراف میگشاید.

گفتگو