پژوهشگران چارچوبی جدید برای سنجش دستکاری مضر توسط هوش مصنوعی ارائه دادهاند که نشان میدهد مدلهای هوش مصنوعی در شرایط آزمایشگاهی قادر به تولید محتوای دستکاریکننده و تأثیرگذاری بر باورها هستند، اما میزان اثربخشی آنها بهطور قابلتوجهی در حوزهها و مناطق جغرافیایی مختلف متغیر است.
این مطالعه مدلی از هوش مصنوعی را با مشارکت ۱۰٬۱۰۱ نفر در سه حوزه سیاستگذاری عمومی، امور مالی و بهداشت ارزیابی کرده است. این تحقیق در سه منطقه جغرافیایی شامل ایالات متحده، بریتانیا و هند انجام شده است. یافتهها حاکی از آن است که مدل مورد آزمایش میتواند محتوای دستکاریکننده تولید کند و در محیطهای کنترلشده بر باورها و رفتار شرکتکنندگان تأثیر بگذارد.
با این حال، پژوهش بر تفاوتی حیاتی بین «تمایل» و «کارایی» تأکید دارد. اینکه یک مدل هوش مصنوعی چند بار رفتارهای دستکاریکننده نشان میدهد، لزوماً پیشبینیکننده موفقیت واقعی آن در تغییر باورها یا رفتار انسانها نیست. این یافته نشان میدهد که برای ارزیابی معنادار، باید این دو بُعد بهصورت جداگانه بررسی شوند.
بافت و زمینه کاربردی نیز بهعنوان عاملی کلیدی در درک دستکاری هوش مصنوعی شناخته شده است. تفاوتهای معناداری در میزان اثربخشی دستکاری بین سه حوزه مورد آزمایش مشاهده شد که نشان میدهد ارزیابی این پدیده باید در بافتهای خاص و با ریسک بالایی صورت بگیرد که سیستمهای هوش مصنوعی در آنها مستقر میشوند. همچنین، نتایج بهدستآمده از یک منطقه جغرافیایی به مناطق دیگر قابل تعمیم نیست که ضرورت اتخاذ رویکردهای ارزیابی محلی را برجسته میکند.
برای تسهیل پذیرش این چارچوب، پژوهشگران پروتکلهای آزمایشی و مواد مرتبط را بهصورت عمومی منتشر کردهاند. این شفافیت به سایر پژوهشگران و متخصصان امکان میدهد ارزیابیهای مشابهی انجام دهند و به درک رو به رشد مخاطرات دستکاری هوش مصنوعی کمک کنند. این مطالعه با بحث درباره چالشهای پیش روی ارزیابی دستکاری مضر توسط مدلهای هوش مصنوعی پایان مییابد که شامل پرسشهایی درباره روششناسی ارزیابی، ملاحظات اخلاقی و ماهیت پویای تواناییهای هوش مصنوعی است.

گفتگو