اگر تصور میکنید ایمنی هوش مصنوعی صرفاً یک چالش فنی برای فیلتر کردن کلمات نامناسب است، با نکتهی کلیدی ماجرا فاصله دارید. باید بدانید که اعتبار آماری یک مدل، بدون مشروعیت در منشأ تامین دادهها، دیگر برای استانداردهای جهانی کافی نیست.
در حال حاضر صنعت به شدت بر تیم قرمز (Red-teaming) و ارزیابیهای ایمنی تکیه کرده است تا مدلهای زبانی بزرگ (LLM) را پالایش کند. همانطور که در تحلیلهای پیشین ما دربارهی همراستاسازی (Alignment) اشاره کردیم، تمرکز بر خروجی مدلها اغلب باعث نادیده گرفتن انسانهایی میشود که دادههای آسیبزا و تراوماتیک را برای ساخت این نردههای حفاظتی برچسب میزنند.
به نقل از گزارش منتشرشده در ۹ ژوئن ۲۰۲۶ در arxiv.org، این رویکرد «ترمیمی» شامل دو چرخش بنیادین است:
- انتقال از قراردادهای انفرادی برچسبزنی به حاکمیت جمعی (Collective Governance) بر مجموعهدادههای هوش مصنوعی.
- جایگزینی ساختارهای پاداش استاندارد با سیستمهای «پاداش عادلانه» برای تامینکنندگان داده.
پژوهشگران تأکید میکنند که ترمیم هوش مصنوعی مستلزم بازتعریف پیوندهای پاسخگویی میان انسانها و سیستمهای تولیدشده است. با قرار دادن جوامع حاشیهنشین و آسیبدیده در مرکز توجه — به جای تمرکز صرف بر عملکرد مدل — این چارچوب، هنجارهای فعلی تولید داده را به چالش میکشد.
برای جامعهی فنی، این تغییر فرضیه بنیادین کیفیت داده را دگرگون میکند. اعتبار یک مجموعه داده دیگر تنها با دقت آماری سنجیده نمیشود، بلکه عدالت در منشأ تأمین دادهها (Provenance) معیار جدید است. این تحول، پژوهشهای ایمنی را از یک چالش صرفاً آماری به یک مسئلهی حاکمیت اجتماعی-فنی تبدیل میکند.
گام بعدی شما
- مهندسان و پژوهشگران سیاستگذاری باید استقرار بنچمارکهای ایمنی جامعهمحور را رصد کنند.
- در بررسی مجموعهدادههای مورد استفاده برای تنظیم دقیق (Fine-tuning)، منشأ و مشروعیت تأمین دادهها را به عنوان یک متغیر کیفی لحاظ کنید.
- بررسی کنید آیا آزمایشگاههای بزرگ مدلهای حاکمیتی جمعی را در خطوط تولید اختصاصی خود میپذیرند یا خیر.
اما آیا مدلهای بسته هرگز اجازه این سطح از شفافیت را خواهند داد؟ تحلیل ما دربارهی چالشهای وزنهای باز (Open Weights) را بخوانید.
گفتگو