چرا قوانین مقیاس‌پذیری در حذف کلیشه‌های اجتماعی مدل‌های زبانی شکست می‌خورند؟

باید بپذیریم که هیچ مدل زبانی بزرگ (Large Language Model) فعلی، فارغ از تعداد پارامترها یا سازنده‌اش، از بازتولید کلیشه‌های اجتماعی مضر در تولیدات باز پاک نیست. طبق گزارشی که در ۱۲ مه ۲۰۲۶ در arXiv منتشر شد، این سوگیری‌ها خطاهای تصادفی نیستند، بلکه الگوهای مشترکی هستند که در تمامی ارائه‌دهندگان هوش مصنوعی دیده می‌شوند.

این یافته‌ها در حالی منتشر می‌شود که صنعت در تلاش است از بنچمارک‌های ایمنی متمرکز بر زبان انگلیسی عبور کند. همان‌طور که در تحلیل‌های پیشین ما درباره‌ی همراستاسازی (Alignment) مدل‌ها اشاره کردیم، تصور بر این بود که افزایش مقیاس می‌تواند منجر به خنثی‌سازی سوگیری‌ها شود؛ اما پژوهش StereoTales ثابت می‌کند که قوانین مقیاس‌پذیری (Scaling Laws) مشکل سوگیری اجتماعی را حل نمی‌کنند، بلکه تنها نحوه ظهور آن را تغییر می‌دهند.

پژوهشگران برای این مطالعه، یک خط لوله ارزیابی سیستماتیک به نام StereoTales طراحی کردند که بیش از ۶۵۰ هزار داستان تولید شده توسط ۲۳ مدل مختلف را تحلیل کرده است. جزئیات فنی این ارزیابی شامل موارد زیر است:

گستره چندزبانه: پوشش ۱۰ زبان مختلف.
عمق اجتماعی-دموگرافیک: تحلیل ۷۹ ویژگی در ۱۹ بُعد برای پروفایل شخصیت‌های داستان.
کمی‌سازی سوگیری: شناسایی بیش از ۱,۵۰۰ تداعی بیش‌ازحد (Over-represented) که «مضر» ارزیابی شده‌اند.
همسویی داوری: ضریب همبستگی اسپیرمن $\rho=0.62$ بین داوران انسانی (۲۴۷ نفر) و قضاوت‌های مدل‌محور.

بر اساس مستندات این پژوهش، این شواهد فرضیه «ایمن‌تر بودن» مدل‌های بزرگ‌تر را به‌طور بنیادین به چالش می‌کشد. حیاتی‌ترین نکته این است که زبان پرامپت به عنوان یک «ماشه» عمل می‌کند؛ به این معنا که تداعی‌های مضر به‌صورت فرهنگی با زبان پرامپت تطبیق می‌یابند و سوگیری‌ها علیه گروه‌هایی که در آن بافت زبانی خاص برجسته‌تر هستند، تقویت می‌شوند. بنابراین، مدلی ممکن است در زبان انگلیسی «ایمن» به نظر برسد، اما هنگام دریافت پرامپت به زبانی دیگر، سوگیری‌های منطقه‌ای شدیدی از خود نشان دهد.

گام بعدی شما

توسعه‌دهندگان باید از کد باز و مجموعه‌داده‌های StereoTales برای بازرسی سوگیری‌های زبانی مدل‌های خود استفاده کنند.
تحلیلگران ایمنی باید تمرکز خود را از بنچمارک‌های تک‌زبانه به ارزیابی‌های تطبیقی فرهنگی منتقل کنند.
بررسی کنید که آیا مدل شما در زبان‌های غیرانگلیسی، رفتارهای متفاوتی در مورد کلیشه‌های جنسیتی یا قومیتی نشان می‌دهد یا خیر.

اما داستان سخت‌افزاری این تحول و تأثیر آن بر هزینه‌های استنتاج حتی پیچیده‌تر است — به تحلیل ما درباره‌ی بهینه‌سازی‌های لایه استنتاج مراجعه کنید.

این گزارش با خط‌لولهٔ خودکار دات‌هوش از منابع معتبر جهانی تدوین و زیر نظر تحریریه منتشر شده است. روش کار ما

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

اخبار روزانه، معرفی ابزارها و مدل‌ها، و آموزشِ کار با هوش مصنوعی؛ همیشه با این پرسش که از ایران چه چیزی کار می‌کند و چه چیزی نه.

گستره چندزبانه: پوشش ۱۰ زبان مختلف.
عمق اجتماعی-دموگرافیک: تحلیل ۷۹ ویژگی در ۱۹ بُعد برای پروفایل شخصیت‌های داستان.
کمی‌سازی سوگیری: شناسایی بیش از ۱,۵۰۰ تداعی بیش‌ازحد (Over-represented) که «مضر» ارزیابی شده‌اند.
همسویی داوری: ضریب همبستگی اسپیرمن $\rho=0.62$ بین داوران انسانی (۲۴۷ نفر) و قضاوت‌های مدل‌محور.

گام بعدی شما

توسعه‌دهندگان باید از کد باز و مجموعه‌داده‌های StereoTales برای بازرسی سوگیری‌های زبانی مدل‌های خود استفاده کنند.
تحلیلگران ایمنی باید تمرکز خود را از بنچمارک‌های تک‌زبانه به ارزیابی‌های تطبیقی فرهنگی منتقل کنند.
بررسی کنید که آیا مدل شما در زبان‌های غیرانگلیسی، رفتارهای متفاوتی در مورد کلیشه‌های جنسیتی یا قومیتی نشان می‌دهد یا خیر.

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

چرا قوانین مقیاس‌پذیری در حذف کلیشه‌های اجتماعی مدل‌های زبانی شکست می‌خورند؟

گام بعدی شما

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

چرا قوانین مقیاس‌پذیری در حذف کلیشه‌های اجتماعی مدل‌های زبانی شکست می‌خورند؟

گام بعدی شما

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

چرا قوانین مقیاس‌پذیری در حذف کلیشه‌های اجتماعی مدل‌های زبانی شکست می‌خورند؟

گام بعدی شما

مقاله‌های مرتبطهمه ←

سرمایه‌گذاری سری B: ۳۱۰ میلیون دلار برای شبیه‌سازی فیزیک در Odyssey

هگینگ‌فیس با استاندارد ARD جست‌وجوی ابزارها برای عامل‌ها را خودکار کرد

«پیش‌بینی مسیر از طریق متن»؛ دستاورد جدید مؤسسه AllenAI در فضای سه‌بعدی

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

اصطلاحات این مطلب

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

چرا قوانین مقیاس‌پذیری در حذف کلیشه‌های اجتماعی مدل‌های زبانی شکست می‌خورند؟

گام بعدی شما

مقاله‌های مرتبطهمه ←

سرمایه‌گذاری سری B: ۳۱۰ میلیون دلار برای شبیه‌سازی فیزیک در Odyssey

هگینگ‌فیس با استاندارد ARD جست‌وجوی ابزارها برای عامل‌ها را خودکار کرد

«پیش‌بینی مسیر از طریق متن»؛ دستاورد جدید مؤسسه AllenAI در فضای سه‌بعدی

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

اصطلاحات این مطلب

راهنمای فارسی هوش مصنوعی — با نگاه به ایران