پژوهش: مدل‌های زبانی در شبیه‌سازی احساسات بوروکراتیک ناکارآمد هستند

پژوهشی تازه که در سایت arxiv.org منتشر شده، بررسی می‌کند که آیا مدل‌های زبانی بزرگ می‌توانند واکنش‌های عاطفی شهروندان از فرهنگ‌های مختلف نسبت به بروکراسی را به‌درستی شبیه‌سازی کنند یا خیر. این تحقیق به پرسشی اساسی در حوزه مدیریت دولتی می‌پردازد: آیا عوامل هوش مصنوعی می‌توانند جایگزین اقتصادی‌تری برای مطالعات میدانی با حضور انسان باشند؟

محققان چارچوبی ارزیابی طراحی کردند تا پاسخ‌های عاطفی مدل‌های زبانی را در بافت‌های فرهنگی گوناگون بسنجند. آنها این چارچوب را در یک سناریوی بروکراتیک مشخص به‌عنوان آزمون اولیه به کار بردند. یافته‌ها نشان داد شکاف قابل‌توجهی میان شبیه‌سازی‌های تولیدشده توسط هوش مصنوعی و پاسخ‌های واقعی انسان‌ها وجود دارد.

به گفته پژوهشگران، «همه مدل‌ها همسویی محدودی با پاسخ‌های عاطفی انسانی نشان می‌دهند» و عملکرد آنها به‌ویژه در مورد فرهنگ‌های شرقی در مقایسه با فرهنگ‌های غربی ضعیف‌تر است. این موضوع نشان می‌دهد که ساختارهای فعلی مدل‌های زبانی فاقد ظرافت فرهنگی لازم برای درک نحوه ادراک و واکنش عاطفی جوامع مختلف نسبت به فرایندهای اداری هستند.

تیم تحقیق همچنین راهبردهای فرمان‌دهی فرهنگی را آزمون کردند؛ روش‌هایی که مدل‌ها را به‌طور صریح به پذیرش دیدگاه‌های فرهنگی خاص هدایت می‌کند. اما به‌طور شگفت‌آوری، این مداخلات در بهبود امتیازات همسویی عملاً بی‌اثر بودند و نشان دادند که قاب‌بندی سطحی فرهنگی نمی‌تواند محدودیت‌های بنیادین درک مدل را برطرف کند.

برای مقابله با این چالش‌ها، تیم RAMO را معرفی کرد؛ رابطی تعاملی برای شبیه‌سازی پاسخ‌های عاطفی شهروندان نسبت به بوروکراسی. این پلتفرم هدفی دوگانه دارد: به محققان امکان تولید پاسخ‌های شبیه‌سازی‌شده را می‌دهد و همزمان داده‌های واقعی انسانی را جمع‌آوری می‌کند. این چرخه بازخورد انسانی برای بهبود تدریجی عملکرد مدل در طول زمان طراحی شده است. این رابط به‌صورت عمومی منتشر شده تا سایر پژوهشگران بتوانند در توسعه و بهره‌مندی از آن مشارکت کنند.

پیامدهای این تحقیق برای پژوهش‌های مدیریت دولتی قابل‌توجه است. اگر این رویکرد اعتبارسنجی شود، عوامل هوش مصنوعی می‌توانند هزینه و پیچیدگی مطالعه تجربیات شهروندان از خدمات دولتی را به‌طور چشمگیری کاهش دهند. با این حال، یافته‌های فعلی نشان می‌دهند که پیش از جایگزینی یا تکمیل مطالعات انسانی با این ابزارها، بهبودهای اساسی لازم است؛ به‌ویژه در تحلیل‌های سیاست‌گذاری بین‌فرهنگی.

انتظار می‌رود با انتشار عمومی پلتفرم RAMO، مسیرهای تازه‌ای برای پالایش همگانی گشوده شود. با گردآوری داده‌های انسانی بیشتر و بازگرداندن آنها به آموزش مدل‌ها، نسخه‌های آینده ممکن است به همسویی فرهنگی بهتری دست یابند. تا آن زمان، پژوهشگران نسبت به تکیه بر شبیه‌سازی‌های عاطفی تولیدشده توسط مدل‌های زبانی در تصمیم‌گیری‌های سیاست‌گذاری پرمخاطره، بدون اعتبارسنجی گسترده انسانی، هشدار می‌دهند.

این گزارش با خط‌لولهٔ خودکار دات‌هوش از منابع معتبر جهانی تدوین و زیر نظر تحریریه منتشر شده است. روش کار ما

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

اخبار روزانه، معرفی ابزارها و مدل‌ها، و آموزشِ کار با هوش مصنوعی؛ همیشه با این پرسش که از ایران چه چیزی کار می‌کند و چه چیزی نه.

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

پژوهش: مدل‌های زبانی در شبیه‌سازی احساسات بوروکراتیک ناکارآمد هستند

منابع

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

پژوهش: مدل‌های زبانی در شبیه‌سازی احساسات بوروکراتیک ناکارآمد هستند

منابع

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

پژوهش: مدل‌های زبانی در شبیه‌سازی احساسات بوروکراتیک ناکارآمد هستند

منابع

مقاله‌های مرتبطهمه ←

سرمایه‌گذاری سری B: ۳۱۰ میلیون دلار برای شبیه‌سازی فیزیک در Odyssey

هگینگ‌فیس با استاندارد ARD جست‌وجوی ابزارها برای عامل‌ها را خودکار کرد

«پیش‌بینی مسیر از طریق متن»؛ دستاورد جدید مؤسسه AllenAI در فضای سه‌بعدی

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

پژوهش: مدل‌های زبانی در شبیه‌سازی احساسات بوروکراتیک ناکارآمد هستند

منابع

مقاله‌های مرتبطهمه ←

سرمایه‌گذاری سری B: ۳۱۰ میلیون دلار برای شبیه‌سازی فیزیک در Odyssey

هگینگ‌فیس با استاندارد ARD جست‌وجوی ابزارها برای عامل‌ها را خودکار کرد

«پیش‌بینی مسیر از طریق متن»؛ دستاورد جدید مؤسسه AllenAI در فضای سه‌بعدی

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

راهنمای فارسی هوش مصنوعی — با نگاه به ایران