پژوهشی تازه که در سایت arxiv.org منتشر شده، بررسی میکند که آیا مدلهای زبانی بزرگ میتوانند واکنشهای عاطفی شهروندان از فرهنگهای مختلف نسبت به بروکراسی را بهدرستی شبیهسازی کنند یا خیر. این تحقیق به پرسشی اساسی در حوزه مدیریت دولتی میپردازد: آیا عوامل هوش مصنوعی میتوانند جایگزین اقتصادیتری برای مطالعات میدانی با حضور انسان باشند؟
محققان چارچوبی ارزیابی طراحی کردند تا پاسخهای عاطفی مدلهای زبانی را در بافتهای فرهنگی گوناگون بسنجند. آنها این چارچوب را در یک سناریوی بروکراتیک مشخص بهعنوان آزمون اولیه به کار بردند. یافتهها نشان داد شکاف قابلتوجهی میان شبیهسازیهای تولیدشده توسط هوش مصنوعی و پاسخهای واقعی انسانها وجود دارد.
به گفته پژوهشگران، «همه مدلها همسویی محدودی با پاسخهای عاطفی انسانی نشان میدهند» و عملکرد آنها بهویژه در مورد فرهنگهای شرقی در مقایسه با فرهنگهای غربی ضعیفتر است. این موضوع نشان میدهد که ساختارهای فعلی مدلهای زبانی فاقد ظرافت فرهنگی لازم برای درک نحوه ادراک و واکنش عاطفی جوامع مختلف نسبت به فرایندهای اداری هستند.
تیم تحقیق همچنین راهبردهای فرماندهی فرهنگی را آزمون کردند؛ روشهایی که مدلها را بهطور صریح به پذیرش دیدگاههای فرهنگی خاص هدایت میکند. اما بهطور شگفتآوری، این مداخلات در بهبود امتیازات همسویی عملاً بیاثر بودند و نشان دادند که قاببندی سطحی فرهنگی نمیتواند محدودیتهای بنیادین درک مدل را برطرف کند.
برای مقابله با این چالشها، تیم RAMO را معرفی کرد؛ رابطی تعاملی برای شبیهسازی پاسخهای عاطفی شهروندان نسبت به بوروکراسی. این پلتفرم هدفی دوگانه دارد: به محققان امکان تولید پاسخهای شبیهسازیشده را میدهد و همزمان دادههای واقعی انسانی را جمعآوری میکند. این چرخه بازخورد انسانی برای بهبود تدریجی عملکرد مدل در طول زمان طراحی شده است. این رابط بهصورت عمومی منتشر شده تا سایر پژوهشگران بتوانند در توسعه و بهرهمندی از آن مشارکت کنند.
پیامدهای این تحقیق برای پژوهشهای مدیریت دولتی قابلتوجه است. اگر این رویکرد اعتبارسنجی شود، عوامل هوش مصنوعی میتوانند هزینه و پیچیدگی مطالعه تجربیات شهروندان از خدمات دولتی را بهطور چشمگیری کاهش دهند. با این حال، یافتههای فعلی نشان میدهند که پیش از جایگزینی یا تکمیل مطالعات انسانی با این ابزارها، بهبودهای اساسی لازم است؛ بهویژه در تحلیلهای سیاستگذاری بینفرهنگی.
انتظار میرود با انتشار عمومی پلتفرم RAMO، مسیرهای تازهای برای پالایش همگانی گشوده شود. با گردآوری دادههای انسانی بیشتر و بازگرداندن آنها به آموزش مدلها، نسخههای آینده ممکن است به همسویی فرهنگی بهتری دست یابند. تا آن زمان، پژوهشگران نسبت به تکیه بر شبیهسازیهای عاطفی تولیدشده توسط مدلهای زبانی در تصمیمگیریهای سیاستگذاری پرمخاطره، بدون اعتبارسنجی گسترده انسانی، هشدار میدهند.

گفتگو