تصور کنید از سه مدل برتر هوش مصنوعی مانند کلود (Claude)، چتجیپیتی (ChatGPT) و جمینای (Gemini) بخواهید عددی تصادفی بین ۱ تا ۱۰ انتخاب کنند؛ احتمالاً هر سه مدل عدد ۷ را برمیگردانند. این پیشبینیپذیری خستهکننده، در واقع یک نقص سیستمی در مدلهای زبانی بزرگ (LLM) مدرن است که باعث ایجاد یک «شیار تفکر جمعی» (groupthink groove) میشود و در نهایت خلاقیت در طوفان فکری و برنامهریزیهای استراتژیک را سرکوب میکند. اگر دوباره عدد دیگری بخواهید، احتمالاً ۳ یا ۴ و سپس ۸ یا ۹ را دریافت خواهید کرد. این الگو در پلتفرمهای مختلف به طرز عجیبی سازگار است؛ چیزی که پیپ بینگمن (Pip Bingemann) آن را یک «ترفند فروش» مینامد که تقریباً هر بار جواب میدهد.
در حالی که ثبات و تکرارپذیری برای کدنویسی یا پژوهشهای علمی یک ویژگی مثبت است، اما برای هر کسی که به دنبال نوآوری و ایدههای تازه است، این یک «باگ» یا نقص محسوب میشود. این تنش میان قابلیت اطمینان و خلاقیت، در واقع امتداد روند گستردهتری در توسعه هوش مصنوعی است. همانطور که در پوششهای قبلی خود درباره این موضوع بحث کردیم که چگونه توکنهای طراحی (design tokens)، مدلهای زبانی را مجبور میکنند کدهای رابط کاربری (UI) یکسانی تولید کنند، کل صنعت سالهاست که برای رسیدن به «میانگینِ» پاسخ صحیح بهینهسازی میکند. این روند در عمل باعث شده تا هرگونه ویژگی خاص یا «عجیبوغریب» (eccentricity) از شخصیت هوش مصنوعی زدوده شود.
شرکت OpenAI در تایید این موضوع اذعان کرده است که آموزش مدلها برای دستیابی به پایداری و انسجام، باعث میشود مدلها به دور پاسخهایی با احتمال وقوع بالا همگرا شوند. این شرکت اشاره میکند که فشار برای ایجاد نوآوری در پاسخها میتواند منجر به خروجیهای ضعیفتر یا کمتر قابلاعتماد شود. همچنین OpenAI خاطرنشان کرد که تحقیقاتی که این همگونی را افشا کردهاند، مدلهای سال ۲۰۲۴ را مورد مطالعه قرار دادهاند که از آن زمان تاکنون بهروزرسانی شدهاند.
ذهنیت جمعی مصنوعی
یک مقاله پژوهشی با عنوان «ذهنیت جمعی مصنوعی: همگونی باز-پایان مدلهای زبانی (و فراتر از آن)» در نوامبر ۲۰۲۴ این تکرار سیستماتیک را افشا کرد. این مطالعه که موفق شد جایزه بهترین مقاله در کنفرانس معتبر NeurIPS را کسب کند، دریافت که مدلهای مختلف زبانی در پاسخ به پرسشهای باز (Open-ended)، به نتایجی تقریباً یکسان میرسند. محققان گمان میبرند دلیل این اتفاق آن است که اکثر مدلهای زبانی فعلی به روشهای مشابه، با استفاده از دادههای مشابه و برای انجام وظایفی یکسان آموزش دیدهاند.
در یک آزمایش دقیق، پژوهشگران ۲۵ مدل مختلف — که طیفی از شرکتهای برتر آمریکایی تا مدلهای متنباز چینی را شامل میشد — مورد آزمایش قرار دادند. از هر مدل ۵۰ بار خواسته شد تا استعارهای درباره «زمان» بنویسد. در مجموع از میان ۱۲۵۰ پاسخ، اکثریت مطلق روی عباراتی چون «زمان یک رودخانه است» یا «زمان یک بافنده است» متمرکز بودند. در مقابل، پاسخهای انسانی بسیار متنوعتر بودند؛ برای مثال، یک انسان ممکن است زمان را به «پیراهنی قدیمی که اثر سالها پوشیدن روی آن مانده است» تشبیه کند.
کیران براون (Kieran Browne)، مدیر فنی استارتاپ Springboards، استدلال میکند که طراحی اکثر رابطهای کاربری چت، این واقعیت را پنهان میکند. از آنجایی که رابط کاربری حس یک مکالمه شخصی و منحصربهفرد را القا میکند، اکثر کاربران متوجه نمیشوند که در واقع همان محتوای پردازششدهای را دریافت میکنند که میلیونها نفر دیگر نیز گرفتهاند.
رویکرد Springboards و مدل Flint
برای شکستن این چرخه تکرار، استارتاپ استرالیایی Springboards مدل Flint را توسعه داد. این مدل به گونهای طراحی شده است که طیف وسیعتری از پاسخها را به پرسشهای باز ارائه دهد؛ مثلاً در پاسخ به سوال «در اروپا به کجا سفر کنم؟». در حالی که اکثر مدلهای زبانی در حال جنگ برای حذف توهم (Hallucination) — یعنی زمانی که مدل با اطمینان کامل چیزی را میگوید که وجود خارجی ندارد — هستند، پیپ بینگمن، بنیانگذار و مدیرعامل Springboards، میگوید: «ما از توهمات استقبال میکنیم».
آنها برای کاهش هزینهها و با توجه به اینکه ساخت یک مدل بنیادی (Foundation Model) از صفر برای یک تیم کوچک بیش از حد گران است، Flint را بر پایه Qwen 3 بنا کردند؛ مدل متنبازی که توسط غول فناوری چینی، علیبابا، توسعه یافته است.

کیران براون، مدیر فنی Springboards، توضیح میدهد که روشهای سنتی برای افزایش خلاقیت مدلها بیش از حد «کُند و زمخت» هستند. اکثر مدلها از تنظیمی به نام «Temperature» (دمای مدل) برای مدیریت میزان تصادفی بودن استفاده میکنند. با این حال، بالا بردن دما به حداکثر، اغلب منجر به بیمعنا شدن متن (incoherence) میشود. براون مشاهده کرد که یکی از مدلهای OpenAI در حالی که داشت انگلیسی صحبت میکرد، ناگهان در میانهی جمله به نوشتن کد برنامهنویسی تغییر وضعیت داد.
تصادفیسازی گزینشی
تیم Springboards به این نتیجه رسید که پارامترهایی مانند Temperature ابزارهای دقیقی نیستند. منطقی نیست که تصادفیسازی را به طور کلی در تمام متن بالا ببریم؛ بلکه باید آن را فقط در نقاط خاصی از خروجی تقویت کرد.
- سازوکار: اگر کاربر بپرسد «در اروپا به کجا سفر کنم؟»، مدل نباید تمام کلمات جمله را تصادفی کند، بلکه فقط باید لحظهی انتخاب «نام مقصد» را تغییر دهد و تصادفیسازی را در آن نقطه افزایش دهد.
- آموزش: آنها نسخه تغییریافته Qwen 3 را طوری آموزش دادند که نقاطی را که امکان تنوع بیشتر در آنها وجود دارد شناسایی کند و سپس آن نقاط را با کلمات یا عبارات تصادفیتر پر کند.
به گفته ماکسیمیلیان ویگل (Maximilian Weigl)، بنیانگذار و مدیر استراتژی شرکت بازاریابی Uncommon، این روش در واقع یک «دعوت به تفکر گستردهتر» ایجاد میکند.
شواهدی از گسست
توانایی Flint در فرار از «ذهنیت جمعی» در چندین مقایسه مستقیم مشهود است:
- آزمون عدد تصادفی: در حالی که ChatGPT و Claude به طور مداوم عدد ۷ را برمیگرداندند، Flint در یک جلسه عدد دقیق ۳.۷۹۱۶ را تولید کرد (البته بینگمن اشاره میکند که Flint هم ممکن است ۷ بدهد، چون ۷ هم یک پاسخ معتبر است، اما مدل محدود به آن نیست).
- مثال خودرو: وقتی از مدلهای رایج خواسته شد نوعی خودرو را نام ببرند، آنها تویوتا یا هوندا را پیشبینی کردند. اما Flint مدل Ford F-150 را پیشنهاد داد. بینگمن میگوید هرچند مدلها قادرند نامهایی مثل «بیوک» یا «تسلا» را بیاورند، اما تمایلی (bias) به این کار ندارند و همین باعث از دست رفتن اطلاعات متنوع میشود.
- شعارهای تبلیغاتی: برای یک کمپین برند New Balance، مدلهای کلود و چتجیپیتی هر دو عبارت «Run your way» (به روش خودت بدو) را تولید کردند، اما Flint عبارت «Built to last, run to win» (ساخته برای ماندگاری، بدو برای پیروزی) را پیشنهاد داد.
- نامگذاری گروه موسیقی: اکثر مدلها نامهایی پیشنهاد میکنند که کلمات «glass» (شیشه)، «neon» (نئون)، «velvet» (مخمل) یا «static» (استاتیک) در آنها باشد. در یک تست، ChatGPT فهرستی از ۵۶ نام شامل «Glass Harbor»، «Static Empire»، «Neon Hearts» و «Velvet Echo» داد، در حالی که Gemini نام «Static Horizon» را پیشنهاد کرد.
کاربردهای واقعی
شرکت Springboards ابزاری را توسعه داده است که توسط مجموعهای از مدلهای زبانی (از جمله ChatGPT و Claude) پشتیبانی میشود و مخصوص متخصصان خلاق در حوزهی تبلیغات و بازاریابی است. این ابزار به کاربران اجازه میدهد متون تولید شده توسط مدلهای مختلف را جابهجا کنند، بخشهای مورد علاقه خود را انتخاب کرده و آنها را برای خلق چیزی جدید ترکیب کنند.
زویی اسکمَن (Zoe Scaman)، بنیانگذار Bodacious و مدیر استراتژی 77X (پلتفرمی که توسط لوکا دونچیچ، بازیکن الای لیکرز، تأسیس شده)، از Flint برای «پرتاب» افکار خود در جلسات استراتژی کسبوکار استفاده میکند. در یک تست مربوط به مطالعه موردی MBA درباره بازنگری در امور مالی برای نسل جوان، مدلهای رایج پیشنهاد دادند که سواد مالی به روشی «سرگرمکننده و فانتزی» (fun and funky) آموزش داده شود؛ چیزی که اسکمَن آن را تکراری و قدیمی دانست. اما Flint پیشنهاد یک بازطراحی کامل (Rebrand) برای کل مفهوم «انباشت ثروت» را ارائه داد.
ماکسیمیلیان ویگل خاطرنشان میکند که اگرچه Flint ابزاری قدرتمند برای ایدههای مرزشکن است، اما هنوز یک نمونه اولیه (prototype) است و گاهی وقتی بیش از حد به چالش کشیده شود، «از کار میافتد» یا دچار خطا میشود. او تأکید میکند که پاسخهای میانگین در ۹۰٪ مواقع کافی هستند، زیرا اکثر مردم به دنبال «چیزهای آشنا و بازارپسند» هستند.
با این حال، او نسبت به اتکای بیش از حد به هر نوع هوش مصنوعی هشدار میدهد. وی میگوید اگر ببیند اعضای تیمش خروجی AI را کپی-پیست میکنند، به آنها خواهد گفت: «این شغل تو نیست! فکر کن، با آدمهای دیگر حرف بزن و از صدای خودت استفاده کن».
این تغییر رویکرد نشان میدهد که مرز بعدی کاربردی بودن مدلهای زبانی، دیگر فقط در «دقت» نیست، بلکه در توانایی جابهجایی میان حالتهای «ایمن/میانگین» و «ریسکپذیر/خلاقانه» است، بدون اینکه انسجام زبانی از بین برود.
برای کسانی که برای کارهای خلاقانه به AI تکیه میکنند، خطر اصلی تبدیل شدن به یک «دنیای خاکستری و خستهکننده» است که در آن ماشینها مرزهای تخیل را تعیین میکنند. هدف Springboards این است که حق انتخاب را به انسان بازگرداند و تصمیمگیری درباره اینکه نتیجه نهایی خوب است یا نه، را به کاربر واگذار کند. در نهایت، این انسان است که قضاوت میکند آیا یک پاسخ متفاوت، یک نبوغ درخشان است یا صرفاً یک توهم.
برای اینکه ببینید آیا ابزارهای فعلی شما نیز در این شیار تکرار گیر کردهاند، از سه مدل مختلف بخواهید نامی برای یک گروه موسیقی پیشنهاد دهند؛ احتمالاً تعداد زیادی نتیجه شامل کلمات «نئون»، «مخمل» یا «استاتیک» خواهید دید. شاید حتی نامی مثل «Sofa Astronauts» را پیدا کنید که در ابتدا original به نظر میرسد، اما با یک جستجوی ساده در گوگل متوجه شوید که همین حالا هم گروهی با این نام وجود دارد.
گام بعدی شما
- برای تست «ذهنیت جمعی»، از سه مدل مختلف بخواهید نام یک گروه موسیقی یا یک استعاره برای «زمان» بنویسند و تکرارها را بشمارید.
- اگر در کارهای خلاقانه هستید، از ترکیب خروجیهای مدلهای مختلف (Mixed-model approach) به جای اتکای تکمدلی استفاده کنید.
- پارامتر Temperature را در مدلهایی که دسترسی دارید تغییر دهید تا مرز بین انسجام و آشفتگی را شناسایی کنید.
اما داستان سختافزاری این تحول حتی شگفتانگیزتر است — به تحلیل ما دربارهی تراشههای Blackwell مراجعه کنید.




گفتگو