درون مدل Flint؛ بازگرداندن خلاقیت به جای میانگین‌گیری در AI

تصور کنید از سه مدل برتر هوش مصنوعی مانند کلود (Claude)، چت‌جی‌پی‌تی (ChatGPT) و جمینای (Gemini) بخواهید عددی تصادفی بین ۱ تا ۱۰ انتخاب کنند؛ احتمالاً هر سه مدل عدد ۷ را برمی‌گردانند. این پیش‌بینی‌پذیری خسته‌کننده، در واقع یک نقص سیستمی در مدل‌های زبانی بزرگ (LLM) مدرن است که باعث ایجاد یک «شیار تفکر جمعی» (groupthink groove) می‌شود و در نهایت خلاقیت در طوفان فکری و برنامه‌ریزی‌های استراتژیک را سرکوب می‌کند. اگر دوباره عدد دیگری بخواهید، احتمالاً ۳ یا ۴ و سپس ۸ یا ۹ را دریافت خواهید کرد. این الگو در پلتفرم‌های مختلف به طرز عجیبی سازگار است؛ چیزی که پیپ بینگمن (Pip Bingemann) آن را یک «ترفند فروش» می‌نامد که تقریباً هر بار جواب می‌دهد.

در حالی که ثبات و تکرارپذیری برای کدنویسی یا پژوهش‌های علمی یک ویژگی مثبت است، اما برای هر کسی که به دنبال نوآوری و ایده‌های تازه است، این یک «باگ» یا نقص محسوب می‌شود. این تنش میان قابلیت اطمینان و خلاقیت، در واقع امتداد روند گسترده‌تری در توسعه هوش مصنوعی است. همان‌طور که در پوشش‌های قبلی خود درباره این موضوع بحث کردیم که چگونه توکن‌های طراحی (design tokens)، مدل‌های زبانی را مجبور می‌کنند کدهای رابط کاربری (UI) یکسانی تولید کنند، کل صنعت سال‌هاست که برای رسیدن به «میانگینِ» پاسخ صحیح بهینه‌سازی می‌کند. این روند در عمل باعث شده تا هرگونه ویژگی خاص یا «عجیب‌وغریب» (eccentricity) از شخصیت هوش مصنوعی زدوده شود.

شرکت OpenAI در تایید این موضوع اذعان کرده است که آموزش مدل‌ها برای دستیابی به پایداری و انسجام، باعث می‌شود مدل‌ها به دور پاسخ‌هایی با احتمال وقوع بالا همگرا شوند. این شرکت اشاره می‌کند که فشار برای ایجاد نوآوری در پاسخ‌ها می‌تواند منجر به خروجی‌های ضعیف‌تر یا کمتر قابل‌اعتماد شود. همچنین OpenAI خاطرنشان کرد که تحقیقاتی که این همگونی را افشا کرده‌اند، مدل‌های سال ۲۰۲۴ را مورد مطالعه قرار داده‌اند که از آن زمان تاکنون به‌روزرسانی شده‌اند.

ذهنیت جمعی مصنوعی

یک مقاله پژوهشی با عنوان «ذهنیت جمعی مصنوعی: همگونی باز-پایان مدل‌های زبانی (و فراتر از آن)» در نوامبر ۲۰۲۴ این تکرار سیستماتیک را افشا کرد. این مطالعه که موفق شد جایزه بهترین مقاله در کنفرانس معتبر NeurIPS را کسب کند، دریافت که مدل‌های مختلف زبانی در پاسخ به پرسش‌های باز (Open-ended)، به نتایجی تقریباً یکسان می‌رسند. محققان گمان می‌برند دلیل این اتفاق آن است که اکثر مدل‌های زبانی فعلی به روش‌های مشابه، با استفاده از داده‌های مشابه و برای انجام وظایفی یکسان آموزش دیده‌اند.

در یک آزمایش دقیق، پژوهشگران ۲۵ مدل مختلف — که طیفی از شرکت‌های برتر آمریکایی تا مدل‌های متن‌باز چینی را شامل می‌شد — مورد آزمایش قرار دادند. از هر مدل ۵۰ بار خواسته شد تا استعاره‌ای درباره «زمان» بنویسد. در مجموع از میان ۱۲۵۰ پاسخ، اکثریت مطلق روی عباراتی چون «زمان یک رودخانه است» یا «زمان یک بافنده است» متمرکز بودند. در مقابل، پاسخ‌های انسانی بسیار متنوع‌تر بودند؛ برای مثال، یک انسان ممکن است زمان را به «پیراهنی قدیمی که اثر سال‌ها پوشیدن روی آن مانده است» تشبیه کند.

کیران براون (Kieran Browne)، مدیر فنی استارتاپ Springboards، استدلال می‌کند که طراحی اکثر رابط‌های کاربری چت، این واقعیت را پنهان می‌کند. از آنجایی که رابط کاربری حس یک مکالمه شخصی و منحصربه‌فرد را القا می‌کند، اکثر کاربران متوجه نمی‌شوند که در واقع همان محتوای پردازش‌شده‌ای را دریافت می‌کنند که میلیون‌ها نفر دیگر نیز گرفته‌اند.

رویکرد Springboards و مدل Flint

برای شکستن این چرخه تکرار، استارتاپ استرالیایی Springboards مدل Flint را توسعه داد. این مدل به گونه‌ای طراحی شده است که طیف وسیع‌تری از پاسخ‌ها را به پرسش‌های باز ارائه دهد؛ مثلاً در پاسخ به سوال «در اروپا به کجا سفر کنم؟». در حالی که اکثر مدل‌های زبانی در حال جنگ برای حذف توهم (Hallucination) — یعنی زمانی که مدل با اطمینان کامل چیزی را می‌گوید که وجود خارجی ندارد — هستند، پیپ بینگمن، بنیان‌گذار و مدیرعامل Springboards، می‌گوید: «ما از توهمات استقبال می‌کنیم».

آن‌ها برای کاهش هزینه‌ها و با توجه به اینکه ساخت یک مدل بنیادی (Foundation Model) از صفر برای یک تیم کوچک بیش از حد گران است، Flint را بر پایه Qwen 3 بنا کردند؛ مدل متن‌بازی که توسط غول فناوری چینی، علی‌بابا، توسعه یافته است.

مدل‌های زبانی در چرخه گروه‌اندیشی گیر کرده‌اند؛ این استارتاپ تلاش می‌کند آن‌ها را از آن خارج کند.

کیران براون، مدیر فنی Springboards، توضیح می‌دهد که روش‌های سنتی برای افزایش خلاقیت مدل‌ها بیش از حد «کُند و زمخت» هستند. اکثر مدل‌ها از تنظیمی به نام «Temperature» (دمای مدل) برای مدیریت میزان تصادفی بودن استفاده می‌کنند. با این حال، بالا بردن دما به حداکثر، اغلب منجر به بی‌معنا شدن متن (incoherence) می‌شود. براون مشاهده کرد که یکی از مدل‌های OpenAI در حالی که داشت انگلیسی صحبت می‌کرد، ناگهان در میانه‌ی جمله به نوشتن کد برنامه‌نویسی تغییر وضعیت داد.

تصادفی‌سازی گزینشی

تیم Springboards به این نتیجه رسید که پارامترهایی مانند Temperature ابزارهای دقیقی نیستند. منطقی نیست که تصادفی‌سازی را به طور کلی در تمام متن بالا ببریم؛ بلکه باید آن را فقط در نقاط خاصی از خروجی تقویت کرد.

سازوکار: اگر کاربر بپرسد «در اروپا به کجا سفر کنم؟»، مدل نباید تمام کلمات جمله را تصادفی کند، بلکه فقط باید لحظه‌ی انتخاب «نام مقصد» را تغییر دهد و تصادفی‌سازی را در آن نقطه افزایش دهد.
آموزش: آن‌ها نسخه تغییریافته Qwen 3 را طوری آموزش دادند که نقاطی را که امکان تنوع بیشتر در آن‌ها وجود دارد شناسایی کند و سپس آن نقاط را با کلمات یا عبارات تصادفی‌تر پر کند.

به گفته ماکسیمیلیان ویگل (Maximilian Weigl)، بنیان‌گذار و مدیر استراتژی شرکت بازاریابی Uncommon، این روش در واقع یک «دعوت به تفکر گسترده‌تر» ایجاد می‌کند.

شواهدی از گسست

توانایی Flint در فرار از «ذهنیت جمعی» در چندین مقایسه مستقیم مشهود است:

آزمون عدد تصادفی: در حالی که ChatGPT و Claude به طور مداوم عدد ۷ را برمی‌گرداندند، Flint در یک جلسه عدد دقیق ۳.۷۹۱۶ را تولید کرد (البته بینگمن اشاره می‌کند که Flint هم ممکن است ۷ بدهد، چون ۷ هم یک پاسخ معتبر است، اما مدل محدود به آن نیست).
مثال خودرو: وقتی از مدل‌های رایج خواسته شد نوعی خودرو را نام ببرند، آن‌ها تویوتا یا هوندا را پیش‌بینی کردند. اما Flint مدل Ford F-150 را پیشنهاد داد. بینگمن می‌گوید هرچند مدل‌ها قادرند نام‌هایی مثل «بیوک» یا «تسلا» را بیاورند، اما تمایلی (bias) به این کار ندارند و همین باعث از دست رفتن اطلاعات متنوع می‌شود.
شعارهای تبلیغاتی: برای یک کمپین برند New Balance، مدل‌های کلود و چت‌جی‌پی‌تی هر دو عبارت «Run your way» (به روش خودت بدو) را تولید کردند، اما Flint عبارت «Built to last, run to win» (ساخته برای ماندگاری، بدو برای پیروزی) را پیشنهاد داد.
نام‌گذاری گروه موسیقی: اکثر مدل‌ها نام‌هایی پیشنهاد می‌کنند که کلمات «glass» (شیشه)، «neon» (نئون)، «velvet» (مخمل) یا «static» (استاتیک) در آن‌ها باشد. در یک تست، ChatGPT فهرستی از ۵۶ نام شامل «Glass Harbor»، «Static Empire»، «Neon Hearts» و «Velvet Echo» داد، در حالی که Gemini نام «Static Horizon» را پیشنهاد کرد.

کاربردهای واقعی

شرکت Springboards ابزاری را توسعه داده است که توسط مجموعه‌ای از مدل‌های زبانی (از جمله ChatGPT و Claude) پشتیبانی می‌شود و مخصوص متخصصان خلاق در حوزه‌ی تبلیغات و بازاریابی است. این ابزار به کاربران اجازه می‌دهد متون تولید شده توسط مدل‌های مختلف را جابه‌جا کنند، بخش‌های مورد علاقه خود را انتخاب کرده و آن‌ها را برای خلق چیزی جدید ترکیب کنند.

زویی اسکمَن (Zoe Scaman)، بنیان‌گذار Bodacious و مدیر استراتژی 77X (پلتفرمی که توسط لوکا دونچیچ، بازیکن ال‌ای لیکرز، تأسیس شده)، از Flint برای «پرتاب» افکار خود در جلسات استراتژی کسب‌وکار استفاده می‌کند. در یک تست مربوط به مطالعه موردی MBA درباره بازنگری در امور مالی برای نسل جوان، مدل‌های رایج پیشنهاد دادند که سواد مالی به روشی «سرگرم‌کننده و فانتزی» (fun and funky) آموزش داده شود؛ چیزی که اسکمَن آن را تکراری و قدیمی دانست. اما Flint پیشنهاد یک بازطراحی کامل (Rebrand) برای کل مفهوم «انباشت ثروت» را ارائه داد.

ماکسیمیلیان ویگل خاطرنشان می‌کند که اگرچه Flint ابزاری قدرتمند برای ایده‌های مرز‌شکن است، اما هنوز یک نمونه اولیه (prototype) است و گاهی وقتی بیش از حد به چالش کشیده شود، «از کار می‌افتد» یا دچار خطا می‌شود. او تأکید می‌کند که پاسخ‌های میانگین در ۹۰٪ مواقع کافی هستند، زیرا اکثر مردم به دنبال «چیزهای آشنا و بازارپسند» هستند.

با این حال، او نسبت به اتکای بیش از حد به هر نوع هوش مصنوعی هشدار می‌دهد. وی می‌گوید اگر ببیند اعضای تیمش خروجی AI را کپی-پیست می‌کنند، به آن‌ها خواهد گفت: «این شغل تو نیست! فکر کن، با آدم‌های دیگر حرف بزن و از صدای خودت استفاده کن».

این تغییر رویکرد نشان می‌دهد که مرز بعدی کاربردی بودن مدل‌های زبانی، دیگر فقط در «دقت» نیست، بلکه در توانایی جابه‌جایی میان حالت‌های «ایمن/میانگین» و «ریسک‌پذیر/خلاقانه» است، بدون اینکه انسجام زبانی از بین برود.

برای کسانی که برای کارهای خلاقانه به AI تکیه می‌کنند، خطر اصلی تبدیل شدن به یک «دنیای خاکستری و خسته‌کننده» است که در آن ماشین‌ها مرزهای تخیل را تعیین می‌کنند. هدف Springboards این است که حق انتخاب را به انسان بازگرداند و تصمیم‌گیری درباره اینکه نتیجه نهایی خوب است یا نه، را به کاربر واگذار کند. در نهایت، این انسان است که قضاوت می‌کند آیا یک پاسخ متفاوت، یک نبوغ درخشان است یا صرفاً یک توهم.

برای اینکه ببینید آیا ابزارهای فعلی شما نیز در این شیار تکرار گیر کرده‌اند، از سه مدل مختلف بخواهید نامی برای یک گروه موسیقی پیشنهاد دهند؛ احتمالاً تعداد زیادی نتیجه شامل کلمات «نئون»، «مخمل» یا «استاتیک» خواهید دید. شاید حتی نامی مثل «Sofa Astronauts» را پیدا کنید که در ابتدا original به نظر می‌رسد، اما با یک جستجوی ساده در گوگل متوجه شوید که همین حالا هم گروهی با این نام وجود دارد.

گام بعدی شما

برای تست «ذهنیت جمعی»، از سه مدل مختلف بخواهید نام یک گروه موسیقی یا یک استعاره برای «زمان» بنویسند و تکرارها را بشمارید.
اگر در کارهای خلاقانه هستید، از ترکیب خروجی‌های مدل‌های مختلف (Mixed-model approach) به جای اتکای تک‌مدلی استفاده کنید.
پارامتر Temperature را در مدل‌هایی که دسترسی دارید تغییر دهید تا مرز بین انسجام و آشفتگی را شناسایی کنید.

اما داستان سخت‌افزاری این تحول حتی شگفت‌انگیزتر است — به تحلیل ما درباره‌ی تراشه‌های Blackwell مراجعه کنید.

این گزارش با خط‌لولهٔ خودکار دات‌هوش از منابع معتبر جهانی تدوین و زیر نظر تحریریه منتشر شده است. روش کار ما

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

اخبار روزانه، معرفی ابزارها و مدل‌ها، و آموزشِ کار با هوش مصنوعی؛ همیشه با این پرسش که از ایران چه چیزی کار می‌کند و چه چیزی نه.

ذهنیت جمعی مصنوعی

رویکرد Springboards و مدل Flint

مدل‌های زبانی در چرخه گروه‌اندیشی گیر کرده‌اند؛ این استارتاپ تلاش می‌کند آن‌ها را از آن خارج کند.

تصادفی‌سازی گزینشی

سازوکار: اگر کاربر بپرسد «در اروپا به کجا سفر کنم؟»، مدل نباید تمام کلمات جمله را تصادفی کند، بلکه فقط باید لحظه‌ی انتخاب «نام مقصد» را تغییر دهد و تصادفی‌سازی را در آن نقطه افزایش دهد.
آموزش: آن‌ها نسخه تغییریافته Qwen 3 را طوری آموزش دادند که نقاطی را که امکان تنوع بیشتر در آن‌ها وجود دارد شناسایی کند و سپس آن نقاط را با کلمات یا عبارات تصادفی‌تر پر کند.

شواهدی از گسست

توانایی Flint در فرار از «ذهنیت جمعی» در چندین مقایسه مستقیم مشهود است:

آزمون عدد تصادفی: در حالی که ChatGPT و Claude به طور مداوم عدد ۷ را برمی‌گرداندند، Flint در یک جلسه عدد دقیق ۳.۷۹۱۶ را تولید کرد (البته بینگمن اشاره می‌کند که Flint هم ممکن است ۷ بدهد، چون ۷ هم یک پاسخ معتبر است، اما مدل محدود به آن نیست).
مثال خودرو: وقتی از مدل‌های رایج خواسته شد نوعی خودرو را نام ببرند، آن‌ها تویوتا یا هوندا را پیش‌بینی کردند. اما Flint مدل Ford F-150 را پیشنهاد داد. بینگمن می‌گوید هرچند مدل‌ها قادرند نام‌هایی مثل «بیوک» یا «تسلا» را بیاورند، اما تمایلی (bias) به این کار ندارند و همین باعث از دست رفتن اطلاعات متنوع می‌شود.
شعارهای تبلیغاتی: برای یک کمپین برند New Balance، مدل‌های کلود و چت‌جی‌پی‌تی هر دو عبارت «Run your way» (به روش خودت بدو) را تولید کردند، اما Flint عبارت «Built to last, run to win» (ساخته برای ماندگاری، بدو برای پیروزی) را پیشنهاد داد.
نام‌گذاری گروه موسیقی: اکثر مدل‌ها نام‌هایی پیشنهاد می‌کنند که کلمات «glass» (شیشه)، «neon» (نئون)، «velvet» (مخمل) یا «static» (استاتیک) در آن‌ها باشد. در یک تست، ChatGPT فهرستی از ۵۶ نام شامل «Glass Harbor»، «Static Empire»، «Neon Hearts» و «Velvet Echo» داد، در حالی که Gemini نام «Static Horizon» را پیشنهاد کرد.

کاربردهای واقعی

گام بعدی شما

برای تست «ذهنیت جمعی»، از سه مدل مختلف بخواهید نام یک گروه موسیقی یا یک استعاره برای «زمان» بنویسند و تکرارها را بشمارید.
اگر در کارهای خلاقانه هستید، از ترکیب خروجی‌های مدل‌های مختلف (Mixed-model approach) به جای اتکای تک‌مدلی استفاده کنید.
پارامتر Temperature را در مدل‌هایی که دسترسی دارید تغییر دهید تا مرز بین انسجام و آشفتگی را شناسایی کنید.

اما داستان سخت‌افزاری این تحول حتی شگفت‌انگیزتر است — به تحلیل ما درباره‌ی تراشه‌های Blackwell مراجعه کنید.

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

درون مدل Flint؛ بازگرداندن خلاقیت به جای میانگین‌گیری در AI

ذهنیت جمعی مصنوعی

رویکرد Springboards و مدل Flint

تصادفی‌سازی گزینشی

شواهدی از گسست

کاربردهای واقعی

گام بعدی شما

منابع

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

درون مدل Flint؛ بازگرداندن خلاقیت به جای میانگین‌گیری در AI

ذهنیت جمعی مصنوعی

رویکرد Springboards و مدل Flint

تصادفی‌سازی گزینشی

شواهدی از گسست

کاربردهای واقعی

گام بعدی شما

منابع

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

درون مدل Flint؛ بازگرداندن خلاقیت به جای میانگین‌گیری در AI

ذهنیت جمعی مصنوعی

رویکرد Springboards و مدل Flint

تصادفی‌سازی گزینشی

شواهدی از گسست

کاربردهای واقعی

گام بعدی شما

منابع

مقاله‌های مرتبطهمه ←

«تهدید امنیت ملی»؛ هشدار کشورهای G7 به انحصار مدل‌های آمریکایی

«پیش‌بینی مسیر از طریق متن»؛ دستاورد جدید مؤسسه AllenAI در فضای سه‌بعدی

Z.ai: برتری GLM-5.2 بر GPT-5.5 در کدنویسی بلندمدت

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

مدل‌ها و ابزارهای مرتبط

اصطلاحات این مطلب

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

درون مدل Flint؛ بازگرداندن خلاقیت به جای میانگین‌گیری در AI

ذهنیت جمعی مصنوعی

رویکرد Springboards و مدل Flint

تصادفی‌سازی گزینشی

شواهدی از گسست

کاربردهای واقعی

گام بعدی شما

منابع

مقاله‌های مرتبطهمه ←

«تهدید امنیت ملی»؛ هشدار کشورهای G7 به انحصار مدل‌های آمریکایی

«پیش‌بینی مسیر از طریق متن»؛ دستاورد جدید مؤسسه AllenAI در فضای سه‌بعدی

Z.ai: برتری GLM-5.2 بر GPT-5.5 در کدنویسی بلندمدت

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

مدل‌ها و ابزارهای مرتبط

اصطلاحات این مطلب

راهنمای فارسی هوش مصنوعی — با نگاه به ایران