جمینای در برابر انسان؛ رقابت استدلال منطقی در بازی Color Queens

آیا شهود منطقی انسان می‌تواند در یک مسابقه مستقیم، به‌طور مداوم بر یک مدل زبانی بزرگ پیروز شود؟ در ۲۱ ژوئن ۲۰۲۶، برنامه‌نویسی به نام پول کووا (Pol Cova) بازی وب‌محور Color Queens: Solstice Duel را منتشر کرد تا جمینای (Gemini) را از یک دستیار منفعل به یک رقیب فعال تبدیل کند.

بسیاری از بازی‌های مبتنی بر هوش مصنوعی از مدل‌های زبانی بزرگ (LLMs) برای تولید دیالوگ‌های پویا یا خلق ماموریت‌ها استفاده می‌کنند، اما این پروژه مدل را در جایگاه یک بازیکن قرار می‌دهد. این بازی در واقع آزمونی عملی برای سنجش توان استدلال ماشین است که در آن کاربر باید پیش از غروب خورشید (شبیه‌سازی شده در بازی)، صفحه معما را حل کند. همان‌طور که در تحلیل‌های پیشین ما درباره مدیریت داده‌ها در اکوسیستم گوگل دیدیم—مانند بهینه‌سازی تنظیمات لغو اشتراک (opt-out) در Gemini AI برای Workspace—تمرکز کاربران معمولاً بر مدیریت داده‌هاست، اما در اینجا محور گفتگو، عملکرد شناختی فعال مدل است.

زمینه پروژه

این پروژه برای «جمعه Solstice Game Jam» ساخته شده است. مفهوم اصلی بازی بر پایه یک پرسش ساده است: «آیا منطق انسانی می‌تواند در یک دوئل پازلی از یک هوش مصنوعی شکست دهد؟» توسعه‌دهنده می‌خواست بررسی کند وقتی یک مدل زبانی بزرگ به‌جای اینکه صرفاً قدرت‌بخش دیالوگ‌های پشت‌صحنه باشد، به‌طور فعال در گیم‌پلی شرکت کند، چه اتفاقی می‌افتد.

برای هماهنگی با تم «انقلب تابستانی»، لایه‌ای از نور و سایه به بازی اضافه شده است. با گذشت زمان، حال و هوای محیط از روشنایی گرم روز به تاریکی شب تغییر می‌کند. این انتقال بصری، انقلاب تابستانی را به منبعی از فشار تبدیل می‌کند و بازیکن را مجبور می‌سازد تا پیش از غروب خورشید، تعادل رنگ‌ها را برقرار کند.

جزئیات فنی

به گزارش مستندات این پروژه در وب‌سایت dev.to، این بازی قوانین سخت‌گیرانه‌ای را پیاده‌سازی کرده است: بازیکنان باید ملکه‌ها را در مناطق رنگی قرار دهند به‌طوری که در هر رنگ فقط یک ملکه باشد. علاوه بر این، هیچ تهاجمی نباید رخ دهد و هیچ تداخلی در سطرها، ستون‌ها یا قطرها نباید وجود داشته باشد. معماری فنی بازی بر یک سامانه اعتبارسنجی غیرمتمرکز استوار است:

اعتبارسنج محلی (Local Move Validator): برای جلوگیری از «تقلب» مدل، یک موتور محلی هر حرکت پیشنهادی جمینای را بررسی می‌کند. اگر مدل حرکتی غیرقانونی (illegal move) انجام دهد، صفحه بازی بلافاصله آن را رد کرده و خطا می‌گیرد.
بازپخش نوار تورینگ (Turing Tape Replay): یک سیستم بصری‌سازی که نحوه تفکر حل‌کننده را گام‌به‌گام نشان می‌دهد. این سیستم فرآیند اسکن مناطق، امتحان کردن خانه‌ها، رد کردن تداخل‌ها، پذیرش کاندیدها و بازگشت (Backtracking) هنگام شکست یک شاخه از احتمالات را فاش می‌کند.
کالیبراسیون بمبه (Bombe Calibration): یک مینی‌گیم باینری که نیازمند وارد کردن سریع توالی‌های ۰ و ۱ برای باز کردن راهنمایی‌ها است. این بخش علاوه بر ایجاد تنش و صدا، به میراث رمزگشایی آلن تورینگ اشاره دارد.
مکانیک Solstice: لایه‌ای از نورپردازی که با پیشرفت بازی از روز به شب می‌رود و فشار زمانی را به این پازل منطقی اضافه می‌کند.
سیستم‌های جانبی: این ساختار شامل یک رندرر صفحه Color Queens، حالت رقیب جمینای و یک حل‌کننده بازگشتی (Backtracking Solver) است.

دو بازیکن در حال رقابت با پازل خورشید استوایی روی میز، با نمادهای خورشید و ماه روی صفحه بازی.

مهم‌ترین تصمیم طراحی در اینجا این است که جمینای داور نیست، بلکه یک بازیکن است. با اجبار مدل به پیشنهاد حرکاتی که توسط یک اسکریپت محلی تایید یا رد می‌شوند، بازی نقاط ضعف و خطاهای مدل را افشا می‌کند. این رویکرد، «جادوی» رابط کاربری چت‌بات را می‌گیرد و با مدل مانند یک عامل نرم‌افزاری برخورد می‌کند که دقیقاً تحت همان محدودیت‌هایی است که یک انسان را محدود می‌کند.

طراحی و ادای احترام

علاوه بر منطق، پروژه شامل صفحاتی با الهام از رنگین‌کمان (Pride) است. این صفحات به‌گونه‌ای طراحی شده‌اند که شادی‌بخش و هدفمند باشند و تمرکز بازی بر رنگ و الگو را به مسئله هویت پیوند دهند.

اتصال به آلن تورینگ به‌طور عمیقی در مکانیک‌ها ادغام شده است. توسعه‌دهنده با ترکیب «نوار تورینگ» و «کالیبراسیون بمبه» قصد داشت ادای احترام به تورینگ نه در قالب متن‌های داستانی، بلکه در درون استدلال‌های ماشینی و الگوریتم‌ها زنده باشد.

برای بازیکن عادی، این یعنی بازی دیگر درباره مهندسی پرامپت (Prompt Engineering)—یا همان هنر سؤال درست پرسیدن برای گرفتن بهترین جواب—نیست، بلکه درباره سرعت و دقت است. این اثر، یک معمای منطقی استاندارد را به محکی برای مقایسه پردازش انسان و ماشین تبدیل کرده است.

گام بعدی شما

اگر می‌خواهید قدرت استدلال خود را در برابر ماشین بسنجید، دموی زنده بازی را در سایت colorqueens.xyz امتحان کنید. این بازی در حال حاضر در دسترس است و قرار است نسخه‌ای از آن در App Store منتشر شود.
در هنگام بازی، تغییرات نوار تورینگ را دنبال کنید و ببینید چگونه با حرکت از صفحه‌های ساده به سمت پازل‌های پیچیده و پرتداخل، نحوه تفکر ماشین تغییر می‌کند.
منتظر انتشار رسمی نسخه اپ‌استور برای دسترسی سریع‌تر باشید.

اما تأثیر این مدل‌های استدلالی بر توسعه بازی‌های AAA حتی پیچیده‌تر است؛ در گزارش بعدی بررسی می‌کنیم که آیا Agentهای هوش مصنوعی می‌توانند جایگزین طراحان مرحله شوند یا خیر.

این گزارش با خط‌لولهٔ خودکار دات‌هوش از منابع معتبر جهانی تدوین و زیر نظر تحریریه منتشر شده است. روش کار ما

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

اخبار روزانه، معرفی ابزارها و مدل‌ها، و آموزشِ کار با هوش مصنوعی؛ همیشه با این پرسش که از ایران چه چیزی کار می‌کند و چه چیزی نه.

زمینه پروژه

جزئیات فنی

اعتبارسنج محلی (Local Move Validator): برای جلوگیری از «تقلب» مدل، یک موتور محلی هر حرکت پیشنهادی جمینای را بررسی می‌کند. اگر مدل حرکتی غیرقانونی (illegal move) انجام دهد، صفحه بازی بلافاصله آن را رد کرده و خطا می‌گیرد.
بازپخش نوار تورینگ (Turing Tape Replay): یک سیستم بصری‌سازی که نحوه تفکر حل‌کننده را گام‌به‌گام نشان می‌دهد. این سیستم فرآیند اسکن مناطق، امتحان کردن خانه‌ها، رد کردن تداخل‌ها، پذیرش کاندیدها و بازگشت (Backtracking) هنگام شکست یک شاخه از احتمالات را فاش می‌کند.
کالیبراسیون بمبه (Bombe Calibration): یک مینی‌گیم باینری که نیازمند وارد کردن سریع توالی‌های ۰ و ۱ برای باز کردن راهنمایی‌ها است. این بخش علاوه بر ایجاد تنش و صدا، به میراث رمزگشایی آلن تورینگ اشاره دارد.
مکانیک Solstice: لایه‌ای از نورپردازی که با پیشرفت بازی از روز به شب می‌رود و فشار زمانی را به این پازل منطقی اضافه می‌کند.
سیستم‌های جانبی: این ساختار شامل یک رندرر صفحه Color Queens، حالت رقیب جمینای و یک حل‌کننده بازگشتی (Backtracking Solver) است.

دو بازیکن در حال رقابت با پازل خورشید استوایی روی میز، با نمادهای خورشید و ماه روی صفحه بازی.

طراحی و ادای احترام

گام بعدی شما

اگر می‌خواهید قدرت استدلال خود را در برابر ماشین بسنجید، دموی زنده بازی را در سایت colorqueens.xyz امتحان کنید. این بازی در حال حاضر در دسترس است و قرار است نسخه‌ای از آن در App Store منتشر شود.
در هنگام بازی، تغییرات نوار تورینگ را دنبال کنید و ببینید چگونه با حرکت از صفحه‌های ساده به سمت پازل‌های پیچیده و پرتداخل، نحوه تفکر ماشین تغییر می‌کند.
منتظر انتشار رسمی نسخه اپ‌استور برای دسترسی سریع‌تر باشید.

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

جمینای در برابر انسان؛ رقابت استدلال منطقی در بازی Color Queens

زمینه پروژه

جزئیات فنی

طراحی و ادای احترام

گام بعدی شما

منابع

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

جمینای در برابر انسان؛ رقابت استدلال منطقی در بازی Color Queens

زمینه پروژه

جزئیات فنی

طراحی و ادای احترام

گام بعدی شما

منابع

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

جمینای در برابر انسان؛ رقابت استدلال منطقی در بازی Color Queens

زمینه پروژه

جزئیات فنی

طراحی و ادای احترام

گام بعدی شما

منابع

مقاله‌های مرتبطهمه ←

سرمایه‌گذاری سری B: ۳۱۰ میلیون دلار برای شبیه‌سازی فیزیک در Odyssey

هگینگ‌فیس با استاندارد ARD جست‌وجوی ابزارها برای عامل‌ها را خودکار کرد

«پیش‌بینی مسیر از طریق متن»؛ دستاورد جدید مؤسسه AllenAI در فضای سه‌بعدی

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

مدل‌ها و ابزارهای مرتبط

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

جمینای در برابر انسان؛ رقابت استدلال منطقی در بازی Color Queens

زمینه پروژه

جزئیات فنی

طراحی و ادای احترام

گام بعدی شما

منابع

مقاله‌های مرتبطهمه ←

سرمایه‌گذاری سری B: ۳۱۰ میلیون دلار برای شبیه‌سازی فیزیک در Odyssey

هگینگ‌فیس با استاندارد ARD جست‌وجوی ابزارها برای عامل‌ها را خودکار کرد

«پیش‌بینی مسیر از طریق متن»؛ دستاورد جدید مؤسسه AllenAI در فضای سه‌بعدی

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

مدل‌ها و ابزارهای مرتبط

راهنمای فارسی هوش مصنوعی — با نگاه به ایران