آیا شهود منطقی انسان میتواند در یک مسابقه مستقیم، بهطور مداوم بر یک مدل زبانی بزرگ پیروز شود؟ در ۲۱ ژوئن ۲۰۲۶، برنامهنویسی به نام پول کووا (Pol Cova) بازی وبمحور Color Queens: Solstice Duel را منتشر کرد تا جمینای (Gemini) را از یک دستیار منفعل به یک رقیب فعال تبدیل کند.
بسیاری از بازیهای مبتنی بر هوش مصنوعی از مدلهای زبانی بزرگ (LLMs) برای تولید دیالوگهای پویا یا خلق ماموریتها استفاده میکنند، اما این پروژه مدل را در جایگاه یک بازیکن قرار میدهد. این بازی در واقع آزمونی عملی برای سنجش توان استدلال ماشین است که در آن کاربر باید پیش از غروب خورشید (شبیهسازی شده در بازی)، صفحه معما را حل کند. همانطور که در تحلیلهای پیشین ما درباره مدیریت دادهها در اکوسیستم گوگل دیدیم—مانند بهینهسازی تنظیمات لغو اشتراک (opt-out) در Gemini AI برای Workspace—تمرکز کاربران معمولاً بر مدیریت دادههاست، اما در اینجا محور گفتگو، عملکرد شناختی فعال مدل است.
زمینه پروژه
این پروژه برای «جمعه Solstice Game Jam» ساخته شده است. مفهوم اصلی بازی بر پایه یک پرسش ساده است: «آیا منطق انسانی میتواند در یک دوئل پازلی از یک هوش مصنوعی شکست دهد؟» توسعهدهنده میخواست بررسی کند وقتی یک مدل زبانی بزرگ بهجای اینکه صرفاً قدرتبخش دیالوگهای پشتصحنه باشد، بهطور فعال در گیمپلی شرکت کند، چه اتفاقی میافتد.
برای هماهنگی با تم «انقلب تابستانی»، لایهای از نور و سایه به بازی اضافه شده است. با گذشت زمان، حال و هوای محیط از روشنایی گرم روز به تاریکی شب تغییر میکند. این انتقال بصری، انقلاب تابستانی را به منبعی از فشار تبدیل میکند و بازیکن را مجبور میسازد تا پیش از غروب خورشید، تعادل رنگها را برقرار کند.
جزئیات فنی
به گزارش مستندات این پروژه در وبسایت dev.to، این بازی قوانین سختگیرانهای را پیادهسازی کرده است: بازیکنان باید ملکهها را در مناطق رنگی قرار دهند بهطوری که در هر رنگ فقط یک ملکه باشد. علاوه بر این، هیچ تهاجمی نباید رخ دهد و هیچ تداخلی در سطرها، ستونها یا قطرها نباید وجود داشته باشد. معماری فنی بازی بر یک سامانه اعتبارسنجی غیرمتمرکز استوار است:
- اعتبارسنج محلی (Local Move Validator): برای جلوگیری از «تقلب» مدل، یک موتور محلی هر حرکت پیشنهادی جمینای را بررسی میکند. اگر مدل حرکتی غیرقانونی (illegal move) انجام دهد، صفحه بازی بلافاصله آن را رد کرده و خطا میگیرد.
- بازپخش نوار تورینگ (Turing Tape Replay): یک سیستم بصریسازی که نحوه تفکر حلکننده را گامبهگام نشان میدهد. این سیستم فرآیند اسکن مناطق، امتحان کردن خانهها، رد کردن تداخلها، پذیرش کاندیدها و بازگشت (Backtracking) هنگام شکست یک شاخه از احتمالات را فاش میکند.
- کالیبراسیون بمبه (Bombe Calibration): یک مینیگیم باینری که نیازمند وارد کردن سریع توالیهای ۰ و ۱ برای باز کردن راهنماییها است. این بخش علاوه بر ایجاد تنش و صدا، به میراث رمزگشایی آلن تورینگ اشاره دارد.
- مکانیک Solstice: لایهای از نورپردازی که با پیشرفت بازی از روز به شب میرود و فشار زمانی را به این پازل منطقی اضافه میکند.
- سیستمهای جانبی: این ساختار شامل یک رندرر صفحه Color Queens، حالت رقیب جمینای و یک حلکننده بازگشتی (Backtracking Solver) است.

مهمترین تصمیم طراحی در اینجا این است که جمینای داور نیست، بلکه یک بازیکن است. با اجبار مدل به پیشنهاد حرکاتی که توسط یک اسکریپت محلی تایید یا رد میشوند، بازی نقاط ضعف و خطاهای مدل را افشا میکند. این رویکرد، «جادوی» رابط کاربری چتبات را میگیرد و با مدل مانند یک عامل نرمافزاری برخورد میکند که دقیقاً تحت همان محدودیتهایی است که یک انسان را محدود میکند.
طراحی و ادای احترام
علاوه بر منطق، پروژه شامل صفحاتی با الهام از رنگینکمان (Pride) است. این صفحات بهگونهای طراحی شدهاند که شادیبخش و هدفمند باشند و تمرکز بازی بر رنگ و الگو را به مسئله هویت پیوند دهند.
اتصال به آلن تورینگ بهطور عمیقی در مکانیکها ادغام شده است. توسعهدهنده با ترکیب «نوار تورینگ» و «کالیبراسیون بمبه» قصد داشت ادای احترام به تورینگ نه در قالب متنهای داستانی، بلکه در درون استدلالهای ماشینی و الگوریتمها زنده باشد.
برای بازیکن عادی، این یعنی بازی دیگر درباره مهندسی پرامپت (Prompt Engineering)—یا همان هنر سؤال درست پرسیدن برای گرفتن بهترین جواب—نیست، بلکه درباره سرعت و دقت است. این اثر، یک معمای منطقی استاندارد را به محکی برای مقایسه پردازش انسان و ماشین تبدیل کرده است.
گام بعدی شما
- اگر میخواهید قدرت استدلال خود را در برابر ماشین بسنجید، دموی زنده بازی را در سایت colorqueens.xyz امتحان کنید. این بازی در حال حاضر در دسترس است و قرار است نسخهای از آن در App Store منتشر شود.
- در هنگام بازی، تغییرات نوار تورینگ را دنبال کنید و ببینید چگونه با حرکت از صفحههای ساده به سمت پازلهای پیچیده و پرتداخل، نحوه تفکر ماشین تغییر میکند.
- منتظر انتشار رسمی نسخه اپاستور برای دسترسی سریعتر باشید.
اما تأثیر این مدلهای استدلالی بر توسعه بازیهای AAA حتی پیچیدهتر است؛ در گزارش بعدی بررسی میکنیم که آیا Agentهای هوش مصنوعی میتوانند جایگزین طراحان مرحله شوند یا خیر.




گفتگو