تصور کنید هوش مصنوعی بتواند یک مسابقهی چندنفره را با تمام جزئیات، فیزیک و حتی فشردن دکمهها، تنها از روی تماشای بازیکنان انسانی بازسازی کند. اگر فکر میکنید این یک رویای دوردست است، باید با مدل جدید مایکروسافت آشنا شوید.
Microsoft Research بهتازگی از مدل WHAM (World and Human Action Model) پردهبرداری کرده است؛ سیستمی که با تحلیل دادههای بازی Bleeding Edge از استودیو Ninja Theory، یاد گرفته است که چگونه محیطهای تعاملی را پیشبینی کند. طبق اعلام مایکروسافت، این مدل اکنون با دو نسخهی ۲۰۰ میلیون و ۱.۶ میلیارد پارامتری در قالب وزنهای باز (Open Weights) در پلتفرم Hugging Face در دسترس است.
بر اساس مستندات منتشر شده، این مدل روی بیش از یک میلیارد جفت «مشاهده-عمل» (Observation-Action Pairs) آموزش دیده است که از ۵۰۰,۰۰۰ مسابقه در ۷ نقشهی مختلف استخراج شدهاند. برای رسیدن به این نتیجه، مایکروسافت از ۹۸ پردازندهی گرافیکی NVIDIA H100 به مدت ۵ روز استفاده کرده است.
این سیستم بر پایهی هوش مصنوعی زاینده (Generative AI) و با ترکیب دو بخش اصلی طراحی شده است:
- یک VQ-GAN (Vector Quantized Generative Adversarial Network) برای فشردهسازی تصاویر بازی به توکنهای گسسته.
- یک ترنسفورمر (Transformer) برای پیشبینی توکن بعدی در توالیهای ترکیبی از تصاویر و ورودیهای کنترلر.
همانطور که در تحلیل قبلی ما دربارهی مدلهای بنیادی (Foundation Models) اشاره کردیم، گذار از مدلهای متنی به مدلهای دنیای واقعی، نقطه عطف بعدی این صنعت است و WHAM دقیقاً در همین مسیر حرکت میکند.
این مدل در سه حالت عملیاتی عمل میکند: مدلسازی دنیا (تولید تصاویر آینده بر اساس ورودیها)، سیاست رفتاری (پیشبینی دکمهی بعدی بازیکن) و تولید کامل (خلق همزمان تصویر و حرکت).
با این حال، محدودیتها همچنان چشمگیر هستند. مدل تنها در رزولوشن ۳۰۰×۱۸۰ پیکسل و با پنجرهی زمانی ۱۰ ثانیهای کار میکند و سرعت استنتاج (Inference) آن برای اجرای در لحظه (Real-time) بسیار پایین است. همچنین، هرگونه تصویر خارج از دامنهی آموزش، باعث فروپاشی بصری مدل میشود.
گام بعدی شما
- اگر پژوهشگر AI هستید، وزنهای مدل را از Hugging Face دریافت کرده و روی کارتهای RTX A6000 یا A100 تست کنید.
- برای اجرای نسخهی ۲۰۰ میلیونی، حداقل ۴.۵ گیگابایت VRAM را در نظر بگیرید.
- مستندات لایسنس مدل را برای اطمینان از کاربردهای غیرتجاری و آکادمیک مطالعه کنید.
اما داستان سختافزاری این تحول حتی شگفتانگیزتر است — به تحلیل ما دربارهی تراشههای Blackwell مراجعه کنید.




گفتگو