درون معماری General Intuition؛ تبدیل میلیون‌ها ساعت گیم‌پلی به مهارت رباتیک

منبع خبر

دیروز·۴ تیر ۱۴۰۵۸ دقیقه مطالعه

شرط ۲.۳ میلیارد دلاری جنرال اینتویشن: بازی‌های ویدیویی می‌توانند عامل‌های هوش مصنوعی را برای دنیای واقعی آموزش دهند.

اشتراک‌گذاری

تصور کنید رباتی در دفتر کار شما باشد که یاد گرفته چطور از صندلی‌ها و سطل‌های زباله عبور کند، اما نه از طریق آزمون و خطاهای کند در دنیای واقعی، بلکه با ۱۰۰ ساعت تجربه در دنیای Fortnite. این استراتژی جسورانه General Intuition است که می‌خواهد دنیای مجازی بازی‌ها را به بزرگ‌ترین میدان آموزشی برای عامل‌های هوش مصنوعی (AI Agents) تبدیل کند. این شرکت تحت رهبری پیم دی ویت (Pim de Witte) پیش می‌رود و شرط بسته است که محیط‌های مجازی گیمینگ، نهایتِ میدان آموزشی برای عامل‌های هوش مصنوعی فیزیکی هستند.

در مرکز تحقیق و توسعه این شرکت در نیویورک، مقیاس این جاه‌طلبی بلافاصله به چشم می‌آید. پیم دی ویت، مدیرعامل ۳۱ ساله، مانیتوری را نشان می‌دهد که در آن یک عامل هوش مصنوعی به‌طور مداوم و برای ۱۰۰ ساعت متوالی در حال بازی کردن یک بازی مشابه Fortnite است. نکته کلیدی اینجاست که همان «مغزی» که در محیط مجازی حرکت می‌کند، اکنون یک ربات چهارپا (Quadrupedal) بزرگ را هدایت می‌کند. این ربات که به دلیل ظاهرش «رباتی شبیه به حشره‌های غول‌پیکر» توصیف شده است، در حالت پیش‌فرض در وضعیت «کاوش» (Exploration) عمل می‌کند. این ربات با استفاده از یک دوربین واحد — که در واقع تک‌چشم اوست — دور انسان‌ها می‌چرخد و در دفتر کار جابه‌جا می‌شود. او گاهی به پایه‌های صندلی‌ها برخورد می‌کند یا به سطل‌های زباله می‌زند؛ حرکاتی که بسیار شبیه به نوپا یا کودکی است که در حال یادگیری این است که بدنش چگونه با دنیای اطرافش ارتباط برقرار می‌کند.

همان‌طور که در تحلیل قبلی ما درباره‌ی فشار اولیه ۳۰۰ میلیون دلاری این شرکت برای رسیدن به مدل‌های جهانِ عامل‌محور اشاره کردیم، این استارتاپ اکنون جایگاه مالی خود را تثبیت کرده است. این مسیر رشد از تلاش‌های اولیه شرکت برای جذب سرمایه جهت ساخت مدل‌های دنیای گیمینگ آغاز شد تا به جایگاه فعلی برسد. به گزارش TechCrunch، این شرکت در روز پنجشنبه تأیید کرد که ۳۲۰ میلیون دلار سرمایه را با ارزش‌گذاری ۲.۳ میلیارد دلار جذب کرده است. این مبلغ باعث می‌شود مجموع سرمایه‌های اعلام‌شده‌ی آن‌ها از زمان راه‌اندازی در اکتبر گذشته، با احتساب دور اولیه ۱۳۴ میلیون دلاری در زمان لانچ، به ۴۵۴ میلیون دلار برسد.

این رویکرد شبیه به کودکی است که راه رفتن یاد می‌گیرد؛ اما به‌جای گشت‌وگذار کند در یک اتاق پذیرایی، هوش مصنوعی می‌تواند در چند ثانیه میلیون‌ها محیط مختلف را از طریق یک بازی تجربه کند. این روش سعی دارد مشکل «شکاف شبیه‌ساز به واقعیت» (Sim-to-Real Gap) را حل کند؛ مشکلی قدیمی در رباتیک که در آن مدل‌ها برای اعمال آموزش‌های مجازی در واقعیت‌های پیچیده، نامنظم و کثیف فیزیکی دچار مشکل می‌شوند.

رمز موفقیت: برچسب‌های کنش

شرکت General Intuition از دل پلتفرم Medal بیرون آمده است؛ پلتفرمی که گیمرها در آن کلیپ‌های ویدئویی بازی‌های خود را آپلود و به اشتراک می‌گذارند. در حالی که سایر آزمایشگاه‌های AI سعی می‌کنند تنها با تماشای ویدیوها یاد بگیرند، General Intuition از یک مجموعه داده اختصاصی شامل صدها میلیون ساعت گیم‌پلی استفاده می‌کند که حاوی «برچسب‌های کنش» (Action Labels) است.

برچسب‌های کنش: این‌ها سوابق دقیقی هستند از اینکه بازیکن در هر لحظه دقیقاً کدام دکمه را فشار داده و چه زمانی این کار را انجام داده است.
رابطه علت و معلولی: این داده‌ها به مدل اجازه می‌دهند پیوند مستقیم و دقیق بین یک ورودی خاص (مثلاً فشار دادن یک کلید) و حرکت حاصل در فضای مجازی را درک کند.
مزیت رقابتی: دی ویت استدلال می‌کند که اکثر رقبایی که سعی می‌کنند کنش‌ها را صرفاً از طریق استنتاج از ویدیو یاد بگیرند، از روشی ناکافی استفاده می‌کنند.
هدف نهایی: دی ویت معتقد است این تنها راه برای تشخیص «خود» (Self) از «محیط» (Environment) است تا درک غنی‌تری از علیت ایجاد شود.

دی ویت این فرآیند را «مرحله بعدی پیش‌آموزش آینده» می‌نامد. او ادعا می‌کند که یک مدل واحد می‌تواند هم‌زمان به اطلاعات Fortnite روی یک صفحه نمایش پاسخ دهد و اقدام کند، و در عین حال دینامیک‌های دنیای واقعی را به گونه‌ای مدیریت کند که یک مدل زبانی بزرگ (LLM) استاندارد هرگز قادر به انجام آن نباشد.

از «باشگاه» تا خیابان

در داخل شرکت، آن‌ها مدل جهان تولیدشده‌ی خود را «باشگاه» (The Gym) می‌نامند. این یک موتور بازی‌سازی سنتی (مانند Unreal یا Unity) نیست، بلکه یک محیط شبیه‌سازی‌شده است که فریم به فریم تولید می‌شود. در این شبیه‌سازی‌ها، هوش مصنوعی فیزیک بنیادی را می‌آموزد: اینکه دیوارها جامد هستند، نردبان‌ها برای بالا رفتن طراحی شده‌اند و سایه‌ها با حرکت خورشید در آسمان بلندتر می‌شوند.

یکی از متمایزترین ویژگی‌های این مدل جهان، تعهد آن به منطق فیزیکی است. در تست‌هایی که کاربران سعی می‌کنند به درون دیوارها بروند، مدل از عبور عامل از میان دیوار جلوگیری می‌کند؛ این دقیقاً همان نقطه ضعفی است که در اکثر دموهای مدل‌های جهان دیگر دیده می‌شود. برای General Intuition، این مدل جهان محصول نهایی نیست، بلکه محیط آموزشی ضروری است که برای تیز کردن مدل‌های عامل‌محور (Agentic) به کار می‌رود.

این پیش‌آموزش اجازه می‌دهد سازگاری با دنیای واقعی با سرعتی باورنکردنی رخ دهد. جاش دوپلانتیس، تحلیلگر داده شرکت، اشاره کرد که تنها ۸ دقیقه داده از رباتیک در دنیای واقعی لازم بود تا هوش مصنوعی برای ربات چهارپای آن‌ها تنظیم دقیق (Fine-tuning) شود. نکته شگفت‌انگیز این است که آن داده‌های تنظیم دقیق در یک خیابان عمومی جمع‌آوری شده بود، اما با این حال ربات توانست در فضای پیچیده یک دفتر کار نیز به درستی حرکت و مسیریابی کند.

مقیاس‌پذیری و خط قرمزهای اخلاقی

با سرمایه‌گذاری جدید که توسط Khosla Ventures رهبری شد، اولویت شرکت افزایش ظرفیت محاسبات (Compute) است. در این دور سرمایه‌گذاری، چهره‌های شاخصی چون جف بزوس، اریک اشمیت، نیکو روزبرگ (champion فرمول یک)، General Catalyst و پژوهشگران MIT و گوگل DeepMind مشارکت داشتند. همچنین یک مشارکت استراتژیک با CoreWeave شکل گرفته تا پیش‌آموزش نسخه بعدی مدل را تامین کند، با این برنامه که API آن‌ها تا پایان تابستان برای عموم باز شود.

دی ویت با تکیه بر تجربه سه سال فعالیت در حوزه‌های بشردوستانه، از جمله همکاری با «پزشکان بدون مرز»، مرزهای اخلاقی سخت‌گیرانه‌ای تعیین کرده است. او به‌طور صریح استفاده از عامل‌های خود را برای «خودمختاری مرگبار» (Lethal Autonomy) یا تشدید تنش‌های نظامی ممنوع کرده است تا شرکتش به بخشی از یک «سیستم تصاعدی» تبدیل نشود.

کاربرد نظامی: اگرچه سلاح‌های خودکار ممنوع‌اند، اما دی ویت از به‌کارگیری مدل‌ها در ماموریت‌های جست‌وجو و نجات استقبال می‌کند. او این سوال را مطرح می‌کند که اگر شرکتش announcing pursuit of lethal autonomy (به دنبال خودمختاری مرگبار باشد)، چه تاثیر منفی جهانی خواهد داشت.
هویت سازمانی: دی ویت هلندی است و بخش بزرگی از تیمش اروپایی هستند. این هویت در استخدام‌های او نیز دیده می‌شود؛ برای مثال، بریان مارتین (Chief of Staff) جذب شد چون پیش‌تر به‌طور علنی به دلیل همکاری Palantir با اداره مهاجرت و گمرک آمریکا (ICE)، از آن شرکت استعفا داده بود.
فلسفه شخصی: دی ویت از فرهنگ متداول سیلیکون‌ولی فاصله می‌گیرد و می‌گوید: «من نمی‌دانم چرا سیلیکون‌ولی کارهایی را که می‌کند، انجام می‌دهد»؛ این دیدگاه دلیل انتخاب مکان شرکت و ارزش‌های آن‌هاست.
ریشه در گیمینگ: این تعهد اخلاقی با علاقه مادام‌العمر او به بازی‌ها همراه شده است. او در دوران نوجوانی با ساخت و میزبانی یک سرور خصوصی RuneScape موفق شد ۱.۵ میلیون دلار درآمد کسب کند.

برای مقابله با بیکاری‌های احتمالی ناشی از هوش مصنوعی، این شرکت بازار شغلی Nerve را راه‌اندازی کرد. در این پلتفرم، گیمرها با استفاده از سخت‌افزارهای موجود خود پول می‌سازند. از آنجایی که کاربران Medal نسلی هستند که بیشترین مواجهه را با جابجایی‌های شغلی ناشی از AI دارند، Nerve به آن‌ها اجازه می‌دهد از برچسب‌گذاری داده‌ها شروع کرده و در نهایت به سمت کنترل از راه دور ربات‌ها (Teleoperation) و وظایف تخصصی‌تر حرکت کنند.

استراتژی اکوسیستم

General Intuition قصد ندارد یک محصول سخت‌افزاری خاص، مانند شرکت‌های تولید خودروی خودران، بسازد. در عوض، آن‌ها می‌خواهند به یک تامین‌کننده زیرساختی (Backbone) تبدیل شوند، شبیه به آنچه OpenAI یا Anthropic هستند. هدف آن‌ها این است که ساخت ربات‌های تخصصی برای سایر شرکت‌ها «۱۰ برابر ساده‌تر» شود.

آن‌ها فعالانه به دنبال مشتریانی هستند که بتوانند «جسم‌های» (Embodiments) متنوعی را فراهم کنند تا یک «چرخه داده» (Data Flywheel) ایجاد شود. تست‌های فعلی فراتر از ربات‌های چهارپا رفته و موارد زیر را شامل می‌شود:

پهپادها و دیگر دستگاه‌های پرنده.
بازی‌های رانندگی و محیط‌های ترانزیتی.
هر چیزی که از طریق کیبورد، ماوس یا دسته بازی قابل کنترل باشد.

آن‌ها اولویت را به مشتریانی می‌دهند که بتوانند داده‌های واقعی ارائه دهند که در تحقیقات آن‌ها تاثیرگذار باشد و تیم‌های داخلی چابکی برای مشارکت‌های تعبیه شده (Embedded Partnership) داشته باشند. موارد استفاده احتمالی عبارتند از:

تست یک ربات در «دوقلوی دیجیتالی» (Digital Twin) یک کف کارخانه.
تامین قدرت یک ربات انسان‌نما در یک استودیوی بازی‌سازی.
ارسال یک ربات چهارپا برای مسیریابی در محیط‌های خطرناک.

شرط‌بندی روی یک نسل

وینود خوسلا این استارتاپ را نه به عنوان هدفی برای خرید و ادغام (M&A)، بلکه یک «شرط‌بندی نسلی» می‌بیند. این نگاه تا حد زیادی به دلیل جایگاه انحصاری داده‌هایی است که از طریق Medal در اختیار دارند. به گفته بریان مارتین، این شرکت پس از آن متولد شد که Medal پیشنهاد خرید از یک آزمایشگاه بزرگ AI را رد کرد. اگرچه پیشنهادهای دیگری نیز داده شده، اما بنیان‌گذاران شرکت یعنی الوی آلونسو (Eloi Alonso)، آدم جلی (Adam Jelley) و وینسنت میکلی (Vincent Micheli) تمایلی به فروخته شدن ندارند.

خوسلا استدلال می‌کند که تلاش برای خرید شرکت در این مرحله، در واقع یک «خرید داده» (Data Acquisition) خواهد بود که از نظر او در مقایسه با پتانسیل تکنولوژی، جذاب نیست. او معتقد است داده‌های اختصاصی مربوط به «کنش و واکنش انسان» در بازی‌ها، کلید ظهور «شهود» (Intuition) است.

خوسلا این موضوع را با ظهور توانایی استدلال در مدل‌های زبانی (LLMs) مقایسه کرده و آن را یک «جهش کوانتومی» می‌نامد؛ نقطه‌ای که در آن AI یک شهود انسانی از فضای فیزیکی پیدا می‌کند. او استدلال می‌کند که این داده‌های کنش-واکنش انسانی، جزء ضروری برای انتقال هوش مصنوعی از استدلال‌های ساده به درکی غریزی و شهودی از جهان است.

برای مخاطب، این بدان معناست که «هوش» درون یک ربات انبار یا یک دستیار خانگی، ممکن است به‌زودی به‌جای تست‌های گران‌قیمست و کند آزمایشگاهی، بر اساس عادت‌های میلیون‌ها گیمر آموزش ببیند. شرط‌بندی اصلی این است که داده‌های کنش انسانی در بازی‌ها، همان حلقه مفقوده برای رسیدن به هوش مصنوعی فیزیکی تعمیم‌یافته است.

آیا این انتقال از شبیه‌ساز به واقعیت در مقیاس کلان پاسخ می‌دهد؟ این یک سوال باز است که هنوز هیچ‌کس به‌طور کامل به آن پاسخ نداده است. اکثر رویکردهای موجود به مقادیر عظیمی از داده‌های دنیای واقعی نیاز دارند که به‌کندی و با هزینه زیاد جمع‌آوری می‌شوند؛ اما استراتژی گیم‌پلی General Intuition یک میان‌بر مقیاس‌پذیر است. صنعت به دقت منتظر خواهد بود و تماشا می‌کند که General Intuition چگونه API خود را باز کرده و پایگاه مشتریانش در تابستان متنوع می‌کند.

گام بعدی شما

اگر توسعه‌دهنده رباتیک هستید، احتمال باز شدن API این شرکت در تابستان ۲۰۲۶ را دنبال کنید تا امکان دسترسی به مدل‌های پیش‌آموزش‌دیده با داده‌های گیمینگ را بررسی کنید.
بررسی کنید که آیا داده‌های بصری شما قابلیت تبدیل به «برچسب‌های کنش» را دارد یا خیر تا برای همکاری‌های احتمالی آماده شوید.
مطالعه کنید که چگونه «دوقلوهای دیجیتالی» در صنعت شما می‌تواند با مدل‌های جهان General Intuition ادغام شود.

اما داستان سخت‌افزاری این تحول حتی شگفت‌انگیزتر است — به تحلیل ما درباره‌ی تراشه‌های Blackwell مراجعه کنید.

این گزارش با خط‌لولهٔ خودکار دات‌هوش از منابع معتبر جهانی تدوین و زیر نظر تحریریه منتشر شده است. روش کار ما

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

اخبار روزانه، معرفی ابزارها و مدل‌ها، و آموزشِ کار با هوش مصنوعی؛ همیشه با این پرسش که از ایران چه چیزی کار می‌کند و چه چیزی نه.

درون معماری General Intuition؛ تبدیل میلیون‌ها ساعت گیم‌پلی به مهارت رباتیک

TechCrunch AI

منبع خبر

دیروز·۴ تیر ۱۴۰۵۸ دقیقه مطالعه

اشتراک‌گذاری