تصور کنید رباتی در دفتر کار شما باشد که یاد گرفته چطور از صندلیها و سطلهای زباله عبور کند، اما نه از طریق آزمون و خطاهای کند در دنیای واقعی، بلکه با ۱۰۰ ساعت تجربه در دنیای Fortnite. این استراتژی جسورانه General Intuition است که میخواهد دنیای مجازی بازیها را به بزرگترین میدان آموزشی برای عاملهای هوش مصنوعی (AI Agents) تبدیل کند. این شرکت تحت رهبری پیم دی ویت (Pim de Witte) پیش میرود و شرط بسته است که محیطهای مجازی گیمینگ، نهایتِ میدان آموزشی برای عاملهای هوش مصنوعی فیزیکی هستند.
در مرکز تحقیق و توسعه این شرکت در نیویورک، مقیاس این جاهطلبی بلافاصله به چشم میآید. پیم دی ویت، مدیرعامل ۳۱ ساله، مانیتوری را نشان میدهد که در آن یک عامل هوش مصنوعی بهطور مداوم و برای ۱۰۰ ساعت متوالی در حال بازی کردن یک بازی مشابه Fortnite است. نکته کلیدی اینجاست که همان «مغزی» که در محیط مجازی حرکت میکند، اکنون یک ربات چهارپا (Quadrupedal) بزرگ را هدایت میکند. این ربات که به دلیل ظاهرش «رباتی شبیه به حشرههای غولپیکر» توصیف شده است، در حالت پیشفرض در وضعیت «کاوش» (Exploration) عمل میکند. این ربات با استفاده از یک دوربین واحد — که در واقع تکچشم اوست — دور انسانها میچرخد و در دفتر کار جابهجا میشود. او گاهی به پایههای صندلیها برخورد میکند یا به سطلهای زباله میزند؛ حرکاتی که بسیار شبیه به نوپا یا کودکی است که در حال یادگیری این است که بدنش چگونه با دنیای اطرافش ارتباط برقرار میکند.
همانطور که در تحلیل قبلی ما دربارهی فشار اولیه ۳۰۰ میلیون دلاری این شرکت برای رسیدن به مدلهای جهانِ عاملمحور اشاره کردیم، این استارتاپ اکنون جایگاه مالی خود را تثبیت کرده است. این مسیر رشد از تلاشهای اولیه شرکت برای جذب سرمایه جهت ساخت مدلهای دنیای گیمینگ آغاز شد تا به جایگاه فعلی برسد. به گزارش TechCrunch، این شرکت در روز پنجشنبه تأیید کرد که ۳۲۰ میلیون دلار سرمایه را با ارزشگذاری ۲.۳ میلیارد دلار جذب کرده است. این مبلغ باعث میشود مجموع سرمایههای اعلامشدهی آنها از زمان راهاندازی در اکتبر گذشته، با احتساب دور اولیه ۱۳۴ میلیون دلاری در زمان لانچ، به ۴۵۴ میلیون دلار برسد.
این رویکرد شبیه به کودکی است که راه رفتن یاد میگیرد؛ اما بهجای گشتوگذار کند در یک اتاق پذیرایی، هوش مصنوعی میتواند در چند ثانیه میلیونها محیط مختلف را از طریق یک بازی تجربه کند. این روش سعی دارد مشکل «شکاف شبیهساز به واقعیت» (Sim-to-Real Gap) را حل کند؛ مشکلی قدیمی در رباتیک که در آن مدلها برای اعمال آموزشهای مجازی در واقعیتهای پیچیده، نامنظم و کثیف فیزیکی دچار مشکل میشوند.
رمز موفقیت: برچسبهای کنش
شرکت General Intuition از دل پلتفرم Medal بیرون آمده است؛ پلتفرمی که گیمرها در آن کلیپهای ویدئویی بازیهای خود را آپلود و به اشتراک میگذارند. در حالی که سایر آزمایشگاههای AI سعی میکنند تنها با تماشای ویدیوها یاد بگیرند، General Intuition از یک مجموعه داده اختصاصی شامل صدها میلیون ساعت گیمپلی استفاده میکند که حاوی «برچسبهای کنش» (Action Labels) است.
- برچسبهای کنش: اینها سوابق دقیقی هستند از اینکه بازیکن در هر لحظه دقیقاً کدام دکمه را فشار داده و چه زمانی این کار را انجام داده است.
- رابطه علت و معلولی: این دادهها به مدل اجازه میدهند پیوند مستقیم و دقیق بین یک ورودی خاص (مثلاً فشار دادن یک کلید) و حرکت حاصل در فضای مجازی را درک کند.
- مزیت رقابتی: دی ویت استدلال میکند که اکثر رقبایی که سعی میکنند کنشها را صرفاً از طریق استنتاج از ویدیو یاد بگیرند، از روشی ناکافی استفاده میکنند.
- هدف نهایی: دی ویت معتقد است این تنها راه برای تشخیص «خود» (Self) از «محیط» (Environment) است تا درک غنیتری از علیت ایجاد شود.
دی ویت این فرآیند را «مرحله بعدی پیشآموزش آینده» مینامد. او ادعا میکند که یک مدل واحد میتواند همزمان به اطلاعات Fortnite روی یک صفحه نمایش پاسخ دهد و اقدام کند، و در عین حال دینامیکهای دنیای واقعی را به گونهای مدیریت کند که یک مدل زبانی بزرگ (LLM) استاندارد هرگز قادر به انجام آن نباشد.

از «باشگاه» تا خیابان
در داخل شرکت، آنها مدل جهان تولیدشدهی خود را «باشگاه» (The Gym) مینامند. این یک موتور بازیسازی سنتی (مانند Unreal یا Unity) نیست، بلکه یک محیط شبیهسازیشده است که فریم به فریم تولید میشود. در این شبیهسازیها، هوش مصنوعی فیزیک بنیادی را میآموزد: اینکه دیوارها جامد هستند، نردبانها برای بالا رفتن طراحی شدهاند و سایهها با حرکت خورشید در آسمان بلندتر میشوند.
یکی از متمایزترین ویژگیهای این مدل جهان، تعهد آن به منطق فیزیکی است. در تستهایی که کاربران سعی میکنند به درون دیوارها بروند، مدل از عبور عامل از میان دیوار جلوگیری میکند؛ این دقیقاً همان نقطه ضعفی است که در اکثر دموهای مدلهای جهان دیگر دیده میشود. برای General Intuition، این مدل جهان محصول نهایی نیست، بلکه محیط آموزشی ضروری است که برای تیز کردن مدلهای عاملمحور (Agentic) به کار میرود.
این پیشآموزش اجازه میدهد سازگاری با دنیای واقعی با سرعتی باورنکردنی رخ دهد. جاش دوپلانتیس، تحلیلگر داده شرکت، اشاره کرد که تنها ۸ دقیقه داده از رباتیک در دنیای واقعی لازم بود تا هوش مصنوعی برای ربات چهارپای آنها تنظیم دقیق (Fine-tuning) شود. نکته شگفتانگیز این است که آن دادههای تنظیم دقیق در یک خیابان عمومی جمعآوری شده بود، اما با این حال ربات توانست در فضای پیچیده یک دفتر کار نیز به درستی حرکت و مسیریابی کند.
مقیاسپذیری و خط قرمزهای اخلاقی
با سرمایهگذاری جدید که توسط Khosla Ventures رهبری شد، اولویت شرکت افزایش ظرفیت محاسبات (Compute) است. در این دور سرمایهگذاری، چهرههای شاخصی چون جف بزوس، اریک اشمیت، نیکو روزبرگ (champion فرمول یک)، General Catalyst و پژوهشگران MIT و گوگل DeepMind مشارکت داشتند. همچنین یک مشارکت استراتژیک با CoreWeave شکل گرفته تا پیشآموزش نسخه بعدی مدل را تامین کند، با این برنامه که API آنها تا پایان تابستان برای عموم باز شود.
دی ویت با تکیه بر تجربه سه سال فعالیت در حوزههای بشردوستانه، از جمله همکاری با «پزشکان بدون مرز»، مرزهای اخلاقی سختگیرانهای تعیین کرده است. او بهطور صریح استفاده از عاملهای خود را برای «خودمختاری مرگبار» (Lethal Autonomy) یا تشدید تنشهای نظامی ممنوع کرده است تا شرکتش به بخشی از یک «سیستم تصاعدی» تبدیل نشود.
- کاربرد نظامی: اگرچه سلاحهای خودکار ممنوعاند، اما دی ویت از بهکارگیری مدلها در ماموریتهای جستوجو و نجات استقبال میکند. او این سوال را مطرح میکند که اگر شرکتش announcing pursuit of lethal autonomy (به دنبال خودمختاری مرگبار باشد)، چه تاثیر منفی جهانی خواهد داشت.
- هویت سازمانی: دی ویت هلندی است و بخش بزرگی از تیمش اروپایی هستند. این هویت در استخدامهای او نیز دیده میشود؛ برای مثال، بریان مارتین (Chief of Staff) جذب شد چون پیشتر بهطور علنی به دلیل همکاری Palantir با اداره مهاجرت و گمرک آمریکا (ICE)، از آن شرکت استعفا داده بود.
- فلسفه شخصی: دی ویت از فرهنگ متداول سیلیکونولی فاصله میگیرد و میگوید: «من نمیدانم چرا سیلیکونولی کارهایی را که میکند، انجام میدهد»؛ این دیدگاه دلیل انتخاب مکان شرکت و ارزشهای آنهاست.
- ریشه در گیمینگ: این تعهد اخلاقی با علاقه مادامالعمر او به بازیها همراه شده است. او در دوران نوجوانی با ساخت و میزبانی یک سرور خصوصی RuneScape موفق شد ۱.۵ میلیون دلار درآمد کسب کند.
برای مقابله با بیکاریهای احتمالی ناشی از هوش مصنوعی، این شرکت بازار شغلی Nerve را راهاندازی کرد. در این پلتفرم، گیمرها با استفاده از سختافزارهای موجود خود پول میسازند. از آنجایی که کاربران Medal نسلی هستند که بیشترین مواجهه را با جابجاییهای شغلی ناشی از AI دارند، Nerve به آنها اجازه میدهد از برچسبگذاری دادهها شروع کرده و در نهایت به سمت کنترل از راه دور رباتها (Teleoperation) و وظایف تخصصیتر حرکت کنند.
استراتژی اکوسیستم
General Intuition قصد ندارد یک محصول سختافزاری خاص، مانند شرکتهای تولید خودروی خودران، بسازد. در عوض، آنها میخواهند به یک تامینکننده زیرساختی (Backbone) تبدیل شوند، شبیه به آنچه OpenAI یا Anthropic هستند. هدف آنها این است که ساخت رباتهای تخصصی برای سایر شرکتها «۱۰ برابر سادهتر» شود.
آنها فعالانه به دنبال مشتریانی هستند که بتوانند «جسمهای» (Embodiments) متنوعی را فراهم کنند تا یک «چرخه داده» (Data Flywheel) ایجاد شود. تستهای فعلی فراتر از رباتهای چهارپا رفته و موارد زیر را شامل میشود:
- پهپادها و دیگر دستگاههای پرنده.
- بازیهای رانندگی و محیطهای ترانزیتی.
- هر چیزی که از طریق کیبورد، ماوس یا دسته بازی قابل کنترل باشد.
آنها اولویت را به مشتریانی میدهند که بتوانند دادههای واقعی ارائه دهند که در تحقیقات آنها تاثیرگذار باشد و تیمهای داخلی چابکی برای مشارکتهای تعبیه شده (Embedded Partnership) داشته باشند. موارد استفاده احتمالی عبارتند از:
- تست یک ربات در «دوقلوی دیجیتالی» (Digital Twin) یک کف کارخانه.
- تامین قدرت یک ربات انساننما در یک استودیوی بازیسازی.
- ارسال یک ربات چهارپا برای مسیریابی در محیطهای خطرناک.
شرطبندی روی یک نسل
وینود خوسلا این استارتاپ را نه به عنوان هدفی برای خرید و ادغام (M&A)، بلکه یک «شرطبندی نسلی» میبیند. این نگاه تا حد زیادی به دلیل جایگاه انحصاری دادههایی است که از طریق Medal در اختیار دارند. به گفته بریان مارتین، این شرکت پس از آن متولد شد که Medal پیشنهاد خرید از یک آزمایشگاه بزرگ AI را رد کرد. اگرچه پیشنهادهای دیگری نیز داده شده، اما بنیانگذاران شرکت یعنی الوی آلونسو (Eloi Alonso)، آدم جلی (Adam Jelley) و وینسنت میکلی (Vincent Micheli) تمایلی به فروخته شدن ندارند.
خوسلا استدلال میکند که تلاش برای خرید شرکت در این مرحله، در واقع یک «خرید داده» (Data Acquisition) خواهد بود که از نظر او در مقایسه با پتانسیل تکنولوژی، جذاب نیست. او معتقد است دادههای اختصاصی مربوط به «کنش و واکنش انسان» در بازیها، کلید ظهور «شهود» (Intuition) است.
خوسلا این موضوع را با ظهور توانایی استدلال در مدلهای زبانی (LLMs) مقایسه کرده و آن را یک «جهش کوانتومی» مینامد؛ نقطهای که در آن AI یک شهود انسانی از فضای فیزیکی پیدا میکند. او استدلال میکند که این دادههای کنش-واکنش انسانی، جزء ضروری برای انتقال هوش مصنوعی از استدلالهای ساده به درکی غریزی و شهودی از جهان است.
برای مخاطب، این بدان معناست که «هوش» درون یک ربات انبار یا یک دستیار خانگی، ممکن است بهزودی بهجای تستهای گرانقیمست و کند آزمایشگاهی، بر اساس عادتهای میلیونها گیمر آموزش ببیند. شرطبندی اصلی این است که دادههای کنش انسانی در بازیها، همان حلقه مفقوده برای رسیدن به هوش مصنوعی فیزیکی تعمیمیافته است.
آیا این انتقال از شبیهساز به واقعیت در مقیاس کلان پاسخ میدهد؟ این یک سوال باز است که هنوز هیچکس بهطور کامل به آن پاسخ نداده است. اکثر رویکردهای موجود به مقادیر عظیمی از دادههای دنیای واقعی نیاز دارند که بهکندی و با هزینه زیاد جمعآوری میشوند؛ اما استراتژی گیمپلی General Intuition یک میانبر مقیاسپذیر است. صنعت به دقت منتظر خواهد بود و تماشا میکند که General Intuition چگونه API خود را باز کرده و پایگاه مشتریانش در تابستان متنوع میکند.
گام بعدی شما
- اگر توسعهدهنده رباتیک هستید، احتمال باز شدن API این شرکت در تابستان ۲۰۲۶ را دنبال کنید تا امکان دسترسی به مدلهای پیشآموزشدیده با دادههای گیمینگ را بررسی کنید.
- بررسی کنید که آیا دادههای بصری شما قابلیت تبدیل به «برچسبهای کنش» را دارد یا خیر تا برای همکاریهای احتمالی آماده شوید.
- مطالعه کنید که چگونه «دوقلوهای دیجیتالی» در صنعت شما میتواند با مدلهای جهان General Intuition ادغام شود.
اما داستان سختافزاری این تحول حتی شگفتانگیزتر است — به تحلیل ما دربارهی تراشههای Blackwell مراجعه کنید.




گفتگو