اگر تا امروز با مدلهای سهبعدی ساختهشده از تکتصویر کار کردهاید، حتماً با مشکل اشیاء شناور یا نفوذ آنها به کف زمین مواجه شدهاید. REST3D این نقص بنیادی را با بازتعریف رابطه اشیاء و گرانش حل میکند تا مدلها دیگر «شبحوار» نباشند.
این پیشرفت در زمانهٔ گسترش دوقلوهای دیجیتال (Digital Twins) و محیطهای واقعیت ترکیبی (XR) رخ میدهد. همانطور که در تحلیلهای پیشین ما درباره مدلهای مولد بصری اشاره کردیم، تمرکز صنعت از نمایش صرفاً بصری به سمت یکپارچگی ساختاری در حال حرکت است. برای توسعهدهندگان، این یعنی گذار از مدلهای سهبعدی ایستا به محیطهای تعاملی که در آن اشیاء بهطور واقعگرایانه سقوط میکنند، تکیه میدهند و یکدیگر را پشتیبانی میکنند.
طبق مستندات پروژه که در ۳ ژوئن ۲۰۲۶ منتشر شد، چارچوب REST3D از یک تکنیک عاملمحور (Agentic) برای درک صحنه فیزیکی استفاده میکند. این فرآیند یک «درخت صحنه» (Scene-tree) ایجاد میکند که وضعیت اشیاء و روابط متقابل آنها را بر اساس دیدگاه «پشتیبانی-گرانشی» ترسیم میکند.
فرآیند اجرایی این سیستم به شرح زیر است:
- مقداردهی اولیه: سیستم ابتدا از مدلهای تبدیل تصویر به سهبعد برای ایجاد اولیه صحنه استفاده میکند.
- بهبود: سپس با استفاده از تراز بهراهنمایی درخت صحنه و بهینهسازی محدود به فیزیک (Physics-constrained Optimization)، تخلفات فیزیکی را بدون آسیب به سازگاری بصری برطرف میکند.
- اعتبارسنجی: به نقل از پژوهشگران CMU، این نتایج را با استفاده از Isaac Gym برای شبیهسازیهای فیزیکی و Meta Quest Pro برای تعاملات دستی در واقعیت مجازی به اثبات رساندهاند.
این رویکرد، معیار ارزیابی هوش مصنوعی زاینده (Generative AI) در حوزه سهبعدی را از «دقت بصری» به «پذیرفتنی بودن فیزیکی» تغییر میدهد. با ادغام پیشفرضهای ساختاری پیش از بهینهسازی، REST3D از پدیده «جدایش انفجاری» (Explosive Separation) — که در روشهای پایه هنگام اعمال گرانش رخ میدهد — جلوگیری میکند. این پیششرطی حیاتی برای شبیهسازیهای پیشرفته رباتیک است، جایی که تعامل کاربر به رفتار پیشبینیپذیر و پایدار اشیاء وابسته است.
گام بعدی شما
- بررسی نحوه ادغام محدودیتهای فیزیکی در مدلهای چندوجهی (Multimodal) بزرگتر.
- بهکارگیری این متد در تولید محیطهای سنتتیک برای آموزش عاملهای یادگیری تقویتشده (Reinforcement Learning).
- تحلیل اثر این متد بر کاهش هزینه تولید داراییهای XR.
اما چالش بعدی، تعامل واقعی این اشیاء با کاربر در مقیاس انبوه است — به بررسی معماریهای جدید Interaction AI در گزارشهای آینده ما چشم بدوزید.



گفتگو