
HapticLDM: جایگزینی توالیهای خطی با مدلهای انتشار برای تولید لرزشهای لمسی
پژوهشگران مدل HapticLDM را معرفی کردند؛ نخستین سیستم تبدیل متن به لرزش بر پایه مدلهای انتشار لایهای. این مدل با غلبه بر محدودیتهای مدلهای توالیمحور، بازخوردهای لمسی…
دستهبندی
تولید تصویر و ویدیو، صدای مصنوعی، هنر و موسیقی هوشمند، بازیها و وجه سرگرمکنندهی AI.
۲۰۰ مقاله منتشر شده

پژوهشگران مدل HapticLDM را معرفی کردند؛ نخستین سیستم تبدیل متن به لرزش بر پایه مدلهای انتشار لایهای. این مدل با غلبه بر محدودیتهای مدلهای توالیمحور، بازخوردهای لمسی…

ستارههای هالیوود و آژانسهای مدلینگ از استانداردی فنی برای کنترل برنامهریزیشدهی دسترسی هوش مصنوعی به چهره و صدای خود حمایت میکنند. این سیستم از طریق یک دفتر ثبت مرکزی و…

شرکت Unitree با معرفی ربات GD01، وارد بازار رباتهای سوارشدنی و تغییرپذیر شده است. این ماشین با قیمت ۵۳۷ هزار دلار، بازارهای لوکس و صنعتی را هدف قرار داده تا مسیر را برای عرضه…

پژوهشگران با معرفی DRoRAE، روشی برای تجمیع ویژگیهای تمامی لایههای رمزگذار بصری ابداع کردند که کیفیت بازسازی تصاویر را بهطور چشمگیری افزایش میدهد. این مدل با شناسایی یک قانون…

AllocMV چارچوب جدیدی است که تولید ویدیوهای موسیقی را به یک مسئله تخصیص منابع تبدیل میکند تا هزینههای محاسباتی کاهش و ثبات بصری افزایش یابد. این سیستم با استفاده از یک حلکننده…

مدل HappyHorse 1.0 با جایگزینی مدلهای انتشار با یک ترنسفورمر یکپارچه، ویدیوهای 1080p و صدای هماهنگ را در یک مرحله تولید میکند. این معماری جدید باعث شده تا این ابزار در…

سونی با ابزار جدیدی به نام Mockingbird، زمان پردازش انیمیشنهای چهره در بازیها را از چندین ساعت به چند ثانیه کاهش داده است. این فناوری که در بازی Horizon Zero Dawn Remastered به…

گوگل با پروژه «The Small Brief» و ابزار Flow AI، امکان تولید تبلیغات سطح جهانی را برای کسبوکارهای کوچک فراهم کرده است. این اقدام، شکاف بصری میان برندهای محلی و غولهای تجاری را…

پژوهشگران با معرفی روش DP-FM، مشکل اعوجاجهای هندسی در تطبیق مدلهای بینایی-زبانی را حل کردند. این متد با جداسازی دینامیکهای شعاعی و زاویهای، رکورد جدیدی در ۱۱ بنچمارک مختلف ثبت…

پژوهشگران علت توهمات ساختاری در مدلهای انتشار را در ناپایداریهای هندسی یافتند. روش جدیدی به نام فرونشانی ذاتی (IQ) میتواند با اصلاح ابعاد مدل، دقت آناتومیک تصاویر، بهویژه در…

مدل DART با ترکیب بینایی و زبان، بازرسی کابلهای صنعتی را خودکار کرده و دقت تشخیص آسیب را به شکل چشمگیری افزایش داده است. این سیستم بدون نیاز به تنظیم دقیق، شدت آسیب را تخمین زده…

پژوهشگران با معرفی مدل FairEnc توانستند سوگیریهای نژادی و جنسیتی را از سیستمهای تشخیص بیماری گلوکوم حذف کنند. این مدل چندوجهی با استفاده از دادههای مصنوعی و یادگیری تقابلی، دقت…