سرگرمی و خلاقیت

HapticLDM: جایگزینی توالی‌های خطی با مدل‌های انتشار برای تولید لرزش‌های لمسی

پژوهشگران مدل HapticLDM را معرفی کردند؛ نخستین سیستم تبدیل متن به لرزش بر پایه مدل‌های انتشار لایه‌ای. این مدل با غلبه بر محدودیت‌های مدل‌های توالی‌محور، بازخوردهای لمسی…

اخبار کوتاه روزانه۲ ماه پیش

برنامه‌ریزی برای رضایت: تلاش هالیوود برای تبدیل هویت دیجیتال به دارایی تجاری

ستاره‌های هالیوود و آژانس‌های مدلینگ از استانداردی فنی برای کنترل برنامه‌ریزی‌شده‌ی دسترسی هوش مصنوعی به چهره و صدای خود حمایت می‌کنند. این سیستم از طریق یک دفتر ثبت مرکزی و…

۳ دقیقه خواندن

اخبار کوتاه روزانه۲ ماه پیش

قمار ۵۳۷ هزار دلاری Unitree برای تولید انبوه ربات‌های سوارشدنی

شرکت Unitree با معرفی ربات GD01، وارد بازار ربات‌های سوارشدنی و تغییرپذیر شده است. این ماشین با قیمت ۵۳۷ هزار دلار، بازارهای لوکس و صنعتی را هدف قرار داده تا مسیر را برای عرضه…

۲ دقیقه خواندن

تحلیل و بررسی تخصصی۲ ماه پیش

سازوکار DRoRAE: کاهش rFID در ImageNet از ۰.۵۷ به ۰.۲۹ با تلفیق لایه‌ها

پژوهشگران با معرفی DRoRAE، روشی برای تجمیع ویژگی‌های تمامی لایه‌های رمزگذار بصری ابداع کردند که کیفیت بازسازی تصاویر را به‌طور چشم‌گیری افزایش می‌دهد. این مدل با شناسایی یک قانون…

۲ دقیقه خواندن

تحلیل و بررسی تخصصی۲ ماه پیش

سازوکار AllocMV: مدیریت منابع محاسباتی برای حفظ ثبات بصری در ویدیوهای بلند

AllocMV چارچوب جدیدی است که تولید ویدیوهای موسیقی را به یک مسئله تخصیص منابع تبدیل می‌کند تا هزینه‌های محاسباتی کاهش و ثبات بصری افزایش یابد. این سیستم با استفاده از یک حل‌کننده…

۲ دقیقه خواندن

سرگرمی و خلاقیت۲ ماه پیش

رتبه‌ی اول Artificial Analysis: راز تولید هم‌زمان صدا و تصویر در HappyHorse 1.0

مدل HappyHorse 1.0 با جایگزینی مدل‌های انتشار با یک ترنسفورمر یکپارچه، ویدیوهای 1080p و صدای هماهنگ را در یک مرحله تولید می‌کند. این معماری جدید باعث شده تا این ابزار در…

۲ دقیقه خواندن

سرگرمی و خلاقیت۲ ماه پیش

ساعت‌ها کار سخت در یک ثانیه؛ جادوی جدید سونی برای زنده کردن بازی‌ها

سونی با ابزار جدیدی به نام Mockingbird، زمان پردازش انیمیشن‌های چهره در بازی‌ها را از چندین ساعت به چند ثانیه کاهش داده است. این فناوری که در بازی Horizon Zero Dawn Remastered به…

۳ دقیقه خواندن

اخبار کوتاه روزانه۲ ماه پیش

پایان انحصار بودجه‌های میلیونی؛ هر کسب‌وکار کوچکی حالا یک استودیوی تبلیغاتی دارد

گوگل با پروژه «The Small Brief» و ابزار Flow AI، امکان تولید تبلیغات سطح جهانی را برای کسب‌وکارهای کوچک فراهم کرده است. این اقدام، شکاف بصری میان برندهای محلی و غول‌های تجاری را…

۲ دقیقه خواندن

تحلیل و بررسی تخصصی۲ ماه پیش

خطای هندسی پنهانی که دقت مدل‌های چندوجهی شما را می‌کشد

پژوهشگران با معرفی روش DP-FM، مشکل اعوجاج‌های هندسی در تطبیق مدل‌های بینایی-زبانی را حل کردند. این متد با جداسازی دینامیک‌های شعاعی و زاویه‌ای، رکورد جدیدی در ۱۱ بنچمارک مختلف ثبت…

۲ دقیقه خواندن

تحلیل و بررسی تخصصی۲ ماه پیش

پایان کابوس انگشت‌های ششم؛ رمزگشایی از هندسه‌ی توهمات AI

پژوهشگران علت توهمات ساختاری در مدل‌های انتشار را در ناپایداری‌های هندسی یافتند. روش جدیدی به نام فرونشانی ذاتی (IQ) می‌تواند با اصلاح ابعاد مدل، دقت آناتومیک تصاویر، به‌ویژه در…

۲ دقیقه خواندن

تحلیل و بررسی تخصصی۲ ماه پیش

داده‌های جدید Arxiv: مدل DART دقت بازرسی کابل‌ها را ۳۸٪ جهش داد

مدل DART با ترکیب بینایی و زبان، بازرسی کابل‌های صنعتی را خودکار کرده و دقت تشخیص آسیب را به شکل چشم‌گیری افزایش داده است. این سیستم بدون نیاز به تنظیم دقیق، شدت آسیب را تخمین زده…

۲ دقیقه خواندن

تحلیل و بررسی تخصصی۲ ماه پیش

پایان تبعیض نژادی در تشخیص گلوکوم؛ رمزگشایی از مدل FairEnc

پژوهشگران با معرفی مدل FairEnc توانستند سوگیری‌های نژادی و جنسیتی را از سیستم‌های تشخیص بیماری گلوکوم حذف کنند. این مدل چندوجهی با استفاده از داده‌های مصنوعی و یادگیری تقابلی، دقت…

۲ دقیقه خواندن