
نقشههای جریان؛ ترفندی برای تولید تصاویر باکیفیت در تنها یک گام
نقشههای جریان با جایگزینی پیشبینی سرعتهای محلی با انتگرالگیری از مسیر، مدلهای انتشار را متحول میکنند. این رویکرد اجازه میدهد تصاویر و ویدیوهای باکیفیت تنها در ۱ تا ۸ گام…
دستهبندی
تولید تصویر و ویدیو، صدای مصنوعی، هنر و موسیقی هوشمند، بازیها و وجه سرگرمکنندهی AI.
۲۰۰ مقاله منتشر شده

نقشههای جریان با جایگزینی پیشبینی سرعتهای محلی با انتگرالگیری از مسیر، مدلهای انتشار را متحول میکنند. این رویکرد اجازه میدهد تصاویر و ویدیوهای باکیفیت تنها در ۱ تا ۸ گام…

متا برای شناسایی کاربران زیر ۱۳ سال، از هوش مصنوعی برای تحلیل ساختار استخوانی و قد در عکسها استفاده میکند. این اقدام تهاجمی در پاسخ به جریمه ۳۷۵ میلیون دلاری شرکت در زمینه ایمنی…

آکادمی اسکار هرگونه اثر یا بازیگری تولید شده توسط هوش مصنوعی را از چرخه جوایز حذف کرد. طبق قوانین جدید، اثبات نویسندگی و اجرای انسانی برای شرکت در رقابتها اجباری است.

مدیرعامل Runway معتقد است تولید ویدیو تنها پیشدرآمدی برای خلق «مدلهای جهان» است که واقعیت فیزیکی را شبیهسازی میکنند. این چرخش استراتژیک، هدف شرکت را از ابزارهای سینمایی به سمت…

تیم Deep-unlearning با معرفی smol-audio، دسترسی به تنظیم دقیق مدلهای پیشرفتهی صوتی را از طریق نوتبوکهای آمادهی Colab ممکن کرد. این ابزار با بهرهگیری از اکوسیستم Hugging…

شرکت Mistral AI مدل Voxtral TTS را معرفی کرد؛ یک مدل ۴ میلیارد پارامتری که در طبیعی بودن صدا، ElevenLabs را شکست میدهد. این مدل با تأخیر بسیار کم و قابلیت تطبیق سریع صدا،…

تولید ویدئو با هوش مصنوعی از ابر به دسکتاپ نقل مکان کرده است. مدلهای جدیدی مانند HunyuanVideo کیفیت تجاری را روی سختافزارهای مصرفکننده ممکن کردهاند و نیاز به اشتراکهای…

مایکروسافت با معرفی VibeVoice، عصر خرد کردن فایلهای صوتی را به پایان رساند. این چارچوب قادر است فایلهای ۶۰ دقیقهای را در یک مرحله پردازش کند و انسجام لحن گوینده را در بازههای…

پلتفرم OpenMOSS با معرفی MOSS-Audio، مرزهای تحلیل صوتی را جابهجا کرد. این مدل بنیادی با معماری نوآورانه، توانسته است در نسخهی ۸ میلیاردی خود، مدلهای ۳۰ میلیاردی را در دقت تحلیل…

علیبابا دسترسی عمومی به API مدل HappyHorse 1.0 را آغاز کرد تا تولید ویدیوهای صنعتی را متحول کند. این سیستم با ارائه چهار نقطه اتصال تخصصی، مشکل قدیمی «تغییر چهره» در ویدیوهای…

پژوهش جدید Contra Labs نشان میدهد که هیچ مدل هوش مصنوعی زایندهای در تمام مراحل خلق اثر برنده نیست. این مطالعه تفاوت میان «سلیقه» و «استانداردهای حرفهای» را رمزگشایی کرده و…

انویدیا با معرفی پلاگین TensorRT برای موتور عصبی Unreal Engine 5، سرعت استنتاج هوش مصنوعی را ۱.۵ برابر افزایش داد. این ابزار با استفاده از بهینهسازی JIT، زمان پردازش…