
رمزگشایی از SeeCo: چگونه بدون آموزش مجدد، دقت سنجش از دور را بالا ببریم
پژوهشگران چارچوب SeeCo را معرفی کردند؛ سیستمی که بدون نیاز به آموزش مجدد و هزینهبر، خطاهای معنایی مدلهای سنجش از دور را در لحظه استنتاج اصلاح میکند. این ابزار با استفاده از…
دستهبندی
تولید تصویر و ویدیو، صدای مصنوعی، هنر و موسیقی هوشمند، بازیها و وجه سرگرمکنندهی AI.
۲۰۰ مقاله منتشر شده

پژوهشگران چارچوب SeeCo را معرفی کردند؛ سیستمی که بدون نیاز به آموزش مجدد و هزینهبر، خطاهای معنایی مدلهای سنجش از دور را در لحظه استنتاج اصلاح میکند. این ابزار با استفاده از…

مدل Grok Imagine در پلتفرم Flaq AI با تغییر رویکرد از «هنر تکسویه» به «زیرساخت API-محور»، استانداردهای تولید تصویر را برای محیطهای عملیاتی تغییر داده است. این ابزار با تمرکز بر…

گوگل اپلیکیشن بومی **جمینای** (Gemini) را برای رایانههای مک منتشر کرد. کاربران با میانبر Option + Space از هر نقطهای در سیستم به دستیار هوش مصنوعی دسترسی دارند. این حرکت گوگل را…

تیمی از پژوهشگران روش **پرامپتاکو** (PromptEcho) را معرفی کردهاند که سیگنالهای پاداش را مستقیماً از مدلهای یخزده بینایی-زبان استخراج میکند. این رویکرد بدون نیاز به…

گوگل مدلهای **لیریا ۳** (Lyria 3) را برای توسعهدهندگان عرضه کرد. این خانواده دو نسخه دارد: نسخه Pro برای آهنگهای تا سه دقیقه و نسخه Clip برای کلیپهای ۳۰ ثانیهای. سیستم از…

محققان ART-VITON را توسعه دادند؛ چارچوبی مبتنی بر انتشار هدایتشده با معیارهای اندازهگیری که با حفظ هویت افراد و پسزمینه، مشکل مصنوعات ناخواسته را در پروتز مجازی لباس برطرف…

پژوهشگران چارچوبی به نام DiT-ST توسعه دادهاند که کپشنهای پیچیده را به واحدهای معنایی سلسلهمراتبی تجزیه میکند. این رویکرد درک مدلهای منتشر را در تولید تصویر از روی متن بهبود…

چارچوب RationalRewards مدلهای پاداش چندبُعدی را معرفی میکند که در زمان آموزش و آزمایش، کیفیت تولیدکنندههای تصویر را بهبود میبخشند. این مدل به دقت بالا در پیشبینی ترجیحات دست…

گوگل مدل پیشرفته تولید موسیقی لیریا ۳ پرو را منتشر کرد که امکان ساخت قطعات تا ۳ دقیقه با درک عمیقتر از ساختار موسیقایی را فراهم میکند. این مدل در پلتفرمهای مختلف از جمله Vertex…

تیمی از پژوهشگران سیستم **MeloTune** را معرفی کردهاند؛ عاملی موسیقایی که الگوهای برانگیختگی هر شنونده را شناسایی و پیشبینی میکند. این سیستم با دو شبکه زمان پیوسته بستهای روی…

پژوهشگران روشی معرفی کردهاند که از دستهبندهای چندبرچسبی برای هدایت الگوریتمهای تکاملی در فرآیند تولید تصویر استفاده میکند. این رویکرد بهجای بهبود توصیهها از پیش یا تقویت…

تیمی از پژوهشگران روش **توربو-دیدیسیام** را معرفی کردهاند که فشردهسازی تصویر مبتنی بر انتشار را بدون نیاز به دادهی آموزشی، سریعتر و کمهزینهتر میکند. نوآوری اصلی این روش…