سرگرمی و خلاقیت

رمزگشایی از SeeCo: چگونه بدون آموزش مجدد، دقت سنجش از دور را بالا ببریم

پژوهشگران چارچوب SeeCo را معرفی کردند؛ سیستمی که بدون نیاز به آموزش مجدد و هزینه‌بر، خطاهای معنایی مدل‌های سنجش از دور را در لحظه استنتاج اصلاح می‌کند. این ابزار با استفاده از…

آموزش کاربردی۲ ماه پیش

چگونه Grok Imagine تولید تصویر را به یک خط لوله صنعتی تبدیل کرد

مدل Grok Imagine در پلتفرم Flaq AI با تغییر رویکرد از «هنر تک‌سویه» به «زیرساخت API-محور»، استانداردهای تولید تصویر را برای محیط‌های عملیاتی تغییر داده است. این ابزار با تمرکز بر…

۲ دقیقه خواندن

آموزش کاربردی۲ ماه پیش

گوگل اپلیکیشن بومی جمینای را برای مک منتشر کرد؛ رقابت با اوپن‌ای‌آی و آنتروپیک

گوگل اپلیکیشن بومی **جمینای** (Gemini) را برای رایانه‌های مک منتشر کرد. کاربران با میانبر Option + Space از هر نقطه‌ای در سیستم به دستیار هوش مصنوعی دسترسی دارند. این حرکت گوگل را…

۱ دقیقه خواندن

سرگرمی و خلاقیت۲ ماه پیش

پرامپت‌اکو: پاداش بدون حاشیه‌نویسی برای آموزش مدل‌های متن‌به‌تصویر

تیمی از پژوهشگران روش **پرامپت‌اکو** (PromptEcho) را معرفی کرده‌اند که سیگنال‌های پاداش را مستقیماً از مدل‌های یخ‌زده بینایی-زبان استخراج می‌کند. این رویکرد بدون نیاز به…

۱ دقیقه خواندن

سرگرمی و خلاقیت۲ ماه پیش

گوگل لیریا ۳، مدل ساخت موسیقی با هوش مصنوعی زاینده را عرضه کرد

گوگل مدل‌های **لیریا ۳** (Lyria 3) را برای توسعه‌دهندگان عرضه کرد. این خانواده دو نسخه دارد: نسخه Pro برای آهنگ‌های تا سه دقیقه و نسخه Clip برای کلیپ‌های ۳۰ ثانیه‌ای. سیستم از…

۴ دقیقه خواندن

سرگرمی و خلاقیت۲ ماه پیش

ART-VITON: روشی نوین برای پروتز مجازی لباس با استفاده از انتشار نهان هدایت‌شده

محققان ART-VITON را توسعه دادند؛ چارچوبی مبتنی بر انتشار هدایت‌شده با معیارهای اندازه‌گیری که با حفظ هویت افراد و پس‌زمینه، مشکل مصنوعات ناخواسته را در پروتز مجازی لباس برطرف…

۱ دقیقه خواندن

سرگرمی و خلاقیت۲ ماه پیش

چارچوب DiT-ST مشکل درک کپشن‌های پیچیده در تولید تصویر با هوش مصنوعی را حل کرد

پژوهشگران چارچوبی به نام DiT-ST توسعه داده‌اند که کپشن‌های پیچیده را به واحدهای معنایی سلسله‌مراتبی تجزیه می‌کند. این رویکرد درک مدل‌های منتشر را در تولید تصویر از روی متن بهبود…

۱ دقیقه خواندن

تحلیل و بررسی تخصصی۲ ماه پیش

پاداش‌های عقلانی: مقیاس‌بندی تولید بصری با پاداش‌های استدلالی

چارچوب RationalRewards مدل‌های پاداش چندبُعدی را معرفی می‌کند که در زمان آموزش و آزمایش، کیفیت تولیدکننده‌های تصویر را بهبود می‌بخشند. این مدل به دقت بالا در پیش‌بینی ترجیحات دست…

۱ دقیقه خواندن

سرگرمی و خلاقیت۲ ماه پیش

گوگل لیریا ۳ پرو را با قابلیت تولید موسیقی ۳ دقیقه‌ای عرضه کرد

گوگل مدل پیشرفته تولید موسیقی لیریا ۳ پرو را منتشر کرد که امکان ساخت قطعات تا ۳ دقیقه با درک عمیق‌تر از ساختار موسیقایی را فراهم می‌کند. این مدل در پلتفرم‌های مختلف از جمله Vertex…

۳ دقیقه خواندن

اخبار کوتاه روزانه۲ ماه پیش

MeloTune رونمایی کرد: یادگیری برانگیختگی روی دستگاه برای انتخاب هوشمند موسیقی

تیمی از پژوهشگران سیستم **MeloTune** را معرفی کرده‌اند؛ عاملی موسیقایی که الگوهای برانگیختگی هر شنونده را شناسایی و پیش‌بینی می‌کند. این سیستم با دو شبکه زمان پیوسته بسته‌ای روی…

۲ دقیقه خواندن

سرگرمی و خلاقیت۲ ماه پیش

تکامل هوشمند توصیه‌ها برای تصویرسازی بهتر با هوش مصنوعی زاینده

پژوهشگران روشی معرفی کرده‌اند که از دسته‌بندهای چندبرچسبی برای هدایت الگوریتم‌های تکاملی در فرآیند تولید تصویر استفاده می‌کند. این رویکرد به‌جای بهبود توصیه‌ها از پیش یا تقویت…

۱ دقیقه خواندن

سرگرمی و خلاقیت۲ ماه پیش

توربو-دی‌دی‌سی‌ام؛ روشی نوین برای فشرده‌سازی تصویر با انتشار

تیمی از پژوهشگران روش **توربو-دی‌دی‌سی‌ام** را معرفی کرده‌اند که فشرده‌سازی تصویر مبتنی بر انتشار را بدون نیاز به داده‌ی آموزشی، سریع‌تر و کم‌هزینه‌تر می‌کند. نوآوری اصلی این روش…

۱ دقیقه خواندن