پرش به محتوای اصلی

موضوع

چندوجهی

Models that natively process text+image+audio+video

۴۰۳ مقاله منتشر شده

نرم‌افزار خودکار ساخت ویدیو — rendereelstudio.ai ژوئن ۲۰۲۶
آموزش کاربردیگزارش تأییدنشده

RenderEel: مدل‌های LoRA نرخ پایداری بصری در رندرینگ ویدیو را بالا بردند

استودیوی RenderEel برای حل مشکل رندرینگ کند و کیفیت ناپایدار در ویدیوهای هوش مصنوعی، از مدل‌های تخصصی LoRA استفاده می‌کند. این رویکرد به فیلمسازان اجازه می‌دهد تا کنترل بصری…

۲ دقیقه خواندن
هوش مصنوعی در حال تحلیل بازخورد بصری برای درک بهتر محتوای تصویری.

چارچوب V-F-C: کاهش خطاهای اصلاحی در طراحی با تحلیل بازخوردهای بصری

یک چارچوب جدید به نام V-F-C به هوش مصنوعی اجازه می‌دهد به جای تکیه بر متون مبهم، نشانه‌های بصری مانند فلش‌ها و هایلایت‌ها را در طرح‌ها بفهمد. این متد با اتصال بازخوردها به عناصر…

۲ دقیقه خواندن
ساخت ویدیوی هوش مصنوعی با ظاهری واقعاً آفریقایی، نه کلیشه‌ای

جایگزینی صفت‌های کلی با اسامی محلی؛ راهکار Afrigen برای حذف کلیشه‌های بصری در

پلتفرم Afrigen چارچوب جدیدی را معرفی کرده که با استفاده از «پرامپت‌نویسی فوق‌محلی»، پیش‌فرض‌های غربی در ویدیوهای هوش مصنوعی را حذف می‌کند. این متدولوژی اولویت را از صفت‌های مبهم…

۲ دقیقه خواندن
گروک AI گزارش شده به پلتفرم پورن تبدیل شده؛ بیش از نیمی از ترافیکش مربوط به محتوای بزرگسالان است.

درون استراتژی Grok؛ تبدیل مدل به قطب تولید محتوای بدون سانسور

گزارش‌های داخلی از شرکت xAI حاکی از تغییر استراتژیک مدل Grok برای جذب بازار محتوای بزرگسالان است. در حالی که رقبا حفاظ‌های سختگیرانه‌ای دارند، این پلتفرم با تولید میلیاردها تصویر…

۱ دقیقه خواندن
شرط ۲.۳ میلیارد دلاری جنرال اینتویشن: بازی‌های ویدیویی می‌توانند عامل‌های هوش مصنوعی را برای دنیای واقعی آموزش دهند.

درون معماری General Intuition؛ تبدیل میلیون‌ها ساعت گیم‌پلی به مهارت رباتیک

استارتاپ General Intuition برای آموزش استدلال فضایی ربات‌ها از میلیون‌ها ساعت داده‌های بازی‌های ویدئویی استفاده می‌کند. این شرکت با جذب ۳۲۰ میلیون دلار سرمایه، قصد دارد شکاف بین…

۸ دقیقه خواندن
پرطرفدارترین مقالات هوش مصنوعی در هاگینگ فیس - ۲۵ ژوئن ۲۰۲۶

۱۰ مقالهٔ برتر Hugging Face محوریت پژوهش AI را از چت‌بات به عامل‌های فعال تغییر

خوشه‌ای از مقالات پربازدید در Hugging Face نشان‌دهنده گذاری استراتژیک از مدل‌های پاسخ‌دهنده به عامل‌هایی است که قادر به مدل‌سازی جهان و اجرای عملیات در زمان واقعی هستند. این تحول…

۱۰ دقیقه خواندن
گوگل کنترل کامپیوتر را مستقیماً در جمنای ۳.۵ فلش تعبیه کرد؛ مدل صفحه شما را می‌بیند و کنترل می‌کند.

Gemini 3.5 Flash چگونه مسیر ساخت عامل‌های هوش مصنوعی را تغییر می‌دهد؟

گوگل با ادغام بومی «استفاده از کامپیوتر» در Gemini 3.5 Flash، این مدل را از یک چت‌بات به اپراتوری تبدیل کرد که می‌تواند مرورگرها و برنامه‌های دسک‌تاپ را مدیریت کند. این تغییر،…

۱ دقیقه خواندن
کوئیک‌میکر: مدل‌های پیشرفته هوش مصنوعی در بلندر با یک اشتراک | پروداکت هانت
آموزش کاربردیگزارش تأییدنشده

«اتصال یکپارچه به مدل‌های هوش مصنوعی»؛ هدف جدید QuickMaker برای کاربران Blender

ابزار QuickMaker با ادغام مدل‌های پیشرفته هوش مصنوعی در محیط Blender، فرآیند تولید دارایی‌های دوبعدی و سه‌بعدی را یکپارچه کرد. کاربران اکنون می‌توانند بدون نیاز به مدیریت چندین…

۱ دقیقه خواندن