پرش به محتوای اصلی

موضوع

چندوجهی

Models that natively process text+image+audio+video

۴۰۳ مقاله منتشر شده

لوگوی دیپ‌سیک ویژن روی پس‌زمینه‌ای آبی تیره با نماد چشم و مدارهای الکترونیکی.
اخبار کوتاه روزانه

DeepSeek: تبدیل مستقیم فرمت‌های بصری پیچیده به داده‌های متنی

دیپ‌سیک با معرفی قابلیت Vision، امکان جست‌وجو و استخراج متن و داده‌ها را مستقیماً از تصاویر و ویدیوها فراهم کرد. این ابزار هدفش حذف تایپ دستی داده‌ها از فرمت‌های پیچیده بصری است.

۴ دقیقه خواندن۱
مقایسه ابزارهای هوش مصنوعی تبدیل متن به ویدیو — رندرریل استودیو، ژوئن ۲۰۲۶
آموزش کاربردی

مدل‌های لورا مرز میان ویدیوهای آماتور و حرفه‌ای AI را جابه‌جا کردند

استودیوی Rendereel تأکید می‌کند که خروجی‌های باکیفیت در ویدیوهای هوش مصنوعی دیگر با ابزارهای عمومی ممکن نیست. برای عبور از سقف کیفی آماتورها، استفاده از مدل‌های لورا (LoRA) برای…

۲ دقیقه خواندن
ماشینی که از آن خواسته شده سکوت را نقاشی کند، در حال خلق اثری انتزاعی است.

هنر هوش مصنوعی؛ آرشیوی از میانگین خاطرات و غم‌های جمعی بشر

بررسی این دیدگاه که تولید تصویر توسط هوش مصنوعی، نه یک خلق original، بلکه بازترکیبی از تجربیات جمعی انسان است. نویسنده استدلال می‌کند که خروجی‌های مدل‌ها در واقع بازتابی از…

۲ دقیقه خواندن
ابزارهای پایش LLM نسبت به لایه صدا نابینا هستند. این ۶ مورد را بررسی کردم.
آموزش کاربردی

کامی‌ب‌های کاذب؛ شکاف میان ابزارهای نظارتی و واقعیتِ عامل‌های صوتی

ابزارهای استاندارد نظارت بر مدل‌های زبانی، بخش بزرگی از تأخیرهای لایه‌ی صوتی را نادیده می‌گیرند. توسعه‌دهندگان برای رفع این مشکل باید از ابزارهای مبتنی بر OpenTelemetry استفاده…

۳ دقیقه خواندن
اسنپ تیم ویدیوی هوش مصنوعی خود را به دلیل هزینه‌ها به شرکت جدید داتمو جدا کرد.
اخبار کوتاه روزانه

گزارش مدیریتی: تفکیک Dotmo راهکار اسنپ برای کنترل مخارج توسعه

شرکت اسنپ برای مدیریت هزینه‌های بالای تحقیق و توسعه، تیم ویدیوهای هوش مصنوعی خود را به شرکت مستقل Dotmo تبدیل کرد. اسنپ همچنان از طریق مالکیت سهام و سرمایه‌گذاری مدیر فنی خود، نفع…

۳ دقیقه خواندن
لوگوی شرکت جنرال اینتویشن روی پس‌زمینه‌ای آبی تیره
اخبار کوتاه روزانهگزارش تأییدنشده

General Intuition با جذب ۳۰۰ میلیون دلار مدل‌های دنیای گیمینگ را به ربات‌ها

استارت‌آپ General Intuition با ارزش‌گذاری ۲ میلیارد دلاری، در تلاش است تا با استفاده از داده‌های عظیم بازی‌های ویدئویی، عامل‌های هوش مصنوعی با درک فضایی و زمانی دقیق بسازد.

۲ دقیقه خواندن
اسپیکر هوشمند جدید گوگل پس از شش سال هفته آینده عرضه می‌شود
اخبار کوتاه روزانه

گوگل اسپیکر جدید ۹۹ دلاری خود را برای اجرای Gemini Home عرضه می‌کند

گوگل پس از شش سال، نخستین سخت‌افزار صوتی اختصاصی خود را برای اجرای بومی Gemini Home معرفی کرد. این دستگاه با تمرکز بر پردازش محلی و تعاملات زبانی پیشرفته، قیمت ۹۹ دلاری دارد.

۲ دقیقه خواندن
ادوبی عوامل هوش مصنوعی را به فتوشاپ، پریمیر و سایر برنامه‌های کریتیو کلود اضافه کرد.
اخبار کوتاه روزانه

عامل‌های هوش مصنوعی ادوبی کارهای تکراری تولید محتوا را خودکار کردند

ادوبی با ادغام عامل‌های هوشمند در مجموعه‌ی Creative Cloud، فرآیندهای تکراری تولید را حذف کرده است. این ابزارها با اتصال به پلتفرم‌هایی مثل ChatGPT، فاصله میان ایده‌پردازی و خروجی…

۳ دقیقه خواندن