پرش به محتوای اصلی

موضوع

چندوجهی

Models that natively process text+image+audio+video

۴۰۳ مقاله منتشر شده

AI

سازوکار Gemma 4 برای اجرای مدل‌های چندوجهی روی لپ‌تاپ با ۱۶ گیگابایت رم

گوگل مدل Gemma 4 12B را منتشر کرد؛ مدل چندوجهی میان‌اندازه‌ای که بدون نیاز به انکودرهای مجزا، صدا و تصویر را پردازش می‌کند. این مدل با مجوز آپاچی ۲.۰، برای اجرا روی سخت‌افزارهای…

۳ دقیقه خواندن
AI

چرا آمازون تصاویر جعلی را به نتایج جست‌وجوی کاربران اضافه می‌کند؟

آمازون برای کمک به خریدارانی که نام دقیق استایل مورد نظر خود را نمی‌دانند، از تصاویر تولیدشده با هوش مصنوعی در جست‌وجوها استفاده می‌کند. این ابزار کاربر را به سمت محصولات واقعی…

۲ دقیقه خواندن
AI

سازوکار AethexAI برای حذف تأخیر صوتی با تکیه بر مدل‌های زبانی کوچک

استارت‌آپ AethexAI با جذب ۳ میلیون دلار سرمایه، مدل‌های صوتی تخصصی برای بازارهای آفریقا و خاورمیانه توسعه داد. این شرکت با جایگزینی مدل‌های غول‌پیکر با مدل‌های کوچک، تأخیر در…

۲ دقیقه خواندن
AI

از تک‌دارایی به خط تولید: سازوکار گوگل برای خودکارسازی بصری I/O 2026

گوگل فاش کرد که چگونه با ابزارهای آزمایشی Nano Banana و Gemini Omni، تمام هویت بصری و تجربیات تعاملی I/O 2026 را خودکار کرده است. این رویکرد، کارهای تکراری تولید را حذف می‌کند تا…

۳ دقیقه خواندن
AI

MiniMax M3: شکستن انحصار حافظه یک میلیون توکنی در مدل‌های بازمتن

مدل M3 از شرکت MiniMax، نخستین مدل بازمتنی است که حافظه یک میلیون توکنی را با قابلیت‌های چندوجهی ترکیب می‌کند. این مدل در بنچمارک‌های کدنویسی و جستجوی وب، رقبای قدرتمندی چون…

۳ دقیقه خواندن
AI

چگونه به‌روزرسانی‌های جدید Gemini از اتمام سریع سهمیه کاربران جلوگیری می‌کند؟

گوگل با رفع چندین باگ فنی، سرعت اتمام سهمیه‌ی کاربران Gemini را کاهش داد. از مهم‌ترین تغییرات می‌توان به رایگان شدن درخواست‌های Flash Lite و دو برابر شدن سهمیه ویدئو برای کاربران…

۲ دقیقه خواندن
AI
سرگرمی و خلاقیت

فیلم ۲ هزار دلاری با هوش مصنوعی؛ نخستین اثر بلند در برنامه اصلی تریبکا

فیلم ۷۵ دقیقه‌ای «رویاهای بنفشه» با بودجه‌ای اندک، نخستین اثر بلند ساخته‌شده با هوش مصنوعی است که به برنامه اصلی جشنواره تریبکا راه یافت. این اتفاق نشان می‌دهد که کیفیت بصری سینما…

۲ دقیقه خواندن
AI

چگونه Sesame با جستجوی موازی، سرعت و دقت را در مکالمات AI هم‌گام کرد؟

شرکت Sesame با معرفی اپلیکیشنی مبتنی بر جستجوی موازی، سکوت‌های طولانی چت‌بات‌ها را حذف کرد. این سیستم به عامل‌های هوش مصنوعی اجازه می‌دهد پاسخ‌های خود را در حین صحبت به‌روز کنند.

۲ دقیقه خواندن