
چگونه Gmail Live جستوجوی ایمیلها را به یک مکالمه صوتی تبدیل میکند؟
گوگل با معرفی Gmail Live، قابلیت پرسوجوی صوتی از اینباکس را از طریق Gemini فراهم میکند. این ویژگی در کنار بهروزرسانیهای Docs و Keep، تابستان امسال برای مشترکان AI Pro و Ultra…
موضوع
Models that natively process text+image+audio+video
۴۰۳ مقاله منتشر شده

گوگل با معرفی Gmail Live، قابلیت پرسوجوی صوتی از اینباکس را از طریق Gemini فراهم میکند. این ویژگی در کنار بهروزرسانیهای Docs و Keep، تابستان امسال برای مشترکان AI Pro و Ultra…

گوگل با معرفی Gemini 3.5 Flash، استراتژی خود را از چتباتها به سمت هوش مصنوعی عاملمحور تغییر داد. این مدل با بهینهسازی سرعت، زیربنای دستیاران شخصی ۲۴ ساعته و بازطراحی موتور…

گوگل مدل Gemini 3.5 Flash را برای مدیریت گردشهای کاری پیچیده و عاملمحور معرفی کرد. این مدل با سرعتی چهار برابر مدلهای رقیب، زیرساخت جدید Gemini Spark را به پیش میراند.

اپل با ادغام هوش مصنوعی زاینده در ابزارهای دسترسیپذیری، پیمایش دستگاه را از حفظ کردن دستورات به درک زبان طبیعی تغییر داد. این بهروزرسانی شامل توصیف دقیق تصاویر و کنترل ویلچر با…

شرکت Odyssey با معرفی Agora-1، مدلهای جهان را از حالت تککاربره خارج کرده و محیطهای شبیهسازیشدهی مشترک و بلادرنگ را ممکن ساخته است. این سیستم با جداسازی تکامل وضعیت جهان از…

انویدیا راهنمایی عملی برای بهینهسازی مدل جهانی Cosmos Predict 2.5 با استفاده از LoRA و DoRA منتشر کرد. این روش اجازه میدهد توسعهدهندگان بدون هزینههای سنگین آموزش کامل،…

آمازون در ۱۸ مه ۲۰۲۶ قابلیت Alexa Podcasts را معرفی کرد که به کاربران آمریکایی اجازه میدهد درباره هر موضوعی پادکستهای شخصیسازیشده بسازند. این ابزار با ترکیب دادههای بهروز…

اسپیساکس قصد دارد با ارزشی خیرهکننده در ۱۲ ژوئن وارد بورس نزدک شود. همزمان، درگیریهای حقوقی ایلان ماسک و نفوذ سیاسی در معاملات سهام فناوری، ابعاد جدیدی به رقابت برای تسلط بر…

انویدیا مدل SANA-WM را با ۲.۶ میلیارد پارامتر معرفی کرد که قادر است ویدیوهای یک دقیقهای با کیفیت 720p را روی یک GPU تولید کند. این مدل با جایگزینی مکانیزم توجه استاندارد با Gated…

معیار جدید WorldReasonBench نشان میدهد که مدلهای تجاری تولید ویدیو در استدلال جهانی دو برابر قدرتمندتر از رقبای بازمتن هستند. با این حال، تمامی مدلهای بررسیشده در درک مفاهیم…

ابزار جدید image-blaster با ترکیب Claude و مدلهای تخصصی، امکان تبدیل یک عکس به محیطهای سهبعدی، مشها و جلوههای صوتی را در کمتر از ۵ دقیقه فراهم میکند. این سیستم خط لوله تولید…

شرکت Runway از تولید ابزارهای ویدیوئی به سمت «مدلهای جهانی» حرکت میکند تا قوانین فیزیک را از طریق مشاهده یاد بگیرد. هدف این شرکت ساخت دوقلوی دیجیتالی جهان برای سرعت بخشیدن به…