
چگونه اوبر با مدلهای استدلالی OpenAI فشار ذهنی رانندگان را گرفت
اوبر با پیادهسازی یک معماری عاملمحور بر پایه OpenAI، منوهای پیچیده اپلیکیشن را با راهنماییهای صوتی و استدلالی جایگزین کرده است. این سیستم با هدف بهینهسازی درآمد رانندگان و…
موضوع
Models that natively process text+image+audio+video
۴۰۳ مقاله منتشر شده

اوبر با پیادهسازی یک معماری عاملمحور بر پایه OpenAI، منوهای پیچیده اپلیکیشن را با راهنماییهای صوتی و استدلالی جایگزین کرده است. این سیستم با هدف بهینهسازی درآمد رانندگان و…

استارتاپ Genesis AI با معرفی مدل بنیادی GENE-26.5 و سختافزارهای پیشرفته، قصد دارد شکاف میان دادههای آموزشی و واقعیت فیزیکی را از بین ببرد. این سیستم با استفاده از دستکشهای…

پلتفرم Mininglamp-AI با عرضه یک اکوسیستم کامل برای تراشههای اپل، امکان اجرای عاملهای گرافیکی را بهصورت کاملاً محلی فراهم کرد. این اقدام ریسکهای امنیتی آپلود دادهها در ابر را…

پلتفرم Hugging Face با معرفی مجموعهدادههای تست خصوصی، تلاش میکند جلوی تقلب مدلها در بنچمارکهای عمومی را بگیرد. این تغییر مسیر، معیار سنجش مدلهای بازشناسی گفتار را از «حفظ…

شرکت OpenAI مدل GPT-5.5 Instant را به عنوان موتور پیشفرض ChatGPT معرفی کرد تا توهمات در حوزههای حساس را حذف کند. این بهروزرسانی با ادغام حافظه عمیق در Gmail و فایلها، دقت…

OpenAI با بازطراحی زیرساخت WebRTC، تأخیر در مکالمات صوتی را برای ۹۰۰ میلیون کاربر کاهش داد. این شرکت با جداسازی مسیریابی بستهها از پایانههای پروتکل، مشکل مقیاسپذیری در…

شیائومی با معرفی MiMo-V2.5-Pro، بازی را برای مدلهای کدنویسی تغییر داد. این مدل با وزنهای باز، عملکردی مشابه Claude Opus 4.6 دارد اما با مصرف توکن بهمراتب کمتر.

xAI ابزار Custom Voices را معرفی کرد که تنها با یک دقیقه نمونه صوتی، در کمتر از دو دقیقه صدای کاربر را شبیهسازی میکند. این سیستم با ادغام در APIهای Grok و استفاده از احراز هویت…

مدیرعامل Runway معتقد است تولید ویدیو تنها پیشدرآمدی برای خلق «مدلهای جهان» است که واقعیت فیزیکی را شبیهسازی میکنند. این چرخش استراتژیک، هدف شرکت را از ابزارهای سینمایی به سمت…

دیپگرام با معرفی Flux Multilingual، خطلولههای پیچیده تبدیل صوت را با یک مدل واحد برای ۱۰ زبان جایگزین کرد. این سیستم با گذار از transcription ساده به شناسایی محاورهای، امکان…

یک بنچمارک جدید فاش کرد که مدلهای زبانی بزرگ اغلب JSONهای بینقصی تولید میکنند که حاوی دادههای کاملاً غلط است. این «شکاف دقت» ثابت میکند که رعایت ساختار (Schema Compliance)…

مدل Mistral Medium 3.5 با ۱۲۸ میلیارد پارامتر، مرز بین مدلهای استدلالی و کدنویسی را از بین برد. این مدل متراکم، پایداری عملیاتی را جایگزین تخصصهای پراکنده کرد تا یک ابزار…