پرش به محتوای اصلی

موضوع

چندوجهی

Models that natively process text+image+audio+video

۴۰۳ مقاله منتشر شده

گوگل: مدل Gemma 4 با دقت ۸۹.۲ درصدی در بنچمارک AIME، استدلال ریاضی را محلی کرد
آموزش کاربردی

گوگل: مدل Gemma 4 با دقت ۸۹.۲ درصدی در بنچمارک AIME، استدلال ریاضی را محلی کرد

گوگل دیپ‌مایند خانواده مدل‌های Gemma 4 را با وزن‌های باز عرضه کرد تا استدلال سطح پیشرو را به سخت‌افزارهای محلی بیاورد. مدل ۳۱ میلیارد پارامتری این خانواده، جهشی خیره‌کننده در…

۲ دقیقه خواندن
چگونه نقص‌های متادیتای GGUF سرعت استقرار مدل‌های محلی را کاهش می‌دهد؟
آموزش کاربردی

چگونه نقص‌های متادیتای GGUF سرعت استقرار مدل‌های محلی را کاهش می‌دهد؟

فرمت GGUF با یکپارچه‌سازی وزن‌ها و متادیتا، استقرار مدل‌های محلی را ساده کرده است. با این حال، نبود استانداردی برای فراخوانی ابزارها و توکن‌های استدلالی، توسعه‌دهندگان را مجبور به…

۲ دقیقه خواندن
درون چرخش ۲۳ میلیون دلاری Wirestock از عکاسی به تأمین داده‌های هوش مصنوعی

درون چرخش ۲۳ میلیون دلاری Wirestock از عکاسی به تأمین داده‌های هوش مصنوعی

شرکت Wirestock با جذب ۲۳ میلیون دلار سرمایه، مدل کسب‌وکار خود را از توزیع عکس به تأمین داده‌های آموزشی برای مدل‌های بنیادی تغییر داد. این شرکت اکنون با درآمد سالانه ۴۰ میلیون…

۲ دقیقه خواندن
۸ میلیون دلار سرمایه برای تبدیل محیط‌های بازی به داده‌های آموزشی مدل‌های جهانی

۸ میلیون دلار سرمایه برای تبدیل محیط‌های بازی به داده‌های آموزشی مدل‌های جهانی

استارتاپ Origin Lab با جذب ۸ میلیون دلار سرمایه، بازاری را برای فروش داده‌های شبیه‌سازی‌شده‌ی بازی‌های ویدئویی به آزمایشگاه‌های هوش مصنوعی ایجاد می‌کند. این داده‌ها برای آموزش…

۲ دقیقه خواندن
چگونه درگاه‌های مدل یکپارچه هزینه ساخت همراهان هوش مصنوعی را ۴۰٪ کاهش می‌دهند؟
آموزش کاربردی

چگونه درگاه‌های مدل یکپارچه هزینه ساخت همراهان هوش مصنوعی را ۴۰٪ کاهش می‌دهند؟

توسعه‌گران همراهان هوش مصنوعی با جایگزینی APIهای تک‌مدلی با درگاه‌های یکپارچه، هزینه‌های استنتاج را تا ۴۰٪ کاهش داده‌اند. این رویکرد اجازه می‌دهد شخصیت‌های دیجیتال از وابستگی به…

۲ دقیقه خواندن
چگونه NVIDIA جستجوی ویدئویی را از سیستم‌های هشدار به عامل‌های هوشمند تبدیل کرد؟
آموزش کاربردی

چگونه NVIDIA جستجوی ویدئویی را از سیستم‌های هشدار به عامل‌های هوشمند تبدیل کرد؟

انویدیا با معرفی طرح VSS، جستجو و خلاصه‌سازی ویدئوها را به عامل‌های هوش مصنوعی سپرد. این فناوری اجازه می‌دهد آرشیوهای عظیم ویدئویی به‌جای هشارهای ساده، با زبان طبیعی مورد بازجویی…

۳ دقیقه خواندن