موضوع

چندوجهی

Models that natively process text+image+audio+video

۴۰۳ مقاله منتشر شده

سنجش سرعت خواندن ژاپنی با AmiVoice — اپلیکیشن مربیگری فراتر از تبدیل گفتار به متن

محاسبات کد در برابر تخمین‌های LLM برای تحلیل دقیق بلندخوانی

یک توسعه‌دهنده با استفاده از برچسب‌های زمانی AmiVoice، اپلیکیشنی برای آموزش بلندخوانی زبان ژاپنی ساخته است که معیارهای سرعت و مکث را با دقت ریاضی محاسبه می‌کند. این سیستم با سپردن…

۱۲ دقیقه خواندن

رابط کاربری اپ VSCO Studio Pro با قابلیت ویرایش گروهی صد عکس به‌طور همزمان

اخبار کوتاه روزانههفتهٔ گذشته

اشتراک Studio One: دسترسی به ابزارهای حرفه‌ای با هزینه ۴۹۹ دلار

اپلیکیشن VSCO با معرفی Studio Pro و اشتراک سالانه ۴۹۹ دلاری Studio One، وارد بازار عکاسی حرفه‌ای شد. این ابزار اکنون امکان ویرایش هم‌زمان ۱۰۰ عکس را با استفاده از هوش مصنوعی به…

۲ دقیقه خواندن

تولید تصاویر هوش مصنوعی با ابعاد دقیق پیکسلی

آموزش کاربردیهفتهٔ گذشته

«تولید دقیق پیکسلی»؛ راهکار PixExact برای حذف افت کیفیت تصاویر

پلتفرم PixExact با حذف محدودیت‌های نسبت ابعاد، امکان تولید تصاویر با ابعاد پیکسلی دقیق تا ۴۰۹۶×۴۰۹۶ را فراهم کرد. این ابزار با ترکیب صحنه در ابعاد نهایی، نیاز به برش دستی و افت…

۶ دقیقه خواندن

اسکنر فراصوت تمام‌بدن Midjourney در حال توسعه است

اخبار کوتاه روزانههفتهٔ گذشته

اسکنر جدید Midjourney زمان تشخیص‌های پزشکی را از ۹۰ دقیقه به ۶۰ ثانیه رساند

شرکت Midjourney با ورود به سخت‌افزار پزشکی، اسکنری اولتراسونیک معرفی کرد که می‌تواند کل بدن را در ۶۰ ثانیه نقشه‌برداری کند. این شرکت قصد دارد با راه‌اندازی «اسپاهای تشخیصی» در…

۳ دقیقه خواندن

توسعه‌دهنده انفرادی یک ردیاب تغذیه رایگان هوش مصنوعی ساخت — آنچه آموختم

آموزش کاربردیهفتهٔ گذشته

«بدون نیاز به DevOps»؛ پیاده‌سازی مقیاس‌پذیر AI در goNutriTrack

یک توسعه‌دهنده مستقل با ترکیب مدل‌های چندوجهی Claude و ساختار Serverless، اپلیکیشنی ساخت که ثبت وعده‌های غذایی را از طریق عکس و صدا جایگزین تایپ دستی می‌کند. این پروژه نشان می‌دهد…

۲ دقیقه خواندن

ارزیابی گفتار Chivox MCP برای عامل‌های زبانی هوش مصنوعی

آموزش کاربردیهفتهٔ گذشته

چگونه Chivox مدل‌های زبانی را به ممتحن‌های زبان تبدیل کرد؟

شرکت Chivox با معرفی یک سرور MCP، تحلیل دقیق تلفظ در سطح «واج» یا کوچک‌ترین واحد صوتی را به مدل‌های زبانی آورد. این ابزار به جای تبدیل ساده‌ی گفتار به متن، نمرات دقیقی از دقت،…

۳ دقیقه خواندن

تولید ویدیوی هوش مصنوعی با Veo 3.1 از طریق Google Flow API

آموزش کاربردیهفتهٔ گذشته

اشتراک‌های مصرف‌کننده در برابر هزینه‌های سازمانی برای تولید ویدیو با AI

یک پل ارتباطی API جدید به توسعه‌دهندگان اجازه می‌دهد به جای پرداخت هزینه‌های سنگین سازمانی، با اشتراک‌های مصرف‌کننده به مدل‌های ویدیویی گوگل دسترسی یابند. این تغییر هزینه تولید…

۸ دقیقه خواندن

معیار ارزیابی ۷۵۰ وظیفه‌ای OpenAI برای سنجش هوش مصنوعی در پژوهش‌های علوم زیستی واقعی با راهنمای کارشناسی

تحلیل و بررسی تخصصیهفتهٔ گذشته

LifeSciBench: مدل‌های برتر زیست‌شناسی در ۶۴٪ تکالیف پژوهشی شکست خوردند

OpenAI با معرفی محک LifeSciBench نشان داد که حتی پیشرفته‌ترین مدل‌های تخصصی زیست‌شناسی در مواجهه با مسائل پیچیده پژوهشی ناتوان‌اند. این داده‌ها حاکی از شکاف عمیق میان حفظ اطلاعات…

۶ دقیقه خواندن

عصر نوین می‌دジャーニー: تولید تصاویر با هوش مصنوعی به سطحی فراتر از واقعیت رسید.

اخبار کوتاه روزانههفتهٔ گذشته

Midjourney با سخت‌افزار التراسونیک وارد میدان پیشگیری پزشکی شد

شرکت Midjourney با معرفی Midjourney Scanner از تولید تصویر فاصله گرفت تا دستگاهی برای تصویربرداری سلامت بدن بسازد. این شرکت قصد دارد تا سال ۲۰۲۷ مرکز تحقیقاتی ویژه‌ای در…

۷ دقیقه خواندن

هوش مصنوعی سازمانی فراتر از چت‌بات‌ها: تکامل مهارت‌ها با آی‌فلایتک استرون

آموزش کاربردیهفتهٔ گذشته

iFLYTEK: انتقال کنترل عامل‌های AI از متن به کدهای ماژولار

شرکت iFLYTEK با معرفی Astron Skillhub و Astron Agent، مدیریت عامل‌های هوش مصنوعی را از پرامپت‌های یکپارچه به مهارت‌های ماژولار و کنترل‌شده منتقل کرد. این چارچوب جدید لایه‌های…

۲ دقیقه خواندن

مینی‌مکس M3: اولین مدل متن‌باز برای یکپارچه‌سازی سه مرز دانش هوش مصنوعی

اخبار کوتاه روزانههفتهٔ گذشته

مدل M3 از MiniMax با پنجره متنی یک میلیون توکنی عرضه شد

شرکت MiniMax مدل M3 را با قابلیت‌های کدنویسی پیشرفته و پنجره متنی یک میلیون توکنی به‌صورت وزن‌های باز منتشر کرد. این مدل با ادغام قابلیت‌های چندوجهی و استدلال، رقابت مستقیمی با…

۲ دقیقه خواندن

آمازون، انویدیا و AMD ۳۱۰ میلیون دلار روی استارتاپ هوش مصنوعی سازنده مدل‌های سه‌بعدی جهان سرمایه‌گذاری کردند.

اخبار کوتاه روزانه۲ هفته پیش

سرمایه‌گذاری سری B: ۳۱۰ میلیون دلار برای شبیه‌سازی فیزیک در Odyssey

استارتاپ Odyssey با جذب ۳۱۰ میلیون دلار سرمایه در سری B، بر توسعه «مدل‌های جهانی» برای شبیه‌سازی قوانین فیزیک تمرکز می‌کند. این دور سرمایه‌گذاری با حمایت انویدیا، ای‌ام‌دی و…

۱ دقیقه خواندن