موضوع

چندوجهی

Models that natively process text+image+audio+video

۴۰۴ مقاله منتشر شده

مقایسه صادقانه پلتفرم‌های بومی هوش مصنوعی برای خودکارسازی اسناد ۲۰۲۶

Autype در برابر Carbone: گذار از قالب‌های ایستا به اسناد عامل‌محور

اتوماسیون اسناد از قالب‌های خشک «ادغام نام» به سیستم‌های بومی هوش مصنوعی تغییر جهت می‌دهد. پلتفرم‌های جدیدی مانند Autype به جای تولید مجدد فایل‌های باینری، اجازه می‌دهند عامل‌ها…

۱۰ دقیقه خواندن

قابلیت‌های جدید هوش مصنوعی آیفون برای تکمیل جملات، ویرایش عکس و خودکارسازی کارها

اخبار کوتاه روزانه۳ هفته پیش

پشت‌پردهٔ همکاری اپل و گوگل: سیستم‌عامل iOS 27 چگونه به یک عامل هوشمند تبدیل شد؟

اپل در WWDC ۲۰۲۶ از معماری جدیدی برای هوش مصنوعی خود پرده برداشت که با همکاری گوگل Gemini توسعه یافته است. این به‌روزرسانی Siri را به یک همراه فعال تبدیل کرده و با ادغام داده‌های…

۳ دقیقه خواندن

پایان دردسر تقسیم صورتحساب با سیری در دوربین

اخبار کوتاه روزانه۳ هفته پیش

Siri in Camera: راهکار جدید اپل برای حذف اپلیکیشن‌های تقسیم صورت‌حساب

اپل در WWDC ۲۰۲۶ قابلیتی را معرفی کرد که با تحلیل عکس رسیدها، امکان ارسال درخواست پرداخت جداگانه از طریق Apple Cash را فراهم می‌کند. این ابزار با ادغام پرداخت در دوربین، نیاز به…

۲ دقیقه خواندن

اخبار کوتاه روزانه۳ هفته پیش

چرا فروشندگان Redbubble و Etsy باید نگران ابزار جدید آمازون باشند؟

آمازون قابلیت تولید طرح‌های سفارشی با هوش مصنوعی را به اپلیکیشن خرید خود اضافه کرد. اکنون کاربران آمریکایی می‌توانند با یک پرامپت، کالایی را طراحی کرده و از طریق شبکه توزیع Prime…

۲ دقیقه خواندن

وانی: دوبله هوش مصنوعی با هماهنگی لب برای سازندگان، برندها و استودیوها

سرگرمی و خلاقیت۳ هفته پیش

چگونه Vaani هویت صوتی گوینده را در ۴۰ زبان مختلف بازسازی می‌کند؟

ابزار جدید Vaani با حفظ طنین و آهنگ صدای گوینده، دوبلاژ را به بیش از ۴۰ زبان منتقل می‌کند. هدف این سامانه، حذف حس رباتیک در ویدیوها از طریق همگام‌سازی دقیق لب‌ها است.

۱ دقیقه خواندن

آموزش کاربردی۳ هفته پیشگزارش تأییدنشده

چگونه Vivix زنجیره تولید ویدیوهای کوتاه را از ده‌ها تب به یک پنل تبدیل کرد؟

پلتفرم Vivix ابزارهای تولید ویدیو، تصویر و صدا را در یک استودیوی واحد ادغام کرد. هدف این سرویس حذف نیاز به اشتراک‌های متعدد و کاهش خستگی ناشی از جابجایی میان ابزارهای پراکنده است.

۲ دقیقه خواندن

آموزش کاربردی۳ هفته پیش

فیلم کوتاه ۲۰ دلاری: چگونه 90210 کنترل کیفیت بصری را ریاضی‌وار می‌کند؟

پروژه متن‌باز 90210 با استفاده از یک خط لوله چندمدلی، تبدیل فیلمنامه به فیلم کوتاه را خودکار کرده است. این سیستم با بهره‌گیری از «اوراکل‌های کیفیت»، صحنه‌های ضعیف را شناسایی و…

۲ دقیقه خواندن

آموزش کاربردی۳ هفته پیش

چرا استخراج ساختاریافته Get It جایگزین خلاصه‌های کلی هوش مصنوعی می‌شود؟

ابزار Get It با تغییر رویکرد از خلاصه‌سازی به استخراج هدفمند، داده‌های دقیق را از URLها و تصاویر بیرون می‌کشد. این ابزار به کاربران اجازه می‌دهد دقیقاً فرمت خروجی مورد نیاز خود را…

۲ دقیقه خواندن

آموزش کاربردی۳ هفته پیش

تله‌ی «مدل کامل»: چرا سرعت اصلاح خطا مهم‌تر از دقت هوش مصنوعی است؟

سخت‌ترین بخش ثبت غذا با هوش مصنوعی، شناسایی وعده نیست، بلکه تجربه کاربر هنگام اصلاح حدس‌های غلط است. اپلیکیشن MetricSync با اولویت دادن به «سریع‌ترین مسیر اصلاح»، ثبت وعده‌های…

۳ دقیقه خواندن

آموزش کاربردی۳ هفته پیش

درون معماری stikshot: تبدیل ویدیو به انیمیشن بدون ارسال حتی یک بایت داده

stikshot یک اپلیکیشن بدون سرور (serverless) است که ویدیوها را کاملاً در مرورگر کاربر به انیمیشن‌های خطی تبدیل می‌کند. این ابزار با بهره‌گیری از TensorFlow.js و APIهای بومی مرورگر،…

۳ دقیقه خواندن

آموزش کاربردی۳ هفته پیش

کنترل احساسات صدا در Gemini 3.1 Flash: تگ‌های صوتی چگونه عمل می‌کنند؟

گوگل در نسخه‌ی پیش‌نمایش Gemini 3.1 Flash TTS، تگ‌های صوتی برای تغییر لحن و سرعت بیان را معرفی کرد. توسعه‌دهندگان اکنون می‌توانند با ترکیب این مدل و ابزارهایی مثل Firebase، صداهای…

۷ دقیقه خواندن

آموزش کاربردی۳ هفته پیش

چگونه یک فایل صوتی را به ۶ دارایی محتوایی تبدیل کنیم؟

یک گردش‌کار جدید برای تولیدکنندگان محتوا، تبدیل فایل صوتی به «منبع حقیقت» برای تمامی شبکه‌های اجتماعی را ممکن کرده است. با جداسازی متن از ویدیو، مدیریت تولید بلاگ، کپشن و زیرنویس…

۳ دقیقه خواندن