پرش به محتوای اصلی

موضوع

چندوجهی

Models that natively process text+image+audio+video

۴۰۳ مقاله منتشر شده

کارگران در پایتخت سخت‌افزار چین با بدن خود ربات‌های انسان‌نما را هدایت می‌کنند.

استراتژی IO-AI Tech برای آموزش ربات‌های انسان‌نما با کنترل از راه دور

استارت‌آپ چینی IO-AI Tech از اپراتورهای انسانی برای آموزش ربات‌های انسان‌نما استفاده می‌کند تا داده‌های فیزیکی لازم برای رسیدن به خودمختاری کامل را جمع‌آوری کند. این روش، شکاف…

۴ دقیقه خواندن
نمودار معماری سیستم TREX: اجرای کد و تولید مصنوعات برای بازبینی هوشمند کد
آموزش کاربردی

تحلیل استاتیک در برابر اجرای پویا برای شناسایی باگ‌های رابط کاربری

شرکت Greptile لایه‌ی اجرایی TREX را معرفی کرد تا بررسی کدهای AI را از خواندن ساده به اجرای واقعی تغییر دهد. این رویکرد اجازه می‌دهد خطاهای منطقی و پس‌روی‌های رابط کاربری که در…

۷ دقیقه خواندن
لوگوی پروژه CADAM، یک برنامه وب متن‌باز برای تبدیل متن به طراحی CAD در گیت‌هاب.
آموزش کاربردی

تبدیل متن به مدل‌های سه‌بعدی پارامتریک با ابزار متن‌باز CADAM

پلتفرم CADAM با تبدیل توصیفات متنی به کدهای OpenSCAD، امکان ساخت مدل‌های سه‌بعدی قابل ویرایش را فراهم می‌کند. این ابزار برخلاف مدل‌های رایج، خروجی‌هایی مهندسی و دقیق تولید می‌کند…

۶ دقیقه خواندن
روز ۷. متن حل شد. اما آیکون‌ها و دکمه‌های تصویری هنوز نامرئی‌اند. تطبیق الگو وارد می‌شود.
آموزش کاربردی

«چشمان جدید برای عامل‌ها»؛ روشی برای تشخیص آیکون‌های غیرمتنی در موبایل

توسعه‌دهنده‌ای به نام Dexter2344 با ادغام قابلیت تطبیق الگو در عامل‌های موبایلی، مشکل «دکمه‌های نامرئی» را حل کرد. این روش به عامل اجازه می‌دهد آیکون‌هایی مثل دکمه ارسال واتس‌اپ…

۳ دقیقه خواندن
پیش‌بینی حرکت سه‌بعدی با راهنمایی زبان: معماری مدل MolmoMotion برای تولید حرکات انسان بر اساس دستورات متنی.
آموزش کاربردی

«پیش‌بینی مسیر از طریق متن»؛ دستاورد جدید مؤسسه AllenAI در فضای سه‌بعدی

مؤسسه AllenAI مدل MolmoMotion را معرفی کرد که می‌تواند حرکت آینده اشیاء در فضای سه‌بعدی را بر اساس دستورات متنی پیش‌بینی کند. این سیستم با ارائه یک مجموعه داده عظیم شامل یک میلیون…

۸ دقیقه خواندن
کنترل تنظیمات تلویزیون TCL با دستور صوتی در برخی مدل‌ها
اخبار کوتاه روزانهگزارش تأییدنشده

گوگل کنترل‌های صوتی Gemini را به تلویزیون‌های TCL آورد

گوگل قابلیت‌های صوتی مبتنی بر Gemini را برای مدل‌های منتخب TCL فعال کرد. کاربران اکنون می‌توانند تنظیمات پیچیده تصویر و صدا را به‌جای گشتن در منوها، با دستورات صوتی ساده تغییر…

۲ دقیقه خواندن۱
۵ قابلیت پنهان اپل اینتلیجنس که شاید نادیده گرفته‌اید
آموزش کاربردیتأییدنشده · منبع منفرد

قابلیت‌های پنهان iOS 27 تجربه کاربری اپل را به اتوماسیون فعال برد

کاربران iOS 27 ابزارهای پیشرفته‌ای مانند Image Wand و Describe Your Change را نادیده می‌گیرند. این قابلیت‌ها فراتر از خلاصه‌سازی ساده، تجربه کاربری را به سمت اتوماسیون فعال…

۶ دقیقه خواندن۱
ابزارهای نقاشی داخلی iOS 27 Messages: راهنمای استفاده
آموزش کاربردیگزارش تأییدنشده

«جایگزینی متن با طرح»، رویکرد جدید اپل در پیام‌رسان iOS 27

اپل در iOS 27 کیبوردهای متنی را با یک بوم دیجیتال جایگزین می‌کند تا کاربران بتوانند یادداشت‌های دست‌نویس و طرح‌های سریع ارسال کنند. این قابلیت در حال حاضر برای توسعه‌دهندگان در…

۳ دقیقه خواندن۱
جمع‌آوری داده برای آموزش ربات‌ها کار سخت و کم‌حاشیه‌ای است. برخی آزمایشگاه‌های هوش مصنوعی قبلاً به ایکس‌دی‌او‌اف برای این کار

درون قمار ۷۰ میلیون دلاری XDOF برای رفع گلوگاه داده‌های رباتیک

استارت‌آپ XDOF با جذب ۷۰ میلیون دلار سرمایه، زیرساخت جمع‌آوری داده‌های باکیفیت برای هوش مصنوعی فیزیکی را می‌سازد. این شرکت خدماتی را ارائه می‌دهد که آزمایشگاه‌های بزرگ AI برای…

۴ دقیقه خواندن
ادایسه ۳۱۰ میلیون دلار سری B با ارزش‌گذاری ۱.۴۵ میلیارد دلار برای توسعه مدل‌های جهانی هوش مصنوعی جذب کرد.

درون قمار ۳۱۰ میلیون دلاری Odyssey برای آموزش فیزیک به هوش مصنوعی

آزمایشگاه Odyssey با جذب ۳۱۰ میلیون دلار سرمایه در valuation ۱.۴۵ میلیارد دلاری، قصد دارد مدل‌هایی بسازد که به جای پیش‌بینی کلمات، قوانین فیزیکی جهان را بشناسند. این پروژه با تکیه…

۴ دقیقه خواندن
از شکستن فیلترهای هوش مصنوعی تا لباس پوشاندن افراد واقعی: یک خالق بین‌حوزه‌ای قابل توجه

«لباس‌های قابل خرید»؛ خروجی جدید پژوهشگر امنیت AI در دنیای مد

پژوهشگری که پیش‌تر فیلترهای امنیتی هوش مصنوعی را می‌شکست، اکنون از یک خط‌لوله اختصاصی برای تبدیل مفاهیم بصری به لباس‌های واقعی از برندهای تجاری استفاده می‌کند. این رویکرد برخلاف…

۴ دقیقه خواندن
بلندگوی گوگل هوم مجهز به جمینی سرانجام رسید

«گفتگوهای طبیعی»؛ هدف گوگل از ادغام Gemini در بلندگوهای هوشمند

گوگل بلندگوی هوشمند ۱۰۰ دلاری جدیدی را با جایگزینی دستیار قدیمی با مدل Gemini معرفی کرد. این دستگاه با تمرکز بر گفتگوهای طبیعی و حذف نیاز به تکرار مداوم کلمات فعال‌ساز، تجربه‌ی…

۶ دقیقه خواندن