موضوع

چندوجهی

Models that natively process text+image+audio+video

۴۰۳ مقاله منتشر شده

کارگران در پایتخت سخت‌افزار چین با بدن خود ربات‌های انسان‌نما را هدایت می‌کنند.

استراتژی IO-AI Tech برای آموزش ربات‌های انسان‌نما با کنترل از راه دور

استارت‌آپ چینی IO-AI Tech از اپراتورهای انسانی برای آموزش ربات‌های انسان‌نما استفاده می‌کند تا داده‌های فیزیکی لازم برای رسیدن به خودمختاری کامل را جمع‌آوری کند. این روش، شکاف…

۴ دقیقه خواندن

نمودار معماری سیستم TREX: اجرای کد و تولید مصنوعات برای بازبینی هوشمند کد

آموزش کاربردی۲ هفته پیش

تحلیل استاتیک در برابر اجرای پویا برای شناسایی باگ‌های رابط کاربری

شرکت Greptile لایه‌ی اجرایی TREX را معرفی کرد تا بررسی کدهای AI را از خواندن ساده به اجرای واقعی تغییر دهد. این رویکرد اجازه می‌دهد خطاهای منطقی و پس‌روی‌های رابط کاربری که در…

۷ دقیقه خواندن

لوگوی پروژه CADAM، یک برنامه وب متن‌باز برای تبدیل متن به طراحی CAD در گیت‌هاب.

آموزش کاربردی۲ هفته پیش

تبدیل متن به مدل‌های سه‌بعدی پارامتریک با ابزار متن‌باز CADAM

پلتفرم CADAM با تبدیل توصیفات متنی به کدهای OpenSCAD، امکان ساخت مدل‌های سه‌بعدی قابل ویرایش را فراهم می‌کند. این ابزار برخلاف مدل‌های رایج، خروجی‌هایی مهندسی و دقیق تولید می‌کند…

۶ دقیقه خواندن

آموزش کاربردی۲ هفته پیش

«چشمان جدید برای عامل‌ها»؛ روشی برای تشخیص آیکون‌های غیرمتنی در موبایل

توسعه‌دهنده‌ای به نام Dexter2344 با ادغام قابلیت تطبیق الگو در عامل‌های موبایلی، مشکل «دکمه‌های نامرئی» را حل کرد. این روش به عامل اجازه می‌دهد آیکون‌هایی مثل دکمه ارسال واتس‌اپ…

۳ دقیقه خواندن

پیش‌بینی حرکت سه‌بعدی با راهنمایی زبان: معماری مدل MolmoMotion برای تولید حرکات انسان بر اساس دستورات متنی.

آموزش کاربردی۲ هفته پیش

«پیش‌بینی مسیر از طریق متن»؛ دستاورد جدید مؤسسه AllenAI در فضای سه‌بعدی

مؤسسه AllenAI مدل MolmoMotion را معرفی کرد که می‌تواند حرکت آینده اشیاء در فضای سه‌بعدی را بر اساس دستورات متنی پیش‌بینی کند. این سیستم با ارائه یک مجموعه داده عظیم شامل یک میلیون…

۸ دقیقه خواندن

کنترل تنظیمات تلویزیون TCL با دستور صوتی در برخی مدل‌ها

اخبار کوتاه روزانه۲ هفته پیشگزارش تأییدنشده

گوگل کنترل‌های صوتی Gemini را به تلویزیون‌های TCL آورد

گوگل قابلیت‌های صوتی مبتنی بر Gemini را برای مدل‌های منتخب TCL فعال کرد. کاربران اکنون می‌توانند تنظیمات پیچیده تصویر و صدا را به‌جای گشتن در منوها، با دستورات صوتی ساده تغییر…

۲ دقیقه خواندن۱

۵ قابلیت پنهان اپل اینتلیجنس که شاید نادیده گرفته‌اید

آموزش کاربردی۲ هفته پیشتأییدنشده · منبع منفرد

قابلیت‌های پنهان iOS 27 تجربه کاربری اپل را به اتوماسیون فعال برد

کاربران iOS 27 ابزارهای پیشرفته‌ای مانند Image Wand و Describe Your Change را نادیده می‌گیرند. این قابلیت‌ها فراتر از خلاصه‌سازی ساده، تجربه کاربری را به سمت اتوماسیون فعال…

۶ دقیقه خواندن۱

ابزارهای نقاشی داخلی iOS 27 Messages: راهنمای استفاده

آموزش کاربردی۲ هفته پیشگزارش تأییدنشده

«جایگزینی متن با طرح»، رویکرد جدید اپل در پیام‌رسان iOS 27

اپل در iOS 27 کیبوردهای متنی را با یک بوم دیجیتال جایگزین می‌کند تا کاربران بتوانند یادداشت‌های دست‌نویس و طرح‌های سریع ارسال کنند. این قابلیت در حال حاضر برای توسعه‌دهندگان در…

۳ دقیقه خواندن۱

جمع‌آوری داده برای آموزش ربات‌ها کار سخت و کم‌حاشیه‌ای است. برخی آزمایشگاه‌های هوش مصنوعی قبلاً به ایکس‌دی‌او‌اف برای این کار

اخبار کوتاه روزانه۲ هفته پیش

درون قمار ۷۰ میلیون دلاری XDOF برای رفع گلوگاه داده‌های رباتیک

استارت‌آپ XDOF با جذب ۷۰ میلیون دلار سرمایه، زیرساخت جمع‌آوری داده‌های باکیفیت برای هوش مصنوعی فیزیکی را می‌سازد. این شرکت خدماتی را ارائه می‌دهد که آزمایشگاه‌های بزرگ AI برای…

۴ دقیقه خواندن

ادایسه ۳۱۰ میلیون دلار سری B با ارزش‌گذاری ۱.۴۵ میلیارد دلار برای توسعه مدل‌های جهانی هوش مصنوعی جذب کرد.

اخبار کوتاه روزانه۲ هفته پیش

درون قمار ۳۱۰ میلیون دلاری Odyssey برای آموزش فیزیک به هوش مصنوعی

آزمایشگاه Odyssey با جذب ۳۱۰ میلیون دلار سرمایه در valuation ۱.۴۵ میلیارد دلاری، قصد دارد مدل‌هایی بسازد که به جای پیش‌بینی کلمات، قوانین فیزیکی جهان را بشناسند. این پروژه با تکیه…

۴ دقیقه خواندن

از شکستن فیلترهای هوش مصنوعی تا لباس پوشاندن افراد واقعی: یک خالق بین‌حوزه‌ای قابل توجه

داستان‌ها و مصاحبه‌ها۲ هفته پیش

«لباس‌های قابل خرید»؛ خروجی جدید پژوهشگر امنیت AI در دنیای مد

پژوهشگری که پیش‌تر فیلترهای امنیتی هوش مصنوعی را می‌شکست، اکنون از یک خط‌لوله اختصاصی برای تبدیل مفاهیم بصری به لباس‌های واقعی از برندهای تجاری استفاده می‌کند. این رویکرد برخلاف…

۴ دقیقه خواندن

بلندگوی گوگل هوم مجهز به جمینی سرانجام رسید

اخبار کوتاه روزانه۲ هفته پیش

«گفتگوهای طبیعی»؛ هدف گوگل از ادغام Gemini در بلندگوهای هوشمند

گوگل بلندگوی هوشمند ۱۰۰ دلاری جدیدی را با جایگزینی دستیار قدیمی با مدل Gemini معرفی کرد. این دستگاه با تمرکز بر گفتگوهای طبیعی و حذف نیاز به تکرار مداوم کلمات فعال‌ساز، تجربه‌ی…

۶ دقیقه خواندن