
درون نقشه راه ۲۰۲۷ اپل: ایرپادهایی که دنیا را میبینند
اپل در حال توسعه ایرپادهای دوربیندار است تا به سیری بینش بصری لحظهای ببخشد. این سختافزار بهعنوان پلی برای ورود به بازار عینکهای هوشمند و در کنار آن، نسل دوم آیفون تاشو طراحی…
موضوع
Models that natively process text+image+audio+video
۴۰۳ مقاله منتشر شده

اپل در حال توسعه ایرپادهای دوربیندار است تا به سیری بینش بصری لحظهای ببخشد. این سختافزار بهعنوان پلی برای ورود به بازار عینکهای هوشمند و در کنار آن، نسل دوم آیفون تاشو طراحی…

کوالکام با معرفی پردازنده Snapdragon Reality Elite، قدرت پردازش هوش مصنوعی در عینکهای AR را ۱۶۰٪ افزایش داد. این تراشه که در عینکهای Aura به کار میرود، هدفش حذف قطعات اضافی و…

گوگل با انتشار اندروید ۱۷ و Wear OS 7، مدلهای هوش مصنوعی Gemini Omni و Lyria 3 را مستقیماً در سیستمعامل ادغام کرد. این بهروزرسانی با تمرکز بر تولید محتوای چندوجهی در دستگاه،…

شرکت Xreal عینک Aura را به عنوان نخستین سختافزار مجهز به پلتفرم Android XR گوگل معرفی کرد. با وجود باز شدن درهای رزرو پولی، قیمت نهایی محصول هنوز نامعلوم است.

شرکت Insta360 با معرفی دوربین Luna Ultra، بازار دوربینهای گیمبالدار را تکان داد. این محصول با ارائه زوم اپتیکال ۳ بر own و کیفیت ۸K، مستقیماً رقیب مدلهای جیدیآی است.

پژوهشگران چارچوبی بدون نیاز به آموزش (training-free) طراحی کردهاند که با ترکیب هوش مصنوعی قابلتوضیح (XAI) و مدلهای چندوجهی، دقت تشخیص جعل عمیق صوتی را ۴۵٪ افزایش میدهد. این…

پژوهشگران چارچوب VinQA را برای ارزیابی توانایی مدلهای هوش مصنوعی در استناد دقیق به عناصر بصری (جداول و نمودارها) در پاسخهای طولانی معرفی کردند. نتایج نشان میدهد تنظیم دقیق…

پژوهشگران با معرفی Tool-IQA، مدلهای بینایی-زبانی را از حالت مشاهدهی غیرفعال خارج کرده و به آنها قدرت استفاده از ذرهبین و اصلاحکنندههای گاما دادند. این رویکرد عاملمحور، دقت…

پژوهشگران با معرفی PAL-Bench نشان دادند که مدلهای هوش مصنوعی علیرغم توانایی در خلاصهسازی، در پیوند دادن هویتهای تکرارشونده در دادههای بلندمدت ناتواناند. این شکاف، تفاوت…

پژوهشگران چارچوب OQ-TSAE را معرفی کردهاند تا نمایشهای هوش مصنوعی را راستیآزمایی کنند تا تنها تمایزات موردپشتی سختافزاری را حفظ کنند. این سیستم با استفاده از «خارجقسمتهای…

پژوهشگران چارچوب TimeVista را معرفی کردهاند که با بهرهگیری از مدلهای بینایی-زبانی (VLMs)، پیشبینیهای سریهای زمانی را از طریق تحلیل نمودارها ارزیابی میکند. این رویکرد در…

محققان با معرفی روش «تفکر مبنیساز»، مدلهای کوچک را قادر ساختند تا گامهای استدلالی خود را به نقاط دقیق تصویر متصل کنند. این رویکرد باعث شد مدل Gemma3-4B-IT در استدلالهای مکانی،…