
«گسست معنایی»؛ چالش قدیمی جستوجو که با ریاضیات حل شد
جستوجوی سنتی بر پایه کلمات کلیدی در مواجهه با تفاوتهای زبانی شکست میخورد. پایگاهدادههای برداری با تبدیل دادهها به مختصات ریاضی، امکان بازیابی اطلاعات بر اساس قصد و معنا را…
موضوع
Models that natively process text+image+audio+video
۴۰۳ مقاله منتشر شده

جستوجوی سنتی بر پایه کلمات کلیدی در مواجهه با تفاوتهای زبانی شکست میخورد. پایگاهدادههای برداری با تبدیل دادهها به مختصات ریاضی، امکان بازیابی اطلاعات بر اساس قصد و معنا را…

مدل وزنباز M3 با پنجره متنی یک میلیون توکنی و قابلیتهای چندوجهی معرفی شد. این مدل با استفاده از معماری توجه پراکنده (MSA)، هزینه محاسباتی استنتاج در متون طولانی را بهشدت کاهش…

گوگل با بهروزرسانی دوربینهای هوشمند خود، امکان شناسایی کاربران را حتی زمانی که پشت به دوربین هستند فراهم کرد. این سیستم اکنون از سیگنالهای غیربیومتریک برای کاهش اعلانهای خطا…

پژوهشگران MIT یک مچبند التراسونیک ساختهاند که حرکات عضلات و تاندونها را به دستورات رباتیک تبدیل میکند. این سیستم با کمک هوش مصنوعی، کنترل دقیق دستهای انساننما و اشیاء مجازی…

شرکت Datalab مدل بینایی lift را با ۹ میلیارد پارامتر معرفی کرد که دادههای ساختاریافته را با دقت بالا از PDFها استخراج میکند. این مدل با استفاده از رمزگشایی محدود به طرحواره،…

عکاسان مستقل املاک با جداسازی پردازش HDR از مبلمان هوشمند، زمان ویرایش هر عکس را ۹۰٪ کاهش دادند. این گردش کار جدید اجازه میدهد بدون افت کیفیت، ظرفیت پذیرش پروژههای هفتگی بهطور…

شرکت Midjourney با معرفی یک اسکنر سونوگرافی پیشرفته قصد رقابت با MRI را دارد. با این حال، متخصصان پزشکی به دلیل نبود شواهد علمی و محدودیتهای فیزیکی سونوگرافی، نسبت به ادعاهای این…

تلاش یک توسعهدهنده برای ساخت ابزار تولید کارت بازی با Google AI Studio، نقاط ضعف جدی Gemini Flash را برملا کرد. این تجربه نشان میدهد تکیه بر حدسهای مدل بدون دانش معماری، منجر…

میسترال مدل OCR 4 را معرفی کرد؛ موتور استخراج متنی که در ارزیابیهای انسانی بر رقبای پیشرو غلبه کرده است. این مدل با تمرکز بر خروجیهای ساختارمند و قابلیت میزبانی شخصی، حریم خصوصی…

متا با کاهش ۱۰۰ دلاری قیمت و عرضه مدلهای مستقل، استراتژی سختافزاری خود را برای دسترسی گستردهتر تغییر داد. این مجموعه شامل مدلهای جدید و نسخهای ویژه با طراحی کایلی جنر است که…

استارتاپ سوئدی Fika Jobs برای تبدیل رزومههای متنی به پروفایلهای ویدئویی تعاملی، ۴ میلیون دلار سرمایه جذب کرد. این پلتفرم با استفاده از مدلهای Gemini، مصاحبههای اولیه را…

بایتدنس از طریق بازوی ابری خود، مدل Seedance 2.5 را معرفی کرد که قادر به تولید کلیپهای ۳۰ ثانیهای منسجم است. این بهروزرسانی در کنار مدل زبانی جدیدی عرضه شده که ۸۰٪ ارزانتر از…