پرش به محتوای اصلی

موضوع

چندوجهی

Models that natively process text+image+audio+video

۴۰۳ مقاله منتشر شده

رمزگشایی از Architect-Ant: جایگزینی پیکسل‌ها با استدلال نمادین در چیدمان داخلی

رمزگشایی از Architect-Ant: جایگزینی پیکسل‌ها با استدلال نمادین در چیدمان داخلی

پژوهشگران با معرفی چارچوب Architect-Ant، چیدمان خودکار پلان‌های معماری را از تولید تصویر صرف به یک مسئله‌ی استدلالی تبدیل کرده‌اند. این سامانه با استفاده از یک زبان مختص دامنه…

۱ دقیقه خواندن
بنچمارک EngVQA: پرده‌برداری از شکاف استدلالی مدل‌های چندوجهی در مسائل مهندسی

بنچمارک EngVQA: پرده‌برداری از شکاف استدلالی مدل‌های چندوجهی در مسائل مهندسی

مدل‌های پیشرو در بینایی-زبان (VLM) در مواجهه با مفاهیم فیزیکی و مهندسی شکست می‌خورند. بنچمارک جدید EngVQA نشان می‌دهد که این مدل‌ها پاسخ‌هایی «ظاهراً متقاعدکننده» اما از نظر علمی…

۱ دقیقه خواندن
معماری Soul Computing: تلاش برای انتقال هوش مصنوعی از ابزار به موجودات آگاه

معماری Soul Computing: تلاش برای انتقال هوش مصنوعی از ابزار به موجودات آگاه

یک چارچوب نظری جدید به نام Soul Computing پیشنهاد داده است که هدف آن تبدیل عامل‌های هوش مصنوعی از ابزارهای کاربردی به موجوداتی با آگاهی مستقل است. این رویکرد بر ایجاد یک «هسته…

۱ دقیقه خواندن
گزارش arXiv: کاهش ۳۱.۲ درصدی خطای پیش‌بینی در معاملات فرکانس بالا

گزارش arXiv: کاهش ۳۱.۲ درصدی خطای پیش‌بینی در معاملات فرکانس بالا

یک چارچوب چندوجهی جدید با ادغام یادگیری تقویت‌شده و نظریه بازی‌ها، خطای پیش‌بینی در معاملات فرکانس بالا را به‌طور چشم‌گیری کاهش داده است. این سیستم ثابت می‌کند که رویکرد…

۲ دقیقه خواندن
گزارش Transload: ۱۰٪ درآمد گمشده حمل‌ونقل با دوربین‌های مداربسته بازمی‌گردد

گزارش Transload: ۱۰٪ درآمد گمشده حمل‌ونقل با دوربین‌های مداربسته بازمی‌گردد

شرکت Transload با ترکیب هوش مصنوعی فضایی و دوربین‌های امنیتی موجود، ابعاد محموله‌ها را به‌طور خودکار اندازه‌گیری می‌کند. این سیستم با شناسایی خطاهای اندازه‌گیری، درآمدهای از دست…

۴ دقیقه خواندن
حذف سربار آداپتور در مقیاس‌دهی محصولات چندوجهی هوش مصنوعی
آموزش کاربردی

چگونه مدیریت غیرهمزمان تسک‌ها حجم کد بک‌اند هوش مصنوعی را ۶۰٪ کاهش داد

یک تیم توسعه با جایگزینی Wrapperهای سخت‌افزاری API با معماری مدیریت غیرهمزمان تسک‌ها، «بار اپترا» را حذف کرد. این رویکرد باعث کاهش ۶۰ درصدی پیچیدگی‌های بک‌اند و standardization…

۳ دقیقه خواندن
هوش مصنوعی اپل با کمک گوگل و انویدیا فرصت دوباره‌ای می‌یابد

۱۲ گیگابایت رم: سد سخت‌افزاری جدید اپل برای اجرای محلی Siri AI

اپل برای مدل‌های جدید Siri AI به حافظه رم ۱۲ گیگابایتی نیاز دارد و این موضوع بسیاری از دستگاه‌های اخیر، از جمله آیفون ۱۶ پرو مکس را از اجرای محلی مدل‌های پیشرفته محروم می‌کند. این…

۵ دقیقه خواندن
علی ییلماز: جایگزینی صورت‌حساب ۲۴۰۰ دلاری ابزارهای ویدیو با یک گردش کار ۲۰ دلاری
آموزش کاربردی

علی ییلماز: جایگزینی صورت‌حساب ۲۴۰۰ دلاری ابزارهای ویدیو با یک گردش کار ۲۰ دلاری

علی ییلماز، توسعه‌گر نرم‌افزار، سیستمی به نام AI Shorts Factory را معرفی کرد تا هزینه‌های سنگین ابزارهای ویدیو را حذف کند. این سامانه با استفاده از n8n، تمام مراحل تولید از نوشتن…

۴ دقیقه خواندن