
رمزگشایی از Spatial-Omni: تزریق درک سهبعدی صدا به مدلهای زبانی
معرفی روش Spatial-Omni برای ادغام صدای فضایی در مدلهای زبانی چندوجهی. این سیستم با استفاده از کدگذاری FOA، بدون نیاز به تغییر در رمزگذارهای صوتی اولیه، دقت مکانیابی صدا و…
دستهبندی
تحلیلهای عمیق مدلها، مقالات و بنچمارکها — پیشچاپها، ارزیابیها، مدلهای زبانی پیشرو و پژوهش همراستاسازی.
۱٬۶۵۶ مقاله منتشر شده

معرفی روش Spatial-Omni برای ادغام صدای فضایی در مدلهای زبانی چندوجهی. این سیستم با استفاده از کدگذاری FOA، بدون نیاز به تغییر در رمزگذارهای صوتی اولیه، دقت مکانیابی صدا و…

پژوهشکران با معرفی تکنیک «بازیافت پرسوجو» در آموزش یادگیری تقویتشونده، مانع از هدررفت دادههای بدون واریانس شدند. این روش به یک مدل ۱.۷ میلیارد پارامتری اجازه داد تا در پاسخ به…
یک چارچوب جدید یادگیری تقویت عمیق با جایگزینی گامهای زمانی ثابت با رویدادهای گسسته، مشکل بازخورد تأخیری در تولید تراشهها را حل کرده است. این رویکرد منجر به افزایش محسوس بهرهوری…

چارچوب جدید ++nnU-Net با استفاده از فرآیند دو مرحلهای «ثبت تصویر» برای تولید دادههای مصنوعی آناتومیک، دقت مدلهای قطعهبندی را ارتقا داده است. این سیستم در پنج مجموعه داده…

یک بررسی فنی جدید استدلال میکند که بهرهوری در مدلهای زبانی بزرگ نتیجهی ترکیب بهینه داده، حافظه و محاسبات است، نه ترفندهای مجزا. این پژوهش نشان میدهد حافظه GPU، و نه قدرت…

توکنایزر جدیدی به نام UniDexTok وضعیت دستهای انسان و رباتهای مختلف را به یک رابط مشترک با ۲۲ درجه آزادی منتقل میکند. این فناوری نیاز به بازنگری دستی (retargeting) را حذف کرده و…

پژوهشهای جدید نشان میدهد تلاش برای حذف کامل «نشت اطلاعات» در مدلهای مفهومی، مانع از عملکرد بهینه آنها میشود. با پذیرش نشت اطلاعات خوشخیم، مدلها میتوانند دقت خود را حفظ…

چارچوبی جدید به نام **ReLiF** مشکل «تداخل آستانه» را در یادگیری چندوظیفهای حل میکند. این سیستم با جداسازی حسابرسی از تنظیمات آموزشی، اجازه میدهد عدالت فردی در مدلها بر اساس یک…

یک متدولوژی فنی جدید نشان میدهد که استانداردهای فعلی گزارشدهی کربنی در شرکتها، میزان انتشار گازهای گلخانهای در مرحله استنتاج هوش مصنوعی را بهشدت بیشتخمین میزنند. این چارچوب…

یک چارچوب پژوهشی جدید با ترکیب رمزنگاری پساکوانتومی و یادگیری فدرال، دسترسی به خدمات بانکی را برای وامگیرندگان بدون سابقه اعتباری تسهیل میکند. این سیستم با استفاده از رمزنگاری…

بنچمارک جدیدی به نام ImageTime توانایی مدلهای تولید تصویر را در حفظ سازگاری بصری و علّی در توالیهای زمانی چهار مرحلهای میسنجد. این ارزیابی با استفاده از GPT-5.5 بهعنوان داور،…

چارچوب جدید Bootstrapped Flow Q-Learning (BFQ) امکان تولید تکگامی کنشها را در یادگیری تقویتشده آفلاین فراهم میکند. این روش نیاز به فرآیندهای هزینهبر حذف نویز و شبکههای کمکی…