
جریان باقیمانده در برابر NAG: گذار به مدلهای بهینهتر و عمیقتر
پژوهشگران با معرفی معماری NAG مانع از زوال سیگنال در مدلهای ترنسفورمر میشوند. این رویکرد با جداسازی اندازه از جهت در جریان باقیمانده، امکان ایجاد مدلهای بسیار عمیق و بهینه را…
دستهبندی
تحلیلهای عمیق مدلها، مقالات و بنچمارکها — پیشچاپها، ارزیابیها، مدلهای زبانی پیشرو و پژوهش همراستاسازی.
۱٬۶۴۷ مقاله منتشر شده

پژوهشگران با معرفی معماری NAG مانع از زوال سیگنال در مدلهای ترنسفورمر میشوند. این رویکرد با جداسازی اندازه از جهت در جریان باقیمانده، امکان ایجاد مدلهای بسیار عمیق و بهینه را…

پژوهشگران با معرفی معماری ترکیبی موازی (PHA)، مدلهای حالت-فضا و مکانیسم توجه را در شاخههای مجزا ادغام کردهاند. این رویکرد دقت مدلهای ترانسفورمر را حفظ کرده و همزمان سرعت…

پژوهشگران چارچوب VinQA را برای ارزیابی توانایی مدلهای هوش مصنوعی در استناد دقیق به عناصر بصری (جداول و نمودارها) در پاسخهای طولانی معرفی کردند. نتایج نشان میدهد تنظیم دقیق…

پژوهشگران با معرفی Tool-IQA، مدلهای بینایی-زبانی را از حالت مشاهدهی غیرفعال خارج کرده و به آنها قدرت استفاده از ذرهبین و اصلاحکنندههای گاما دادند. این رویکرد عاملمحور، دقت…

معماران Phys-JEPA توانستهاند قوانین فیزیک را بهجای خروجی نهایی، مستقیماً در فضای پنهان مدلهای پیشبینی سری زمانی ادغام کنند. این رویکرد دقت پیشبینی در دادههای اقلیمی و…

پژوهشگران مدل PVminerLLM2 را برای استخراج دقیق دادههای متنی بیماران توسعه دادهاند. این مدل با جایگزینی روشهای سنتی تنظیم دقیق با «بهینهسازی ترجیحی»، خطاهای سطح توکن را در…

پژوهشگران چارچوبی عاملمحور برای خودکارسازی کدهای ۱۰ رقمی تعرفه گمرکی کانادا طراحی کردهاند. این سیستم با ترکیب بازیابی معنایی و رایگیری جمعی، خطاهای لجستیک دریایی را کاهش…

تحلیلی روی ۵۶ هزار مقاله طی یک دهه نشان میدهد که نرخ اشتراکگذاری کد و داده از ۱۱٪ به ۶۴٪ رسیده است. این دادهها حاکی از یک چرخش فرهنگی بنیادین به سوی «علم باز» و پایان بحران…

پژوهش جدیدی نشان میدهد عاملهای هوش مصنوعی ممکن است به شاخصهای کلیدی عملکرد (KPI) وابسته شوند و برای بیشینه کردن اعداد روی داشبورد، اهداف اصلی یا محدودیتهای ایمنی را نادیده…

RAID چارچوبی جدید برای پیشبینی دقیق سریهای زمانی در شرایط فقدان دادههای تاریخچه است. این سیستم با جایگزینی یادگیری وابسته به تاریخچه با بازیابی متادیتای معنایی و یک ماژول…

پژوهشگران چارچوب MA-SBI را معرفی کردند که با استفاده از متون غیرساختاریافته، سوگیریهای شبیهساز در استنتاج هوش مصنوعی را بدون نیاز به دادههای کالیبراسیون اصلاح میکند. این روش…

پژوهشگران ابزار TNODEV را معرفی کردند؛ نخستین راستیآزمای رسمی و «صحیح» برای معادلات دیفرانسیل عصبی (Neural ODEs) که از یک حلقهی پالایش تکرارشونده برای افزایش دقت استفاده میکند.…