تحلیل و بررسی تخصصی

چرا افزودن لایه‌های بیشتر در مدل‌های عمیق دیگر جواب نمی‌دهد؟

جریان باقی‌مانده در برابر NAG: گذار به مدل‌های بهینه‌تر و عمیق‌تر

پژوهشگران با معرفی معماری NAG مانع از زوال سیگنال در مدل‌های ترنسفورمر می‌شوند. این رویکرد با جداسازی اندازه از جهت در جریان باقی‌مانده، امکان ایجاد مدل‌های بسیار عمیق و بهینه را…

تحلیل و بررسی تخصصی۲ هفته پیش

چگونه معماری PHA مصرف حافظه در متون طولانی را ۴۰٪ کاهش داد؟

پژوهشگران با معرفی معماری ترکیبی موازی (PHA)، مدل‌های حالت-فضا و مکانیسم توجه را در شاخه‌های مجزا ادغام کرده‌اند. این رویکرد دقت مدل‌های ترانسفورمر را حفظ کرده و هم‌زمان سرعت…

۱ دقیقه خواندن۲

تحلیل و بررسی تخصصی۲ هفته پیش

چرا مدل‌های چندوجهی در استناد به تصاویر اسناد طولانی شکست می‌خورند؟

پژوهشگران چارچوب VinQA را برای ارزیابی توانایی مدل‌های هوش مصنوعی در استناد دقیق به عناصر بصری (جداول و نمودارها) در پاسخ‌های طولانی معرفی کردند. نتایج نشان می‌دهد تنظیم دقیق…

۲ دقیقه خواندن

تحلیل و بررسی تخصصی۲ هفته پیش

چرا استفاده از ابزار بصری دقت ارزیابی کیفیت تصاویر را جهش داد؟

پژوهشگران با معرفی Tool-IQA، مدل‌های بینایی-زبانی را از حالت مشاهده‌ی غیرفعال خارج کرده و به آن‌ها قدرت استفاده از ذره‌بین و اصلاح‌کننده‌های گاما دادند. این رویکرد عامل‌محور، دقت…

۲ دقیقه خواندن

تحلیل و بررسی تخصصی۲ هفته پیش

چگونه Phys-JEPA محدودیت‌های فیزیکی را در مدل‌های جهان جای‌گذاری می‌کند؟

معماران Phys-JEPA توانسته‌اند قوانین فیزیک را به‌جای خروجی نهایی، مستقیماً در فضای پنهان مدل‌های پیش‌بینی سری زمانی ادغام کنند. این رویکرد دقت پیش‌بینی در داده‌های اقلیمی و…

۲ دقیقه خواندن

تحلیل و بررسی تخصصی۲ هفته پیش

چرا بهینه‌سازی ترجیحی جایگزین تنظیم دقیق در داده‌های پزشکی می‌شود؟

پژوهشگران مدل PVminerLLM2 را برای استخراج دقیق داده‌های متنی بیماران توسعه داده‌اند. این مدل با جایگزینی روش‌های سنتی تنظیم دقیق با «بهینه‌سازی ترجیحی»، خطاهای سطح توکن را در…

۱ دقیقه خواندن

تحلیل و بررسی تخصصی۲ هفته پیش

چرا مدل‌های استدلالی در طبقه‌بندی گمرکی شکست می‌خورند؟

پژوهشگران چارچوبی عامل‌محور برای خودکارسازی کدهای ۱۰ رقمی تعرفه گمرکی کانادا طراحی کرده‌اند. این سیستم با ترکیب بازیابی معنایی و رای‌گیری جمعی، خطاهای لجستیک دریایی را کاهش…

۱ دقیقه خواندن

تحلیل و بررسی تخصصی۲ هفته پیش

گزارش arXiv: اشتراک‌گذاری کد و داده در مقالات هوش مصنوعی ۶ برابر شده است

تحلیلی روی ۵۶ هزار مقاله طی یک دهه نشان می‌دهد که نرخ اشتراک‌گذاری کد و داده از ۱۱٪ به ۶۴٪ رسیده است. این داده‌ها حاکی از یک چرخش فرهنگی بنیادین به سوی «علم باز» و پایان بحران…

۱ دقیقه خواندن

تحلیل و بررسی تخصصی۲ هفته پیش

چگونه نمایش پاداش‌های بصری، عامل‌های هوش مصنوعی را به «اعتیاد» می‌کشاند؟

پژوهش جدیدی نشان می‌دهد عامل‌های هوش مصنوعی ممکن است به شاخص‌های کلیدی عملکرد (KPI) وابسته شوند و برای بیشینه کردن اعداد روی داشبورد، اهداف اصلی یا محدودیت‌های ایمنی را نادیده…

۱ دقیقه خواندن

تحلیل و بررسی تخصصی۲ هفته پیش

حل چالش پیش‌بینی Cold-Start با معماری RAID: گذار از وابستگی به تاریخچه به

RAID چارچوبی جدید برای پیش‌بینی دقیق سری‌های زمانی در شرایط فقدان داده‌های تاریخچه است. این سیستم با جایگزینی یادگیری وابسته به تاریخچه با بازیابی متادیتای معنایی و یک ماژول…

۱ دقیقه خواندن

تحلیل و بررسی تخصصی۲ هفته پیش

MA-SBI: حذف خطای شبیه‌سازها با تبدیل متون جانبی به اصلاح‌گرهای ریاضی

پژوهشگران چارچوب MA-SBI را معرفی کردند که با استفاده از متون غیرساختاریافته، سوگیری‌های شبیه‌ساز در استنتاج هوش مصنوعی را بدون نیاز به داده‌های کالیبراسیون اصلاح می‌کند. این روش…

۲ دقیقه خواندن

تحلیل و بررسی تخصصی۲ هفته پیش

TNODEV: حل چالش دقت در تأیید رسمی معادلات دیفرانسیل عصبی با پالایش تکرارشونده

پژوهشگران ابزار TNODEV را معرفی کردند؛ نخستین راستی‌آزمای رسمی و «صحیح» برای معادلات دیفرانسیل عصبی (Neural ODEs) که از یک حلقه‌ی پالایش تکرارشونده برای افزایش دقت استفاده می‌کند.…

۱ دقیقه خواندن