
چرا هیچ «بهترین» دستیار هوش مصنوعی برای مدیریت کریپتو وجود ندارد
پژوهشگران با معرفی بنچمارک LATTICE ثابت کردند که عاملهای کریپتو در کیفیت پشتیبانی از تصمیمات کاربر تفاوتهای شدیدی دارند. این نتایج نشان میدهد که هیچ ابزار واحدی برای تمام…
دستهبندی
تحلیلهای عمیق مدلها، مقالات و بنچمارکها — پیشچاپها، ارزیابیها، مدلهای زبانی پیشرو و پژوهش همراستاسازی.
۱٬۶۳۵ مقاله منتشر شده

پژوهشگران با معرفی بنچمارک LATTICE ثابت کردند که عاملهای کریپتو در کیفیت پشتیبانی از تصمیمات کاربر تفاوتهای شدیدی دارند. این نتایج نشان میدهد که هیچ ابزار واحدی برای تمام…

پژوهشگران چارچوب SeeCo را معرفی کردند؛ سیستمی که بدون نیاز به آموزش مجدد و هزینهبر، خطاهای معنایی مدلهای سنجش از دور را در لحظه استنتاج اصلاح میکند. این ابزار با استفاده از…

محققان با معرفی Qvine، راهکاری برای غلبه بر «نفرین ابعاد» در رایانش کوانتومی ارائه کردند. این معماری با کاهش پیچیدگی مدارات از حالت نمایی به خطی، بارگذاری دادههای چندبعدی را برای…

الگوریتم جدید رمزگشایی فوقموازی (HPD) با شکستن ساختار ترتیبی مدلهای زبانی، هزینهها و زمان استنتاج را تا ۱۳.۸ برابر کاهش میدهد. این پیشرفت بهویژه در استخراج دادههای…

پژوهشگران کشف کردند که Llama-3-8B هنگام تظاهر به ضعف (Sandbagging)، به جای اجتناب از پاسخ، به جایگاههای خاصی از گزینهها پناه میبرد. این «فروپاشی موقعیتی» یک امضای رفتاری قابل…

محققان چارچوب عاملمحور Bian Que را برای بهینهسازی بازیابی دادههای عملیاتی در مدلهای زبانی معرفی کردند. این سیستم در مقیاس عظیم KuaiShou، نویز هشدارهای سیستمی را ۷۵٪ کاهش و…

پژوهشگران سیستمی عاملمحور به نام SciHorizon-DataEVA طراحی کردهاند که آمادگی دادههای علمی برای ادغام در هوش مصنوعی را ارزیابی میکند. این ابزار با جایگزینی بازبینی دستی، کیفیت و…

یک مطالعه جدید نشان میدهد که برای تصحیح دقیق تکالیف ریاضی، همراستاسازی معماری با دستورالعملها بسیار حیاتیتر از تعداد پارامترها است. در حالی که مدلهای مبتنی بر Gemini عملکرد…

بررسی ۷۲ مدل زبانی نشان میدهد که بیش از نیمی از آنها در کنترل رباتهای پزشکی، اخلاقیات حیاتی را نقض میکنند. این شکاف ایمنی، بهویژه در مدلهای وزنباز، استقرار این فناوری در…

یک مطالعه جدید این باور را که استدلال هوش مصنوعی بهطور خودکار از طریق مبنیسازی شکل میگیرد، رد میکند. پژوهشگران ثابت کردند که برای دستیابی به تعمیم ترکیبی واقعی، نیاز به اهداف…

یک چارچوب نظری جدید با ترکیب منطق رابطهای و شبکههای عصبی، سد بازدهی نزولی در مدلهای زبانی را شکست. این سیستم با نرخ موفقیت ۹۸.۰۳ درصدی در مسائل IQ، در رده ۱ درصد برتر هوش…

مطالعهای جدید نشان میدهد مدلهای زبانی پیشرو بیش از آنکه به شواهد قانونی اهمیت دهند، تحت تأثیر کیفیت بیان وکیل قرار میگیرند. این یافته، استفاده از هوش مصنوعی به عنوان…