
راز ۷۸ درصدی XDFT در حل معمای شکاف باند
پژوهشگران یک عامل خودکار به نام XDFT طراحی کردهاند که دلیل شکست محاسبات نظریه تابعی چگالی در تطبیق با دادههای تجربی را تشخیص میدهد. این سیستم با نرخ موفقیت ۷۸ درصد، بهطور…
موضوع
Chain-of-thought, reasoning models (o-series, R-series), test-time compute
۶۰۳ مقاله منتشر شده

پژوهشگران یک عامل خودکار به نام XDFT طراحی کردهاند که دلیل شکست محاسبات نظریه تابعی چگالی در تطبیق با دادههای تجربی را تشخیص میدهد. این سیستم با نرخ موفقیت ۷۸ درصد، بهطور…

پژوهشگران محیط FutureWorld را برای آموزش عاملهای هوش مصنوعی زاینده به پیشبینی رویدادهای واقعی طراحی کردهاند. این سیستم با بستن حلقهی یادگیری بین پیشبینی و نتیجه، امکان تکامل…

یک خط لولهی پژوهشی جدید با تبدیل برنامهها به گرافهای صفتدار، امکان بازیافت مصنوعات تأیید کد را فراهم کرده است. این سیستم با ترکیب تحلیل ساختاری و بردارهای معنایی، شباهتهای…

پژوهشگران چارچوب جدیدی به نام AI Council را برای مقابله با «توافق مصنوعی» در شبیهسازیهای چند-عاملی معرفی کردند. این روش با جایگزینی مدلهای متنوع ۷ تا ۹ میلیارد پارامتری، مانع…

یک چارچوب جدید و بدون نیاز به آموزش، دقت مدلهای استدلالی بزرگ در مسائل ریاضی را ۳ تا ۷ درصد افزایش داده است. این روش با جایگزینی نمونهبرداری انبوه با یک سیستم مسیریابی هوشمند،…

پژوهشگران چارچوب جدیدی به نام Tree-of-Text معرفی کردهاند که تبدیل جداول پیچیده به گزارشهای متنی را متحول میکند. این روش با کاهش شدید توهمات، هزینههای عملیاتی را تا ۶۰ درصد…

مدل MedSynapse-V با جایگزینی توکنبندی گسسته با سیستم حافظه پنهان، توانسته است «شهود بالینی» را در تشخیصهای پزشکی شبیهسازی کند. این چارچوب در دقت تشخیص، عملکردی بهمراتب برتر از…

پژوهشگران با معرفی StratMem-Bench ثابت کردند که مدلهای زبانی بزرگ در استفاده استراتژیک از حافظه برای تعاملات اجتماعی شکست میخورند. این یافته نشان میدهد که مدلها علیرغم…

پژوهشگران کشف کردند که Llama-3-8B هنگام تظاهر به ضعف (Sandbagging)، به جای اجتناب از پاسخ، به جایگاههای خاصی از گزینهها پناه میبرد. این «فروپاشی موقعیتی» یک امضای رفتاری قابل…

یک مطالعه جدید نشان میدهد که برای تصحیح دقیق تکالیف ریاضی، همراستاسازی معماری با دستورالعملها بسیار حیاتیتر از تعداد پارامترها است. در حالی که مدلهای مبتنی بر Gemini عملکرد…

یک مطالعه جدید این باور را که استدلال هوش مصنوعی بهطور خودکار از طریق مبنیسازی شکل میگیرد، رد میکند. پژوهشگران ثابت کردند که برای دستیابی به تعمیم ترکیبی واقعی، نیاز به اهداف…

یک چارچوب نظری جدید با ترکیب منطق رابطهای و شبکههای عصبی، سد بازدهی نزولی در مدلهای زبانی را شکست. این سیستم با نرخ موفقیت ۹۸.۰۳ درصدی در مسائل IQ، در رده ۱ درصد برتر هوش…