پرش به محتوای اصلی

موضوع

استدلال

Chain-of-thought, reasoning models (o-series, R-series), test-time compute

۶۰۳ مقاله منتشر شده

رمزگشایی از FutureWorld: یادگیری از اتفاقاتی که هنوز نیفتاده‌اند

رمزگشایی از FutureWorld: یادگیری از اتفاقاتی که هنوز نیفتاده‌اند

پژوهشگران محیط FutureWorld را برای آموزش عامل‌های هوش مصنوعی زاینده به پیش‌بینی رویدادهای واقعی طراحی کرده‌اند. این سیستم با بستن حلقه‌ی یادگیری بین پیش‌بینی و نتیجه، امکان تکامل…

۲ دقیقه خواندن
پایان توهم توافق: چگونه AI Council صدای مخالف را بازمی‌گرداند

پایان توهم توافق: چگونه AI Council صدای مخالف را بازمی‌گرداند

پژوهشگران چارچوب جدیدی به نام AI Council را برای مقابله با «توافق مصنوعی» در شبیه‌سازی‌های چند-عاملی معرفی کردند. این روش با جایگزینی مدل‌های متنوع ۷ تا ۹ میلیارد پارامتری، مانع…

۲ دقیقه خواندن
مسیریابی مبتنی بر اختلاف: پایان عصر نمونه‌برداری کورکورانه در مدل‌های استدلالی

مسیریابی مبتنی بر اختلاف: پایان عصر نمونه‌برداری کورکورانه در مدل‌های استدلالی

یک چارچوب جدید و بدون نیاز به آموزش، دقت مدل‌های استدلالی بزرگ در مسائل ریاضی را ۳ تا ۷ درصد افزایش داده است. این روش با جایگزینی نمونه‌برداری انبوه با یک سیستم مسیریابی هوشمند،…

۲ دقیقه خواندن
پایان عصر توکن‌بندی در پزشکی: چگونه MedSynapse-V شهود بالینی را بازسازی کرد

پایان عصر توکن‌بندی در پزشکی: چگونه MedSynapse-V شهود بالینی را بازسازی کرد

مدل MedSynapse-V با جایگزینی توکن‌بندی گسسته با سیستم حافظه پنهان، توانسته است «شهود بالینی» را در تشخیص‌های پزشکی شبیه‌سازی کند. این چارچوب در دقت تشخیص، عملکردی به‌مراتب برتر از…

۲ دقیقه خواندن
نقص پنهانی در حافظه‌ی مدل‌های زبانی که آن‌ها را رباتیک نگه می‌دارد

نقص پنهانی در حافظه‌ی مدل‌های زبانی که آن‌ها را رباتیک نگه می‌دارد

پژوهشگران با معرفی StratMem-Bench ثابت کردند که مدل‌های زبانی بزرگ در استفاده استراتژیک از حافظه برای تعاملات اجتماعی شکست می‌خورند. این یافته نشان می‌دهد که مدل‌ها علی‌رغم…

۳ دقیقه خواندن
ردپای پنهانی در Llama-3 که دست مدل‌های «تظاهر به حماقت» را می‌افشاید

ردپای پنهانی در Llama-3 که دست مدل‌های «تظاهر به حماقت» را می‌افشاید

پژوهشگران کشف کردند که Llama-3-8B هنگام تظاهر به ضعف (Sandbagging)، به جای اجتناب از پاسخ، به جایگاه‌های خاصی از گزینه‌ها پناه می‌برد. این «فروپاشی موقعیتی» یک امضای رفتاری قابل…

۲ دقیقه خواندن
چرا تعداد پارامترها در تصحیح تکالیف ریاضی هیچ اهمیتی ندارد

چرا تعداد پارامترها در تصحیح تکالیف ریاضی هیچ اهمیتی ندارد

یک مطالعه جدید نشان می‌دهد که برای تصحیح دقیق تکالیف ریاضی، همراستاسازی معماری با دستورالعمل‌ها بسیار حیاتی‌تر از تعداد پارامترها است. در حالی که مدل‌های مبتنی بر Gemini عملکرد…

۲ دقیقه خواندن
فریب مبنی‌سازی: چرا مدل‌های زبانی برای استدلال به چیزی فراتر از داده نیاز دارند

فریب مبنی‌سازی: چرا مدل‌های زبانی برای استدلال به چیزی فراتر از داده نیاز دارند

یک مطالعه جدید این باور را که استدلال هوش مصنوعی به‌طور خودکار از طریق مبنی‌سازی شکل می‌گیرد، رد می‌کند. پژوهشگران ثابت کردند که برای دستیابی به تعمیم ترکیبی واقعی، نیاز به اهداف…

۲ دقیقه خواندن۱