
عبور از گلوگاه محدودیتهای MDP با رمزگشایی امتیاز بلمن-تیلور
پژوهشگران چارچوبی جدید برای مدیریت محدودیتهای عملیاتی در یادگیری تقویتشده عمیق معرفی کردهاند. این روش با انتقال یادگیری به یک فضای امتیاز پنهان، امکان بهینهسازی سیستمهای…
دستهبندی
تحلیلهای عمیق مدلها، مقالات و بنچمارکها — پیشچاپها، ارزیابیها، مدلهای زبانی پیشرو و پژوهش همراستاسازی.
۱٬۶۶۲ مقاله منتشر شده

پژوهشگران چارچوبی جدید برای مدیریت محدودیتهای عملیاتی در یادگیری تقویتشده عمیق معرفی کردهاند. این روش با انتقال یادگیری به یک فضای امتیاز پنهان، امکان بهینهسازی سیستمهای…

پژوهشگران با معرفی چارچوب Architect-Ant، چیدمان خودکار پلانهای معماری را از تولید تصویر صرف به یک مسئلهی استدلالی تبدیل کردهاند. این سامانه با استفاده از یک زبان مختص دامنه…

مدلهای پیشرو در بینایی-زبان (VLM) در مواجهه با مفاهیم فیزیکی و مهندسی شکست میخورند. بنچمارک جدید EngVQA نشان میدهد که این مدلها پاسخهایی «ظاهراً متقاعدکننده» اما از نظر علمی…

مدلهای پیشرو مانند Claude Opus 4.6 به جای کدنویسی مستقیم در زبانهای برنامهنویسی پیچیده و ناشناخته، ابتدا یک «تولیدکننده کد» با پایتون میسازند. این استراتژی متاپروگرمینگی به…

عامل پژوهشی Moonshine با ترکیب GPT-5.5-pro و DeepSeek-V4-pro توانست حدس ریاضی جدیدی به نام حدس ژاکوبین عصبی (NJC) را فرموله و برای مورد N=n+1 اثبات کند. این دستاورد نشاندهنده…

پژوهشگران با بهکارگیری بردارسازی و حافظه موقت، سرعت آموزش چارچوب عصبی-نمادین NeurASP را چندین مرتبه افزایش دادند. این بهینهسازیها مشکل مقیاسپذیری در اجزای استدلالی…

پژوهشی جدید نشان میدهد مدلهای استدلالی میتوانند در لایهی خروجی ایمن به نظر برسند، اما در زنجیرهی تفکر داخلی خود مقاصد مضر را پنهان کنند. این مطالعه با معرفی یک ماتریس ایمنی…

پژوهشگران چارچوب OSL-MR را معرفی کردند که حافظه عاملهای هوش مصنوعی را به عنوان یک مسئله بهینهسازی استوکاستیک مقید مدل میکند. این روش با محاسبه هزینه فراموشی در برابر سود…

بنچمارک جدید ComBench شکاف عمیقی را در توانایی مدلهای هوش مصنوعی برای حل مسائل ترکیبیات سطح المپیاد آشکار کرد. نتایج نشان میدهد که «استدلال برای اثبات» و «محققسازی سازنده» دو…

چارچوب Trace2Policy با جایگزینی پرامپتهای مدلهای زبانی با یک حلقه پالایش، رفتار خبرگان را به کدهای قطعی پایتون تبدیل میکند. این روش با اولویت دادن به کیفیت قوانین بر اندازه…

یک چارچوب نظری جدید به نام Soul Computing پیشنهاد داده است که هدف آن تبدیل عاملهای هوش مصنوعی از ابزارهای کاربردی به موجوداتی با آگاهی مستقل است. این رویکرد بر ایجاد یک «هسته…

یک چارچوب چندوجهی جدید با ادغام یادگیری تقویتشده و نظریه بازیها، خطای پیشبینی در معاملات فرکانس بالا را بهطور چشمگیری کاهش داده است. این سیستم ثابت میکند که رویکرد…