
چرا زبان دیگر معیار اصلی درک قصد کاربر توسط رباتها نیست؟
پژوهشگران چارچوب EDITH را معرفی کردند که با تلفیق نگاه کاربر، نمای اولشخص و گفتار، تعامل انسان و ربات را بهینهتر میکند. این سیستم با تبدیل سیگنالهای نویزی به زیر-وظایف، نیاز…
موضوع
Autonomous agents, tool use, planning, multi-step workflows
۱٬۵۱۳ مقاله منتشر شده

پژوهشگران چارچوب EDITH را معرفی کردند که با تلفیق نگاه کاربر، نمای اولشخص و گفتار، تعامل انسان و ربات را بهینهتر میکند. این سیستم با تبدیل سیگنالهای نویزی به زیر-وظایف، نیاز…

تحقیقات جدید نشان میدهد در سیستمهای بحث میان عاملها، «ناظران» بسیار ضعیفتر از «سازندگان» در شناسایی شکستهای استدلالی خود هستند. این شکاف ثابت میکند که سیگنالهای اعتماد…

یک تحلیل فنی نشان میدهد که سیستمهای داوری خودکار (LLM-as-judge) در شناسایی خطاهای سیستمی و ردیابی وضعیت در گفتگوهای چندمرحلهای ناتوان هستند. این نقص باعث میشود میزان خطاهای…

بنچمارک ABC-Bench نشان میدهد که عاملهای هوش مصنوعی اکنون در وظایف حساس امنیت زیستی از عملکرد میانگین متخصصان انسانی پیشی گرفتهاند. این تحول شامل اتوماسیون رباتهای آزمایشگاهی و…

پژوهشگران چارچوبی به نام MCPS طراحی کردهاند که با شبیهسازی هزاران سناریوی جایگزین، ارزش واقعی هر پاس را میسنجد. این سیستم با بهرهگیری از مدلهای پیشبینی مسیر رانندگی خودکار،…

مدلهای پیشرو در آزمون استاندارد NCRE نتوانستند به سطح مهارت انسانی در اتوماسیون اسناد اداری برسند. حتی سیستمهای عاملمحور با قابلیت اصلاح خطای تکرارشونده، با فاصله بسیاری از نرخ…

پژوهشگران چارچوبی جدید برای مدیریت محدودیتهای عملیاتی در یادگیری تقویتشده عمیق معرفی کردهاند. این روش با انتقال یادگیری به یک فضای امتیاز پنهان، امکان بهینهسازی سیستمهای…

مدلهای پیشرو مانند Claude Opus 4.6 به جای کدنویسی مستقیم در زبانهای برنامهنویسی پیچیده و ناشناخته، ابتدا یک «تولیدکننده کد» با پایتون میسازند. این استراتژی متاپروگرمینگی به…

عامل پژوهشی Moonshine با ترکیب GPT-5.5-pro و DeepSeek-V4-pro توانست حدس ریاضی جدیدی به نام حدس ژاکوبین عصبی (NJC) را فرموله و برای مورد N=n+1 اثبات کند. این دستاورد نشاندهنده…

پژوهشگران چارچوب OSL-MR را معرفی کردند که حافظه عاملهای هوش مصنوعی را به عنوان یک مسئله بهینهسازی استوکاستیک مقید مدل میکند. این روش با محاسبه هزینه فراموشی در برابر سود…

چارچوب Trace2Policy با جایگزینی پرامپتهای مدلهای زبانی با یک حلقه پالایش، رفتار خبرگان را به کدهای قطعی پایتون تبدیل میکند. این روش با اولویت دادن به کیفیت قوانین بر اندازه…

یک چارچوب نظری جدید به نام Soul Computing پیشنهاد داده است که هدف آن تبدیل عاملهای هوش مصنوعی از ابزارهای کاربردی به موجوداتی با آگاهی مستقل است. این رویکرد بر ایجاد یک «هسته…