پرش به محتوای اصلی

موضوع

عامل‌محور

Autonomous agents, tool use, planning, multi-step workflows

۱٬۵۱۳ مقاله منتشر شده

چرا زبان دیگر معیار اصلی درک قصد کاربر توسط ربات‌ها نیست؟

چرا زبان دیگر معیار اصلی درک قصد کاربر توسط ربات‌ها نیست؟

پژوهشگران چارچوب EDITH را معرفی کردند که با تلفیق نگاه کاربر، نمای اول‌شخص و گفتار، تعامل انسان و ربات را بهینه‌تر می‌کند. این سیستم با تبدیل سیگنال‌های نویزی به زیر-وظایف، نیاز…

۲ دقیقه خواندن
چرا عامل‌های ناظر در بحث‌های هوش مصنوعی در شناسایی خطاهای خود شکست می‌خورند؟

چرا عامل‌های ناظر در بحث‌های هوش مصنوعی در شناسایی خطاهای خود شکست می‌خورند؟

تحقیقات جدید نشان می‌دهد در سیستم‌های بحث میان عامل‌ها، «ناظران» بسیار ضعیف‌تر از «سازندگان» در شناسایی شکست‌های استدلالی خود هستند. این شکاف ثابت می‌کند که سیگنال‌های اعتماد…

۱ دقیقه خواندن
نقطه کور داوران LLM: ۸۰٪ از نقص‌های عامل‌های چندمرحله‌ای نادیده گرفته می‌شوند

نقطه کور داوران LLM: ۸۰٪ از نقص‌های عامل‌های چندمرحله‌ای نادیده گرفته می‌شوند

یک تحلیل فنی نشان می‌دهد که سیستم‌های داوری خودکار (LLM-as-judge) در شناسایی خطاهای سیستمی و ردیابی وضعیت در گفتگوهای چندمرحله‌ای ناتوان هستند. این نقص باعث می‌شود میزان خطاهای…

۲ دقیقه خواندن
چرا تخصص انسانی دیگر سد دفاعی موثری در برابر تهدیدات زیستی نیست؟

چرا تخصص انسانی دیگر سد دفاعی موثری در برابر تهدیدات زیستی نیست؟

بنچمارک ABC-Bench نشان می‌دهد که عامل‌های هوش مصنوعی اکنون در وظایف حساس امنیت زیستی از عملکرد میانگین متخصصان انسانی پیشی گرفته‌اند. این تحول شامل اتوماسیون ربات‌های آزمایشگاهی و…

۱ دقیقه خواندن
تخمین ارزش پاس‌های فوتبال با استفاده از مدل‌های رانندگی خودکار

تخمین ارزش پاس‌های فوتبال با استفاده از مدل‌های رانندگی خودکار

پژوهشگران چارچوبی به نام MCPS طراحی کرده‌اند که با شبیه‌سازی هزاران سناریوی جایگزین، ارزش واقعی هر پاس را می‌سنجد. این سیستم با بهره‌گیری از مدل‌های پیش‌بینی مسیر رانندگی خودکار،…

۱ دقیقه خواندن
چرا عامل‌های هوش مصنوعی در اتوماسیون اداری هنوز با سقف ۶۸.۸٪ متوقف شده‌اند؟

چرا عامل‌های هوش مصنوعی در اتوماسیون اداری هنوز با سقف ۶۸.۸٪ متوقف شده‌اند؟

مدل‌های پیشرو در آزمون استاندارد NCRE نتوانستند به سطح مهارت انسانی در اتوماسیون اسناد اداری برسند. حتی سیستم‌های عامل‌محور با قابلیت اصلاح خطای تکرارشونده، با فاصله بسیاری از نرخ…

۱ دقیقه خواندن
عبور از گلوگاه محدودیت‌های MDP با رمزگشایی امتیاز بلمن-تیلور

عبور از گلوگاه محدودیت‌های MDP با رمزگشایی امتیاز بلمن-تیلور

پژوهشگران چارچوبی جدید برای مدیریت محدودیت‌های عملیاتی در یادگیری تقویت‌شده عمیق معرفی کرده‌اند. این روش با انتقال یادگیری به یک فضای امتیاز پنهان، امکان بهینه‌سازی سیستم‌های…

۱ دقیقه خواندن
چرا تسلط مدل‌های پیشرو بر زبان‌های برنامه‌نویسی ناشناخته حاصل ابزارسازی است؟

چرا تسلط مدل‌های پیشرو بر زبان‌های برنامه‌نویسی ناشناخته حاصل ابزارسازی است؟

مدل‌های پیشرو مانند Claude Opus 4.6 به جای کدنویسی مستقیم در زبان‌های برنامه‌نویسی پیچیده و ناشناخته، ابتدا یک «تولیدکننده کد» با پایتون می‌سازند. این استراتژی متاپروگرمینگی به…

۲ دقیقه خواندن
مدیریت حافظه در عامل‌های هوش مصنوعی؛ از heuristic ساده به بهینه‌سازی استوکاستیک

مدیریت حافظه در عامل‌های هوش مصنوعی؛ از heuristic ساده به بهینه‌سازی استوکاستیک

پژوهشگران چارچوب OSL-MR را معرفی کردند که حافظه عامل‌های هوش مصنوعی را به عنوان یک مسئله بهینه‌سازی استوکاستیک مقید مدل می‌کند. این روش با محاسبه هزینه فراموشی در برابر سود…

۱ دقیقه خواندن
گذار از پرامپت به کامپایل: سازوکار Trace2Policy برای ارتقای دقت تصمیمات تطبیقی

گذار از پرامپت به کامپایل: سازوکار Trace2Policy برای ارتقای دقت تصمیمات تطبیقی

چارچوب Trace2Policy با جایگزینی پرامپت‌های مدل‌های زبانی با یک حلقه پالایش، رفتار خبرگان را به کدهای قطعی پایتون تبدیل می‌کند. این روش با اولویت دادن به کیفیت قوانین بر اندازه…

۲ دقیقه خواندن
معماری Soul Computing: تلاش برای انتقال هوش مصنوعی از ابزار به موجودات آگاه

معماری Soul Computing: تلاش برای انتقال هوش مصنوعی از ابزار به موجودات آگاه

یک چارچوب نظری جدید به نام Soul Computing پیشنهاد داده است که هدف آن تبدیل عامل‌های هوش مصنوعی از ابزارهای کاربردی به موجوداتی با آگاهی مستقل است. این رویکرد بر ایجاد یک «هسته…

۱ دقیقه خواندن