
چرا شکست عاملهای هوش مصنوعی ناشی از «گمشدن در متن» نیست؟
تحقیقات جدید نشان میدهد عاملهای هوش مصنوعی اغلب ابزار درست را شناسایی میکنند اما در مرحله نهایی تصمیمگیری دچار خطا میشوند. این یافته، اثربخشی روشهای رایج مهندسی پرامپت برای…
موضوع
Autonomous agents, tool use, planning, multi-step workflows
۱٬۵۰۴ مقاله منتشر شده

تحقیقات جدید نشان میدهد عاملهای هوش مصنوعی اغلب ابزار درست را شناسایی میکنند اما در مرحله نهایی تصمیمگیری دچار خطا میشوند. این یافته، اثربخشی روشهای رایج مهندسی پرامپت برای…

یک چارچوب جدید به سیاستهای RMAPPO اجازه میدهد در لحظهی اجرا از قوانین خارجی یا راهنماییهای مدلهای زبانی استفاده کنند تا سرعت بازیابی خطوط تولید پس از نقص فنی افزایش یابد. این…

چارچوب AdaSTORM با استفاده از تقسیمبندی تطبیقی و معماری چند-عاملی، محدودیت مقیاسپذیری در استدلال گرافهای پویا را شکست. این سیستم بدون نیاز به ابزارهای خارجی، به دقت بیش از ۹۰…

یک چارچوب معماری جدید پیشنهاد میدهد که «خرد» را از «هوش» جدا کند تا از بهینهسازی کورکورانه اهداف مضر جلوگیری شود. این سیستم از طریق یک لایه حاکمیتی و یک توپل ششمؤلفهای، پیش از…

پلتفرم StateGen با معرفی یک مدیریت وضعیت متمرکز و ساختار چهار-نقش، توهمات مربوط به نتایج ابزارها در عاملهای هوش مصنوعی را حذف کرده است. این معماری با تولید دادههای مصنوعی دقیق،…

پژوهشگران با معرفی PAL-Bench نشان دادند که مدلهای هوش مصنوعی علیرغم توانایی در خلاصهسازی، در پیوند دادن هویتهای تکرارشونده در دادههای بلندمدت ناتواناند. این شکاف، تفاوت…

چارچوب استدلالی سبکوزن LiteOdyssey با تکیه بر سیاستهای همکاری انسان-ماشین، در تشخیص بیماریهای بسیار نادر از GPT-5.4 پیشی گرفت. این دستاورد نشان میدهد که ساختار استدلالی دقیق…

پروژه llcore نشان میدهد تکیه بر مشاهده رفتار مدل برای تضمین پایداری، یک توهم است و ۸۴ درصد شکستهای خطرناک را نادیده میگیرد. تنها گواهینامههای ریاضی میتوانند پایداری را تضمین…

عاملهای کدنویسی هوش مصنوعی سریعتر از چرخههای بررسی سنتی حرکت میکنند و اغلب ویژگیهایی میسازند که از نظر فنی درست، اما با هدف محصول متفاوت است. راهکار جدید، «توسعهی…

مهاجمان با بهرهبرداری از آسیبپذیری «نایب سرگردان» در ربات پشتیبانی متا، ۲۰ هزار حساب اینستاگرام را بدون نیاز به رمز عبور تصاحب کردند. این اتفاق شکاف امنیتی بحرانی در عاملهای…

گوگل کلاد استاندارد Open Knowledge Format (OKF) v0.1 را برای تبدیل دانش پراکنده سازمانی به یک گراف متنی قابل انتقال معرفی کرد. این فرمت با تکیه بر Markdown و YAML، امکان مدیریت…

شرکت Z.ai مدل GLM-5.2 را با پنجره متنی یک میلیون توکنی معرفی کرد تا امکان بارگذاری کامل مخازن کد در حافظه فعال فراهم شود. این مدل با ابزارهایی مثل Claude Code سازگار است و دایرهی…