موضوع

عامل‌محور

Autonomous agents, tool use, planning, multi-step workflows

۱٬۵۰۴ مقاله منتشر شده

چرا شکست عامل‌های هوش مصنوعی ناشی از «گم‌شدن در متن» نیست؟

تحقیقات جدید نشان می‌دهد عامل‌های هوش مصنوعی اغلب ابزار درست را شناسایی می‌کنند اما در مرحله نهایی تصمیم‌گیری دچار خطا می‌شوند. این یافته، اثربخشی روش‌های رایج مهندسی پرامپت برای…

۲ دقیقه خواندن

تحلیل و بررسی تخصصی۲ هفته پیش

چرا برای بازیابی خطوط تولید دیگر نیازی به بازآموزی مدل‌های RL نیست؟

یک چارچوب جدید به سیاست‌های RMAPPO اجازه می‌دهد در لحظه‌ی اجرا از قوانین خارجی یا راهنمایی‌های مدل‌های زبانی استفاده کنند تا سرعت بازیابی خطوط تولید پس از نقص فنی افزایش یابد. این…

۱ دقیقه خواندن۱

تحلیل و بررسی تخصصی۲ هفته پیش

دقت ۹۰ درصدی AdaSTORM در استدلال گراف‌های هزار-گره‌ای بدون ابزار خارجی

چارچوب AdaSTORM با استفاده از تقسیم‌بندی تطبیقی و معماری چند-عاملی، محدودیت مقیاس‌پذیری در استدلال گراف‌های پویا را شکست. این سیستم بدون نیاز به ابزارهای خارجی، به دقت بیش از ۹۰…

۱ دقیقه خواندن

تحلیل و بررسی تخصصی۲ هفته پیش

لایه‌ی حاکمیتی شش‌بعدی: تفکیک «خرد» از «هوش» در معماری عامل‌های AI

یک چارچوب معماری جدید پیشنهاد می‌دهد که «خرد» را از «هوش» جدا کند تا از بهینه‌سازی کورکورانه اهداف مضر جلوگیری شود. این سیستم از طریق یک لایه حاکمیتی و یک توپل شش‌مؤلفه‌ای، پیش از…

۲ دقیقه خواندن

تحلیل و بررسی تخصصی۲ هفته پیش

نمره ۹.۶۶ از ۱۰: StateGen توهمات فراخوانی ابزار را در ۶۵ هزار گفتگو حذف کرد

پلتفرم StateGen با معرفی یک مدیریت وضعیت متمرکز و ساختار چهار-نقش، توهمات مربوط به نتایج ابزارها در عامل‌های هوش مصنوعی را حذف کرده است. این معماری با تولید داده‌های مصنوعی دقیق،…

۲ دقیقه خواندن

تحلیل و بررسی تخصصی۲ هفته پیش

PAL-Bench: چرا عامل‌های هوش مصنوعی در بازسازی هویت‌های تکرارشونده ناکام

پژوهشگران با معرفی PAL-Bench نشان دادند که مدل‌های هوش مصنوعی علیرغم توانایی در خلاصه‌سازی، در پیوند دادن هویت‌های تکرارشونده در داده‌های بلندمدت ناتوان‌اند. این شکاف، تفاوت…

۲ دقیقه خواندن۱

تحلیل و بررسی تخصصی۲ هفته پیش

گزارش arXiv: بازدهی ۵۹.۳ درصدی LiteOdyssey در تشخیص بیماری‌های فوق‌کمیاب

چارچوب استدلالی سبک‌وزن LiteOdyssey با تکیه بر سیاست‌های همکاری انسان-ماشین، در تشخیص بیماری‌های بسیار نادر از GPT-5.4 پیشی گرفت. این دستاورد نشان می‌دهد که ساختار استدلالی دقیق…

۲ دقیقه خواندن

داستان‌ها و مصاحبه‌ها۲ هفته پیش

چرا ۸۴ درصد از تست‌های پایداری هوش مصنوعی در شناسایی شکست‌ها ناکام می‌مانند؟

پروژه llcore نشان می‌دهد تکیه بر مشاهده رفتار مدل برای تضمین پایداری، یک توهم است و ۸۴ درصد شکست‌های خطرناک را نادیده می‌گیرد. تنها گواهینامه‌های ریاضی می‌توانند پایداری را تضمین…

۴ دقیقه خواندن

زندگی با AI۲ هفته پیش

چرا فاصله میان «بریف» و «سِپک» باعث شکست عامل‌های کدنویس می‌شود؟

عامل‌های کدنویسی هوش مصنوعی سریع‌تر از چرخه‌های بررسی سنتی حرکت می‌کنند و اغلب ویژگی‌هایی می‌سازند که از نظر فنی درست، اما با هدف محصول متفاوت است. راهکار جدید، «توسعه‌ی…

۴ دقیقه خواندن۱

تحلیل و بررسی تخصصی۲ هفته پیش

نقص «نایب سرگردان»: چگونه عامل‌های متا ۲۰ هزار حساب اینستاگرام را لو دادند؟

مهاجمان با بهره‌برداری از آسیب‌پذیری «نایب سرگردان» در ربات پشتیبانی متا، ۲۰ هزار حساب اینستاگرام را بدون نیاز به رمز عبور تصاحب کردند. این اتفاق شکاف امنیتی بحرانی در عامل‌های…

۶ دقیقه خواندن

معرفی فرمت دانش باز گوگل: استاندارد Markdown بی‌طرف برای زمینه‌دهی به عامل‌های هوش مصنوعی

تحلیل و بررسی تخصصی۲ هفته پیش

چگونه استاندارد OKF گوگل، مدیریت متنی عامل‌های هوش مصنوعی را یکسان می‌کند؟

گوگل کلاد استاندارد Open Knowledge Format (OKF) v0.1 را برای تبدیل دانش پراکنده سازمانی به یک گراف متنی قابل انتقال معرفی کرد. این فرمت با تکیه بر Markdown و YAML، امکان مدیریت…

۶ دقیقه خواندن

Z.ai مدل GLM-5.2 را با کانتکست یک میلیون توکن کاربردی، دو سطح تلاش فکری و بدون بنچمارک عرضه کرد

آموزش کاربردی۲ هفته پیش

از ویرایش تکه‌ای به مدیریت کل پروژه؛ سازوکار یک میلیون توکنی GLM-5.2

شرکت Z.ai مدل GLM-5.2 را با پنجره متنی یک میلیون توکنی معرفی کرد تا امکان بارگذاری کامل مخازن کد در حافظه فعال فراهم شود. این مدل با ابزارهایی مثل Claude Code سازگار است و دایره‌ی…

۴ دقیقه خواندن