موضوع

عامل‌محور

Autonomous agents, tool use, planning, multi-step workflows

۱٬۴۸۷ مقاله منتشر شده

عبور از خروجی‌های یکسان؛ NanoResearch چگونه متدولوژی شخصی پژوهشگر را می‌آموزد؟

NanoResearch یک چارچوب چند-عاملی جدید است که با شخصی‌سازی خط‌لوله پژوهش، خروجی‌های یکسان مدل‌های زبانی را کنار می‌گذارد. این سیستم از طریق تکامل هم‌زمان بانک مهارت و حافظه،…

۲ دقیقه خواندن

تحلیل و بررسی تخصصی۲ ماه پیش

چرا برترین عامل‌های هوش مصنوعی در محیط‌های پیچیده از سد ۶۰ درصد عبور نمی‌کنند؟

بنچمارک جدید ComplexMCP نشان می‌دهد برترین عامل‌های هوش مصنوعی در محیط‌های ابزاری پیچیده تنها ۶۰ درصد موفقیت دارند، در حالی که این رقم برای انسان‌ها ۹۰ درصد است. این مطالعه…

۲ دقیقه خواندن

تحلیل و بررسی تخصصی۲ ماه پیش

سازوکار MATRA: سنجش شعاع تخریب حملات تزریق در عامل‌های هوش مصنوعی

چارچوب جدید MATRA روشی سیستماتیک برای تبدیل آسیب‌پذیری‌های مدل‌های زبانی به ریسک‌های عملیاتی در عامل‌های خودمختار ارائه می‌دهد. این پژوهش نشان می‌دهد که کنترل‌های معماری مانند…

۲ دقیقه خواندن

تحلیل و بررسی تخصصی۲ ماه پیش

گذار از مهندسی پرامپت به مهندسی کنترل؛ راهکار سایبرنتیک برای پایداری عامل‌ها

چارچوب جدیدی به نام Agent Cybernetics پیشنهاد می‌کند که به جای آزمون و خطاهای تجربی، از تئوری کنترل کلاسیک برای طراحی عامل‌های هوش مصنوعی استفاده کند. هدف این رویکرد، تضمین…

۲ دقیقه خواندن

تحلیل و بررسی تخصصی۲ ماه پیش

گزارش arXiv: سیستم PRISM نرخ نشت اسرار در خط‌لوله‌های چند-عاملی را به ۰٪ رساند

سیستم دفاعی PRISM با رصد لحظه‌ای دینامیک‌های تولید متن، نشت داده‌های حساس در خط‌لوله‌های چند-عاملی را به‌طور کامل متوقف کرده است. این ابزار بدون کاهش کیفیت خروجی، نرخ نشت در سطح…

۲ دقیقه خواندن

تحلیل و بررسی تخصصی۲ ماه پیش

چرا گلوگاه عامل‌های هوش مصنوعی در استدلال نیست، بلکه در طراحی APIهاست؟

یک پارادایم جدید در طراحی APIهای معنایی، رابط‌های سنتی CRUD را با پروتکلی شش‌فعل برای عامل‌های هوش مصنوعی جایگزین کرده است. این رویکرد در محیط‌های عملیاتی SaaS، نرخ موفقیت در…

۲ دقیقه خواندن

تحلیل و بررسی تخصصی۲ ماه پیش

رمزگشایی از شکاف دانش و اجرا در عامل‌های هوش مصنوعی با معیارهای سطح-مسیر

یک چارچوب آماری جدید، ارزیابی عامل‌های هوش مصنوعی را از نرخ‌های ساده‌ی موفقیت/شکست به سنجش ثبات در سطح مسیر تغییر می‌دهد. این متد به توسعه‌دهندگان اجازه می‌دهد تفاوت میان دانش مدل…

۲ دقیقه خواندن

تحلیل و بررسی تخصصی۲ ماه پیش

SkillEvolver: ارتقای دقت مهارت‌های عامل‌های هوش مصنوعی به ۵۶.۸٪ در SkillsBench

چارچوب SkillEvolver با معرفی یک «متا-مهارت»، یادگیری عامل‌ها را از تغییر وزن‌های مدل به اصلاح متنی و کد منتقل کرد. این روش در ۱۵ حوزه مختلف، دقتی بالاتر از مهارت‌های طراحی‌شده…

۲ دقیقه خواندن

تحلیل و بررسی تخصصی۲ ماه پیش

از تخصص انسانی به عامل‌های کدنویس: سازوکار ASIA در خودکارسازی شناسایی سیستم‌ها

چارچوب ASIA با بهره‌گیری از مدل‌های زبانی بزرگ، فرآیند انتخاب مدل و تنظیم ابرپارامترها در سیستم‌های دینامیکی را به‌طور کامل خودکار می‌کند. این سیستم با بستن چرخه بین فرضیه و…

۲ دقیقه خواندن

تحلیل و بررسی تخصصی۲ ماه پیش

چرا موفقیت‌های ادعایی عامل‌های هوش مصنوعی در بنچمارک‌ها اغلب کاذب هستند؟

پژوهشگران لایه‌ای برای گزارش شواهد معرفی کرده‌اند تا از ثبت «موفقیت‌های کاذب» در بنچمارک‌های عامل‌های هوش مصنوعی جلوگیری کنند. این چارچوب با الزام به ارائه مستندات قابل…

۲ دقیقه خواندن

تحلیل و بررسی تخصصی۲ ماه پیش

گزارش arxiv: کاهش ۳۲.۰۷ درصدی تصادفات خودروهای خودران با GuardAD

چارچوب GuardAD با تبدیل ایمنی به یک وضعیت منطقی پویا، نرخ تصادفات در مدل‌های زبانی چندوجهی (MLLM) را ۳۲.۰۷٪ کاهش داده است. این سیستم بدون نیاز به بازآموزی مدل، خطرات پنهان را…

۲ دقیقه خواندن

تحلیل و بررسی تخصصی۲ ماه پیش

رمزگشایی از اثر Harness: عاملی که ارزش‌های مدل‌های زبانی را تغییر می‌دهد

پژوهشگران با معرفی Agent-ValueBench نشان دادند که رفتار عامل‌های هوش مصنوعی لزوماً با ارزش‌های مدل زبانی زیرساختی آن‌ها هم‌راستا نیست. این یافته‌ها ثابت می‌کند که ایمنی در…

۲ دقیقه خواندن