پرش به محتوای اصلی

موضوع

عامل‌محور

Autonomous agents, tool use, planning, multi-step workflows

۱٬۴۸۷ مقاله منتشر شده

عبور از خروجی‌های یکسان؛ NanoResearch چگونه متدولوژی شخصی پژوهشگر را می‌آموزد؟

عبور از خروجی‌های یکسان؛ NanoResearch چگونه متدولوژی شخصی پژوهشگر را می‌آموزد؟

NanoResearch یک چارچوب چند-عاملی جدید است که با شخصی‌سازی خط‌لوله پژوهش، خروجی‌های یکسان مدل‌های زبانی را کنار می‌گذارد. این سیستم از طریق تکامل هم‌زمان بانک مهارت و حافظه،…

۲ دقیقه خواندن
چرا برترین عامل‌های هوش مصنوعی در محیط‌های پیچیده از سد ۶۰ درصد عبور نمی‌کنند؟

چرا برترین عامل‌های هوش مصنوعی در محیط‌های پیچیده از سد ۶۰ درصد عبور نمی‌کنند؟

بنچمارک جدید ComplexMCP نشان می‌دهد برترین عامل‌های هوش مصنوعی در محیط‌های ابزاری پیچیده تنها ۶۰ درصد موفقیت دارند، در حالی که این رقم برای انسان‌ها ۹۰ درصد است. این مطالعه…

۲ دقیقه خواندن
سازوکار MATRA: سنجش شعاع تخریب حملات تزریق در عامل‌های هوش مصنوعی

سازوکار MATRA: سنجش شعاع تخریب حملات تزریق در عامل‌های هوش مصنوعی

چارچوب جدید MATRA روشی سیستماتیک برای تبدیل آسیب‌پذیری‌های مدل‌های زبانی به ریسک‌های عملیاتی در عامل‌های خودمختار ارائه می‌دهد. این پژوهش نشان می‌دهد که کنترل‌های معماری مانند…

۲ دقیقه خواندن
گذار از مهندسی پرامپت به مهندسی کنترل؛ راهکار سایبرنتیک برای پایداری عامل‌ها

گذار از مهندسی پرامپت به مهندسی کنترل؛ راهکار سایبرنتیک برای پایداری عامل‌ها

چارچوب جدیدی به نام Agent Cybernetics پیشنهاد می‌کند که به جای آزمون و خطاهای تجربی، از تئوری کنترل کلاسیک برای طراحی عامل‌های هوش مصنوعی استفاده کند. هدف این رویکرد، تضمین…

۲ دقیقه خواندن
گزارش arXiv: سیستم PRISM نرخ نشت اسرار در خط‌لوله‌های چند-عاملی را به ۰٪ رساند

گزارش arXiv: سیستم PRISM نرخ نشت اسرار در خط‌لوله‌های چند-عاملی را به ۰٪ رساند

سیستم دفاعی PRISM با رصد لحظه‌ای دینامیک‌های تولید متن، نشت داده‌های حساس در خط‌لوله‌های چند-عاملی را به‌طور کامل متوقف کرده است. این ابزار بدون کاهش کیفیت خروجی، نرخ نشت در سطح…

۲ دقیقه خواندن
چرا گلوگاه عامل‌های هوش مصنوعی در استدلال نیست، بلکه در طراحی APIهاست؟

چرا گلوگاه عامل‌های هوش مصنوعی در استدلال نیست، بلکه در طراحی APIهاست؟

یک پارادایم جدید در طراحی APIهای معنایی، رابط‌های سنتی CRUD را با پروتکلی شش‌فعل برای عامل‌های هوش مصنوعی جایگزین کرده است. این رویکرد در محیط‌های عملیاتی SaaS، نرخ موفقیت در…

۲ دقیقه خواندن
رمزگشایی از شکاف دانش و اجرا در عامل‌های هوش مصنوعی با معیارهای سطح-مسیر

رمزگشایی از شکاف دانش و اجرا در عامل‌های هوش مصنوعی با معیارهای سطح-مسیر

یک چارچوب آماری جدید، ارزیابی عامل‌های هوش مصنوعی را از نرخ‌های ساده‌ی موفقیت/شکست به سنجش ثبات در سطح مسیر تغییر می‌دهد. این متد به توسعه‌دهندگان اجازه می‌دهد تفاوت میان دانش مدل…

۲ دقیقه خواندن
SkillEvolver: ارتقای دقت مهارت‌های عامل‌های هوش مصنوعی به ۵۶.۸٪ در SkillsBench

SkillEvolver: ارتقای دقت مهارت‌های عامل‌های هوش مصنوعی به ۵۶.۸٪ در SkillsBench

چارچوب SkillEvolver با معرفی یک «متا-مهارت»، یادگیری عامل‌ها را از تغییر وزن‌های مدل به اصلاح متنی و کد منتقل کرد. این روش در ۱۵ حوزه مختلف، دقتی بالاتر از مهارت‌های طراحی‌شده…

۲ دقیقه خواندن
از تخصص انسانی به عامل‌های کدنویس: سازوکار ASIA در خودکارسازی شناسایی سیستم‌ها

از تخصص انسانی به عامل‌های کدنویس: سازوکار ASIA در خودکارسازی شناسایی سیستم‌ها

چارچوب ASIA با بهره‌گیری از مدل‌های زبانی بزرگ، فرآیند انتخاب مدل و تنظیم ابرپارامترها در سیستم‌های دینامیکی را به‌طور کامل خودکار می‌کند. این سیستم با بستن چرخه بین فرضیه و…

۲ دقیقه خواندن
چرا موفقیت‌های ادعایی عامل‌های هوش مصنوعی در بنچمارک‌ها اغلب کاذب هستند؟

چرا موفقیت‌های ادعایی عامل‌های هوش مصنوعی در بنچمارک‌ها اغلب کاذب هستند؟

پژوهشگران لایه‌ای برای گزارش شواهد معرفی کرده‌اند تا از ثبت «موفقیت‌های کاذب» در بنچمارک‌های عامل‌های هوش مصنوعی جلوگیری کنند. این چارچوب با الزام به ارائه مستندات قابل…

۲ دقیقه خواندن
رمزگشایی از اثر Harness: عاملی که ارزش‌های مدل‌های زبانی را تغییر می‌دهد

رمزگشایی از اثر Harness: عاملی که ارزش‌های مدل‌های زبانی را تغییر می‌دهد

پژوهشگران با معرفی Agent-ValueBench نشان دادند که رفتار عامل‌های هوش مصنوعی لزوماً با ارزش‌های مدل زبانی زیرساختی آن‌ها هم‌راستا نیست. این یافته‌ها ثابت می‌کند که ایمنی در…

۲ دقیقه خواندن