پرش به محتوای اصلی

موضوع

عامل‌محور

Autonomous agents, tool use, planning, multi-step workflows

۱٬۵۲۶ مقاله منتشر شده

چگونه عامل‌های هوش مصنوعی ۹۰ درصد از اختلالات شبکه‌های عظیم را رفع می‌کنند؟

چگونه عامل‌های هوش مصنوعی ۹۰ درصد از اختلالات شبکه‌های عظیم را رفع می‌کنند؟

شکست‌های زیرساختی ابر اکنون سریع‌تر از واکنش انسان‌ها رخ می‌دهند. یک معماری جدید هوش مصنوعی عامل‌محور در یکی از ارائه‌دهندگان بزرگ ابر، اکنون بیش از ۹۰ درصد از حوادث رایج شبکه را…

۱ دقیقه خواندن
حمله CFD: افزایش ۲۸.۳ درصدی موفقیت جیل‌بریک از طریق «شکاف منشأ» در مدل‌ها

حمله CFD: افزایش ۲۸.۳ درصدی موفقیت جیل‌بریک از طریق «شکاف منشأ» در مدل‌ها

پژوهشگران یک «شکاف منشأ» در عامل‌های هوش مصنوعی شناسایی کرده‌اند که اجازه می‌دهد درخواست‌های مضر در قالب فایل‌های به‌ظاهر بی‌خطر پنهان شوند. متد جدید CFD با دور زدن فیلترهای متنی،…

۱ دقیقه خواندن
«پوسیدگی متنی»: چرا ۲۳ درصد از تنظیمات دستیارهای کدنویس منسوخ می‌شوند؟

«پوسیدگی متنی»: چرا ۲۳ درصد از تنظیمات دستیارهای کدنویس منسوخ می‌شوند؟

پژوهشی جدید نشان می‌دهد Nearly یک‌چهارم از مخازن کد که از تنظیمات متنی برای هدایت هوش مصنوعی استفاده می‌کنند، با داده‌های منسوخ روبه‌رو هستند. این پدیده که «پوسیدگی متنی» نامیده…

۱ دقیقه خواندن
چگونه SafeRun با تفکیک استنتاج و نظارت به ایمنی ۱۰۰ درصدی رسید؟

چگونه SafeRun با تفکیک استنتاج و نظارت به ایمنی ۱۰۰ درصدی رسید؟

چارچوب SafeRun با جداسازی تفسیر زبان طبیعی از اجرای محدودیت‌های سخت، ایمنی کامل در برنامه‌ریزی‌های ورزشی را تضمین می‌کند. این متد در بنچمارک‌های جدید، عملکرد مهندسی پرامپت و…

۱ دقیقه خواندن
سنجش مدل‌های جهانی در ثانیه‌ها: سازوکار ATM برای حذف شبیه‌سازی‌های زمان‌بر

سنجش مدل‌های جهانی در ثانیه‌ها: سازوکار ATM برای حذف شبیه‌سازی‌های زمان‌بر

پژوهشگران ابزاری به نام ATM را معرفی کرده‌اند که ارزیابی مدل‌های جهانی نهفته را به جای اجرای کند شبیه‌سازها، با پروب‌های سبک انجام می‌دهد. این متد با شناسایی سریع شکست‌های…

۱ دقیقه خواندن
«حلقهٔ هکر-اصلاح‌گر»: متدی برای حذف تقلب در بنچمارک‌های عامل‌محور

«حلقهٔ هکر-اصلاح‌گر»: متدی برای حذف تقلب در بنچمارک‌های عامل‌محور

پژوهشگران با ابداع یک چرخهٔ چندعاملی شامل «هکر» و «اصلاح‌گر»، نرخ موفقیت حملات پاداش‌جویانه در بنچمارک‌های هوش مصنوعی را به صفر رساندند. این روش با خودکارسازی شناسایی و وصله کردن…

۲ دقیقه خواندن
PACT: عبور از بن‌بست تداخل استدلالی در مدل‌های پزشکی با اجماع شاخه‌ای

PACT: عبور از بن‌بست تداخل استدلالی در مدل‌های پزشکی با اجماع شاخه‌ای

چارچوب آموزشی جدیدی به نام PACT با تفکیک پارادایم‌های استدلالی به شاخه‌های مجزای LoRA، دقت مدل‌های زبانی در تشخیص پزشکی را بهبود بخشیده است. این سیستم از طریق تجمیع شاخه‌ها بر…

۱ دقیقه خواندن
چرا بازیابی دقیق متون در RAG برای رعایت قوانین حقوقی کافی نیست؟

چرا بازیابی دقیق متون در RAG برای رعایت قوانین حقوقی کافی نیست؟

پژوهشگران پدیده «حذف خاموش دامنه» (SSO) را شناسایی کرده‌اند؛ اختلالی که در آن مدل‌های زبانی قوانین کلی را می‌پذیرند اما استثنائات تودرتو را نادیده می‌گیرند. راهکار پیشنهادی،…

۲ دقیقه خواندن
چرا مدل‌های یکپارچه در MRI شکست می‌خورند و SpineAgent به ۳۷ عامل نیاز دارد؟

چرا مدل‌های یکپارچه در MRI شکست می‌خورند و SpineAgent به ۳۷ عامل نیاز دارد؟

پژوهشگران با معرفی SpineAgent، سیستمی عامل‌محور ساخته‌اند که گزارش‌های پیچیده MRI ستون فقرات را از طریق هماهنگی ۳۷ عامل تخصصی تولید می‌کند. این مدل با آموزش روی ۱۳ میلیون برش…

۲ دقیقه خواندن
کاهش ۳۶ برابری زمان تنظیم شبیه‌سازهای علمی با لایه‌های مبنی‌سازی SIGA

کاهش ۳۶ برابری زمان تنظیم شبیه‌سازهای علمی با لایه‌های مبنی‌سازی SIGA

آداپتور جدیدی به نام SIGA با ایجاد یک لایه‌ی «مبنی‌سازی» از قواعد و حافظه، امکان تعامل عامل‌های کدنویسی با شبیه‌سازهای پیچیده علمی را فراهم می‌کند. این سیستم در آزمایش‌های مربوط…

۲ دقیقه خواندن
چگونه پروتکل CHAP تعاملات انسان و عامل را به مدرک قابل حسابرسی تبدیل می‌کند؟

چگونه پروتکل CHAP تعاملات انسان و عامل را به مدرک قابل حسابرسی تبدیل می‌کند؟

پروتکل همکاری انسان-عامل (CHAP) یک فضای کاری ساختاریافته برای تبدیل گفتگوهای گذرا با هوش مصنوعی به مدارک قانونی و تصمیمات امضاشده ایجاد می‌کند. این استاندارد، شکاف میان مدیریت…

۲ دقیقه خواندن
گزارش arXiv: بازگشت ۲۴ درصدی خطاهای اصلاح‌شده در خروجی‌های عامل‌های پژوهشی

گزارش arXiv: بازگشت ۲۴ درصدی خطاهای اصلاح‌شده در خروجی‌های عامل‌های پژوهشی

یک مطالعه جدید نشان می‌دهد که بازخوردهای هدفمند کیفیت گزارش‌های عامل‌های پژوهش عمیق را افزایش می‌دهد، اما این پیشرفت در دوره‌های تکرار متوالی پایداری ندارد. این عامل‌ها هنگام رفع…

۱ دقیقه خواندن