موضوع

عامل‌محور

Autonomous agents, tool use, planning, multi-step workflows

۱٬۵۲۶ مقاله منتشر شده

چگونه عامل‌های هوش مصنوعی ۹۰ درصد از اختلالات شبکه‌های عظیم را رفع می‌کنند؟

شکست‌های زیرساختی ابر اکنون سریع‌تر از واکنش انسان‌ها رخ می‌دهند. یک معماری جدید هوش مصنوعی عامل‌محور در یکی از ارائه‌دهندگان بزرگ ابر، اکنون بیش از ۹۰ درصد از حوادث رایج شبکه را…

۱ دقیقه خواندن

تحلیل و بررسی تخصصی۳ هفته پیش

حمله CFD: افزایش ۲۸.۳ درصدی موفقیت جیل‌بریک از طریق «شکاف منشأ» در مدل‌ها

پژوهشگران یک «شکاف منشأ» در عامل‌های هوش مصنوعی شناسایی کرده‌اند که اجازه می‌دهد درخواست‌های مضر در قالب فایل‌های به‌ظاهر بی‌خطر پنهان شوند. متد جدید CFD با دور زدن فیلترهای متنی،…

۱ دقیقه خواندن

تحلیل و بررسی تخصصی۳ هفته پیش

«پوسیدگی متنی»: چرا ۲۳ درصد از تنظیمات دستیارهای کدنویس منسوخ می‌شوند؟

پژوهشی جدید نشان می‌دهد Nearly یک‌چهارم از مخازن کد که از تنظیمات متنی برای هدایت هوش مصنوعی استفاده می‌کنند، با داده‌های منسوخ روبه‌رو هستند. این پدیده که «پوسیدگی متنی» نامیده…

۱ دقیقه خواندن

تحلیل و بررسی تخصصی۳ هفته پیش

چگونه SafeRun با تفکیک استنتاج و نظارت به ایمنی ۱۰۰ درصدی رسید؟

چارچوب SafeRun با جداسازی تفسیر زبان طبیعی از اجرای محدودیت‌های سخت، ایمنی کامل در برنامه‌ریزی‌های ورزشی را تضمین می‌کند. این متد در بنچمارک‌های جدید، عملکرد مهندسی پرامپت و…

۱ دقیقه خواندن

تحلیل و بررسی تخصصی۳ هفته پیش

سنجش مدل‌های جهانی در ثانیه‌ها: سازوکار ATM برای حذف شبیه‌سازی‌های زمان‌بر

پژوهشگران ابزاری به نام ATM را معرفی کرده‌اند که ارزیابی مدل‌های جهانی نهفته را به جای اجرای کند شبیه‌سازها، با پروب‌های سبک انجام می‌دهد. این متد با شناسایی سریع شکست‌های…

۱ دقیقه خواندن

تحلیل و بررسی تخصصی۳ هفته پیش

«حلقهٔ هکر-اصلاح‌گر»: متدی برای حذف تقلب در بنچمارک‌های عامل‌محور

پژوهشگران با ابداع یک چرخهٔ چندعاملی شامل «هکر» و «اصلاح‌گر»، نرخ موفقیت حملات پاداش‌جویانه در بنچمارک‌های هوش مصنوعی را به صفر رساندند. این روش با خودکارسازی شناسایی و وصله کردن…

۲ دقیقه خواندن

تحلیل و بررسی تخصصی۳ هفته پیش

PACT: عبور از بن‌بست تداخل استدلالی در مدل‌های پزشکی با اجماع شاخه‌ای

چارچوب آموزشی جدیدی به نام PACT با تفکیک پارادایم‌های استدلالی به شاخه‌های مجزای LoRA، دقت مدل‌های زبانی در تشخیص پزشکی را بهبود بخشیده است. این سیستم از طریق تجمیع شاخه‌ها بر…

۱ دقیقه خواندن

تحلیل و بررسی تخصصی۳ هفته پیش

چرا بازیابی دقیق متون در RAG برای رعایت قوانین حقوقی کافی نیست؟

پژوهشگران پدیده «حذف خاموش دامنه» (SSO) را شناسایی کرده‌اند؛ اختلالی که در آن مدل‌های زبانی قوانین کلی را می‌پذیرند اما استثنائات تودرتو را نادیده می‌گیرند. راهکار پیشنهادی،…

۲ دقیقه خواندن

تحلیل و بررسی تخصصی۳ هفته پیش

چرا مدل‌های یکپارچه در MRI شکست می‌خورند و SpineAgent به ۳۷ عامل نیاز دارد؟

پژوهشگران با معرفی SpineAgent، سیستمی عامل‌محور ساخته‌اند که گزارش‌های پیچیده MRI ستون فقرات را از طریق هماهنگی ۳۷ عامل تخصصی تولید می‌کند. این مدل با آموزش روی ۱۳ میلیون برش…

۲ دقیقه خواندن

تحلیل و بررسی تخصصی۳ هفته پیش

کاهش ۳۶ برابری زمان تنظیم شبیه‌سازهای علمی با لایه‌های مبنی‌سازی SIGA

آداپتور جدیدی به نام SIGA با ایجاد یک لایه‌ی «مبنی‌سازی» از قواعد و حافظه، امکان تعامل عامل‌های کدنویسی با شبیه‌سازهای پیچیده علمی را فراهم می‌کند. این سیستم در آزمایش‌های مربوط…

۲ دقیقه خواندن

تحلیل و بررسی تخصصی۳ هفته پیش

چگونه پروتکل CHAP تعاملات انسان و عامل را به مدرک قابل حسابرسی تبدیل می‌کند؟

پروتکل همکاری انسان-عامل (CHAP) یک فضای کاری ساختاریافته برای تبدیل گفتگوهای گذرا با هوش مصنوعی به مدارک قانونی و تصمیمات امضاشده ایجاد می‌کند. این استاندارد، شکاف میان مدیریت…

۲ دقیقه خواندن

تحلیل و بررسی تخصصی۳ هفته پیش

گزارش arXiv: بازگشت ۲۴ درصدی خطاهای اصلاح‌شده در خروجی‌های عامل‌های پژوهشی

یک مطالعه جدید نشان می‌دهد که بازخوردهای هدفمند کیفیت گزارش‌های عامل‌های پژوهش عمیق را افزایش می‌دهد، اما این پیشرفت در دوره‌های تکرار متوالی پایداری ندارد. این عامل‌ها هنگام رفع…

۱ دقیقه خواندن