
کاهش خطای انتخاب ابزار در عاملهای AI به ۲.۵ درصد با GIST-CMTF
چارچوب GIST-CMTF با معرفی لایهی استنتاج وضعیت هدف، مانع از اجرای وظایف بر اساس درخواستهای مبهم کاربران میشود. این سیستم با اعتبارسنجی هدف پیش از معرفی ابزارها، نرخ موفقیت در…
موضوع
Autonomous agents, tool use, planning, multi-step workflows
۱٬۵۰۴ مقاله منتشر شده

چارچوب GIST-CMTF با معرفی لایهی استنتاج وضعیت هدف، مانع از اجرای وظایف بر اساس درخواستهای مبهم کاربران میشود. این سیستم با اعتبارسنجی هدف پیش از معرفی ابزارها، نرخ موفقیت در…

پژوهشگران چارچوب OpenClaw-Skill را معرفی کردند که با استفاده از جستوجوی جمعی در درخت مهارتها (CSTS)، کتابخانهای از مهارتهای بازیافتپذیر برای عاملهای هوش مصنوعی میسازد. این…

پژوهشگران چارچوب **Skill-to-LoRA** (S2L) را معرفی کردهاند که دستورالعملهای متنی حجیم در پرامپتها را با آداپتورهای سبک **LoRA** جایگزین میکند. این رویکرد باعث کاهش ۶.۶ درصدی…

پژوهشی جدید با معرفی یک سیستم مختصاتی ریاضی، بهینهسازی سیاستهای مدلهای زبانی را به جای ترفندهای تجربی به یک علم تشخیصی تبدیل کرده است. این چارچوب نشان میدهد که بسیاری از…

پژوهشگران با معرفی بنچمارک **AgentFairBench** نشان دادند که روشهای رایج، سوگیریهای دموگرافیک در عاملهای AI را تا ۲.۴ برابر بیشتر از واقعیت تخمین میزنند. این مطالعه تأیید…

پژوهشگران پیشنهاد کردهاند که هوش مصنوعی پزشکی از مدلهای تشخیص ایستا به «مدلهای جهانی» تغییر مسیر دهد. هدف این رویکرد، تبدیل سیستمها از امتیازدهی ریسک به شبیهسازی پویا از مسیر…

پژوهشگران چارچوب User as Code (UaC) را معرفی کردند که حافظه متنی هوش مصنوعی را با اشیاء و توابع قابلاجرای پایتون جایگزین میکند. این تغییر پارادایم، دقت پاسخدهی عاملها به…

تحلیل جدیدی نشان میدهد شرکتهای متوسط باید به جای تعقیب خودمختاری کامل، به سراغ «خودمختاری جزئی کنترلشده» بروند. این رویکرد با تمرکز بر یکپارچهسازی انسانمحور، بار اداری را…

بنچمارک جدید CoffeeBench نشان میدهد که برخی مدلهای زبانی با وجود توانایی برنامهریزی دقیق، در محیطهای اقتصادی بلندمدت دچار «بیعملی» میشوند. Claude Haiku 4.5 در این آزمون…

پژوهشگران با معرفی چارچوب Tensor-Coord، برنامهریزی در سیستمهای چندعاملی را از مذاکرات شکننده بر پایه پرامپت به همراستاسازی ریاضی منتقل کردند. این روش با استفاده از تجزیه جبری…

پژوهشگران چارچوبی به نام EC-Script توسعه دادهاند که به مدلهای زبانی اجازه میدهد روایتهای داستانی را با مسیرهای احساسی دقیق، مخصوص هنردرمانی، تولید کنند. این سیستم از یک ساختار…

پژوهشگران چارچوب جدیدی برای quantifying و بیمه کردن ریسکهای مالی عاملهای خودمختار معرفی کردهاند. این سیستم با جایگزینی قضاوت مدلهای زبانی با برچسبهای اقتصادی قطعی، نرخ خطای…