موضوع

عامل‌محور

Autonomous agents, tool use, planning, multi-step workflows

۱٬۵۰۸ مقاله منتشر شده

چگونه کالیبراسیون Real2Sim2Real نیاز به بینایی در گرفتن اشیاء را حذف می‌کند؟

پژوهشگران راهکاری برای دستیابی به مهارت گرفتن اشیاء بدون استفاده از دوربین ابداع کرده‌اند که صرفاً بر بازخوردهای لمسی تکیه می‌کند. این سیستم با استفاده از یک دوقلوی دیجیتال…

۲ دقیقه خواندن

تحلیل و بررسی تخصصی۲ هفته پیش

عبور از مقیاس‌بندی: معماری سه‌گانه برای حل چالش آموزش سقراطی در LLMها

افزایش مقیاس مدل‌های پیشرو نتوانسته است مشکل بنیادین آموزش‌های مبتنی بر هوش مصنوعی، یعنی مدیریت هم‌زمان برنامه درسی و گفتگو را حل کند. یک سیستم جدید با جداسازی مدیریت دانش از لایه…

۲ دقیقه خواندن

تحلیل و بررسی تخصصی۲ هفته پیش

چرا ادراک بصری پیشرفته در مدل‌های پزشکی به معنای موفقیت در اجرای عامل‌محور نیست؟

بنچمارک جدید MedCTA نشان می‌دهد که پیشرفته‌ترین مدل‌های چندوجهی در اجرای وظایف بالینی چندمرحله‌ای شکست می‌خورند. این مطالعه شکاف عمیقی را میان توانایی مدل در درک داده‌های پزشکی و…

۱ دقیقه خواندن

تحلیل و بررسی تخصصی۳ هفته پیش

Autopilot: کاهش نرخ توهم در عامل‌های هوش مصنوعی از ۳۳.۷٪ به ۰.۶۷٪

مدل Autopilot با به‌کارگیری ماشین حالت متناهی (FSM)، ادعاهای نادرست عامل‌ها درباره اتمام موفقیت‌آمیز کار را حذف کرد. این معماری در بنچمارک SWE-bench Lite توانست نرخ توهم را از…

۲ دقیقه خواندن

تحلیل و بررسی تخصصی۳ هفته پیش

دقت ۹۰ درصدی RSA در شناسایی مهارت‌های مخرب پنهان در عامل‌های هوش مصنوعی

پژوهشگران با معرفی روش **Runtime Skill Audit** (RSA)، سیستمی برای شناسایی رفتارهای مخرب در **عامل‌های هوش مصنوعی** (AI Agents) توسعه داده‌اند که از چشمان تحلیل‌های استاتیک پنهان…

۱ دقیقه خواندن

تحلیل و بررسی تخصصی۳ هفته پیش

ترکیب GNN و LLM: عبور از حدس احتمالی به استنتاج قطعی در استدلال‌های پیچیده

پژوهشگران چارچوبی هم‌افزا برای ادغام مدل‌های زبانی بزرگ با داده‌های گراف‌ساختار را پیشنهاد داده‌اند تا شکاف‌های استدلالی در تحلیل‌های چندمرحله‌ای را برطرف کنند. این رویکرد…

۱ دقیقه خواندن

تحلیل و بررسی تخصصی۳ هفته پیش

چرا حجم پارامترها در اتوماسیون صنعتی دیگر معیار موفقیت نیست؟

یک چارچوب عامل‌محور جدید با استفاده از AutoGen، طراحی موانع بتنی بزرگراه‌ها را با دقت ۹۸٪ خودکار کرده است. این پژوهش ثابت می‌کند مدل‌های ۸ میلیاردی در صورت مدیریت در یک سیستم…

۱ دقیقه خواندن

تحلیل و بررسی تخصصی۳ هفته پیش

StatefulDiscovery: گذار از حلقه‌ی «پرامپت-تحلیل» به ماشین حالت در کشفیات علمی

پژوهشگران چارچوب StatefulDiscovery را برای جلوگیری از تفسیرهای نادرست عامل‌های هوش مصنوعی در پژوهش‌های علمی معرفی کردند. این سیستم با بیرونی‌سازی وضعیت تحقیق، کیفیت ادعاهای علمی…

۱ دقیقه خواندن

تحلیل و بررسی تخصصی۳ هفته پیش

MODF-SIR: دستیابی به SOTA در استدلال اجتماعی با تنها ۳۰٪ از داده‌ها

چارچوب MODF-SIR با ترکیب تقطیر دانش و تطبیق زمان تست، استدلال‌های اجتماعی پیچیده را با بهره‌گیری از تنها ۳۰٪ از مجموعه‌داده IntentTrain بهینه‌سازی کرده است. این مدل با تمرکز بر…

۱ دقیقه خواندن

تحلیل و بررسی تخصصی۳ هفته پیش

AutoMine: کسب امتیاز ۷۷.۲۱ در چالش سناریوهای Argoverse 2

AutoMine با ترکیب مدل‌های زبانی و بینایی، استخراج خودکار سناریوهای بحرانی رانندگی از داده‌های حجیم را ممکن کرده است. این چارچوب با استفاده از حلقه‌ی اصلاح کد، توانست در رقابت…

۱ دقیقه خواندن

تحلیل و بررسی تخصصی۳ هفته پیش

چگونه RecToM با بازسازی بازگشتی دیدگاه‌ها به دقت ۱۰۰٪ در Hi-ToM رسید؟

چارچوب استنتاجی جدید RecToM با استفاده از بازسازی بازگشتی دیدگاه‌ها، مدل‌های زبانی را قادر ساخت تا باورهای تودرتو را به‌طور دقیق مدل‌سازی کنند. این متد با بهره‌گیری از GPT-5.4 و…

۱ دقیقه خواندن

تحلیل و بررسی تخصصی۳ هفته پیش

چرا استدلال قوی‌تر مدل‌ها برای جست‌وجوی عمیق در وب کافی نیست؟

TreeSeeker چارچوب جدیدی است که با استفاده از حافظه ساختاردرختی و سیگنال‌های UCB، مانع از گیر کردن عامل‌های هوش مصنوعی در مسیرهای بن‌بست می‌شود. این رویکرد ثابت می‌کند که برای…

۲ دقیقه خواندن