پرش به محتوای اصلی

موضوع

عامل‌محور

Autonomous agents, tool use, planning, multi-step workflows

۱٬۵۰۸ مقاله منتشر شده

چگونه کالیبراسیون Real2Sim2Real نیاز به بینایی در گرفتن اشیاء را حذف می‌کند؟

چگونه کالیبراسیون Real2Sim2Real نیاز به بینایی در گرفتن اشیاء را حذف می‌کند؟

پژوهشگران راهکاری برای دستیابی به مهارت گرفتن اشیاء بدون استفاده از دوربین ابداع کرده‌اند که صرفاً بر بازخوردهای لمسی تکیه می‌کند. این سیستم با استفاده از یک دوقلوی دیجیتال…

۲ دقیقه خواندن
عبور از مقیاس‌بندی: معماری سه‌گانه برای حل چالش آموزش سقراطی در LLMها

عبور از مقیاس‌بندی: معماری سه‌گانه برای حل چالش آموزش سقراطی در LLMها

افزایش مقیاس مدل‌های پیشرو نتوانسته است مشکل بنیادین آموزش‌های مبتنی بر هوش مصنوعی، یعنی مدیریت هم‌زمان برنامه درسی و گفتگو را حل کند. یک سیستم جدید با جداسازی مدیریت دانش از لایه…

۲ دقیقه خواندن
چرا ادراک بصری پیشرفته در مدل‌های پزشکی به معنای موفقیت در اجرای عامل‌محور نیست؟

چرا ادراک بصری پیشرفته در مدل‌های پزشکی به معنای موفقیت در اجرای عامل‌محور نیست؟

بنچمارک جدید MedCTA نشان می‌دهد که پیشرفته‌ترین مدل‌های چندوجهی در اجرای وظایف بالینی چندمرحله‌ای شکست می‌خورند. این مطالعه شکاف عمیقی را میان توانایی مدل در درک داده‌های پزشکی و…

۱ دقیقه خواندن
دقت ۹۰ درصدی RSA در شناسایی مهارت‌های مخرب پنهان در عامل‌های هوش مصنوعی

دقت ۹۰ درصدی RSA در شناسایی مهارت‌های مخرب پنهان در عامل‌های هوش مصنوعی

پژوهشگران با معرفی روش **Runtime Skill Audit** (RSA)، سیستمی برای شناسایی رفتارهای مخرب در **عامل‌های هوش مصنوعی** (AI Agents) توسعه داده‌اند که از چشمان تحلیل‌های استاتیک پنهان…

۱ دقیقه خواندن
ترکیب GNN و LLM: عبور از حدس احتمالی به استنتاج قطعی در استدلال‌های پیچیده

ترکیب GNN و LLM: عبور از حدس احتمالی به استنتاج قطعی در استدلال‌های پیچیده

پژوهشگران چارچوبی هم‌افزا برای ادغام مدل‌های زبانی بزرگ با داده‌های گراف‌ساختار را پیشنهاد داده‌اند تا شکاف‌های استدلالی در تحلیل‌های چندمرحله‌ای را برطرف کنند. این رویکرد…

۱ دقیقه خواندن
چرا حجم پارامترها در اتوماسیون صنعتی دیگر معیار موفقیت نیست؟

چرا حجم پارامترها در اتوماسیون صنعتی دیگر معیار موفقیت نیست؟

یک چارچوب عامل‌محور جدید با استفاده از AutoGen، طراحی موانع بتنی بزرگراه‌ها را با دقت ۹۸٪ خودکار کرده است. این پژوهش ثابت می‌کند مدل‌های ۸ میلیاردی در صورت مدیریت در یک سیستم…

۱ دقیقه خواندن
StatefulDiscovery: گذار از حلقه‌ی «پرامپت-تحلیل» به ماشین حالت در کشفیات علمی

StatefulDiscovery: گذار از حلقه‌ی «پرامپت-تحلیل» به ماشین حالت در کشفیات علمی

پژوهشگران چارچوب StatefulDiscovery را برای جلوگیری از تفسیرهای نادرست عامل‌های هوش مصنوعی در پژوهش‌های علمی معرفی کردند. این سیستم با بیرونی‌سازی وضعیت تحقیق، کیفیت ادعاهای علمی…

۱ دقیقه خواندن
MODF-SIR: دستیابی به SOTA در استدلال اجتماعی با تنها ۳۰٪ از داده‌ها

MODF-SIR: دستیابی به SOTA در استدلال اجتماعی با تنها ۳۰٪ از داده‌ها

چارچوب MODF-SIR با ترکیب تقطیر دانش و تطبیق زمان تست، استدلال‌های اجتماعی پیچیده را با بهره‌گیری از تنها ۳۰٪ از مجموعه‌داده IntentTrain بهینه‌سازی کرده است. این مدل با تمرکز بر…

۱ دقیقه خواندن
چگونه RecToM با بازسازی بازگشتی دیدگاه‌ها به دقت ۱۰۰٪ در Hi-ToM رسید؟

چگونه RecToM با بازسازی بازگشتی دیدگاه‌ها به دقت ۱۰۰٪ در Hi-ToM رسید؟

چارچوب استنتاجی جدید RecToM با استفاده از بازسازی بازگشتی دیدگاه‌ها، مدل‌های زبانی را قادر ساخت تا باورهای تودرتو را به‌طور دقیق مدل‌سازی کنند. این متد با بهره‌گیری از GPT-5.4 و…

۱ دقیقه خواندن
چرا استدلال قوی‌تر مدل‌ها برای جست‌وجوی عمیق در وب کافی نیست؟

چرا استدلال قوی‌تر مدل‌ها برای جست‌وجوی عمیق در وب کافی نیست؟

TreeSeeker چارچوب جدیدی است که با استفاده از حافظه ساختاردرختی و سیگنال‌های UCB، مانع از گیر کردن عامل‌های هوش مصنوعی در مسیرهای بن‌بست می‌شود. این رویکرد ثابت می‌کند که برای…

۲ دقیقه خواندن