پرش به محتوای اصلی

موضوع

عامل‌محور

Autonomous agents, tool use, planning, multi-step workflows

۱٬۵۲۲ مقاله منتشر شده

ربات‌ها از انسان‌ها پیشی گرفتند: وب عامل‌محور و سیستم مدیریت محتوا
آموزش کاربردی

چرخش در ترافیک وب: چرا سئو از جذب انسان به اقدام عامل‌ها تغییر می‌کند؟

عامل‌های هوش مصنوعی اکنون با ۵۷.۵٪ از درخواست‌های وب، جایگاه انسان‌ها را به عنوان بازدیدکننده اصلی اینترنت گرفته‌اند. این تغییر، ضرورت گذار از طراحی‌های بصری به محتوای ساختاریافته…

۶ دقیقه خواندن
ایجاد چک‌پوینت با گازلایتینگ دیتابیس Postgres

چرا عامل‌های هوش مصنوعی باعث تورم هزینه‌های ابری می‌شوند و Lakebase چه می‌کند؟

شرکت Databricks ابزاری به نام Lakebase معرفی کرد تا هرج‌ومرج زیرساختی ایجاد شده توسط عامل‌های خودکار را مهار کند. این دیتابیس با استفاده از قابلیت شاخه‌بندی و محاسبات صفر-پذیر،…

۱ دقیقه خواندن
AHA-WAM: کاهش ۴.۵۹ برابری تأخیر در کنترل رباتیک با مدل‌سازی نامتقارن جهان

AHA-WAM: کاهش ۴.۵۹ برابری تأخیر در کنترل رباتیک با مدل‌سازی نامتقارن جهان

چارچوب AHA-WAM با جداسازی پیش‌بینی جهان از اجرای عملیات، تأخیر کنترل بسته-حلقه در ربات‌ها را ۴.۵۹ برابر کاهش داده است. این معماری مبتنی بر ترنسفورمرهای انتشار دوگانه، امکان کنترل…

۲ دقیقه خواندن
چرا نمرات «شروع سرد» برای سنجش قابلیت یادگیری عامل‌های VLM کافی نیستند؟

چرا نمرات «شروع سرد» برای سنجش قابلیت یادگیری عامل‌های VLM کافی نیستند؟

پژوهشگران بنچمارک OmniGameArena را برای اندازه‌گیری نحوه بهبود عامل‌های مدل زبانی-دیداری از طریق بازتاب خودکار معرفی کرده‌اند. برخلاف تابلوهای امتیازات ایستا، این سیستم مسیر…

۱ دقیقه خواندن
انتقال کنترل از خط‌مبنا به شبکه عصبی؛ راهکاری برای حذف آزمون-خطای پرهزینه در RL

انتقال کنترل از خط‌مبنا به شبکه عصبی؛ راهکاری برای حذف آزمون-خطای پرهزینه در RL

یک تکنیک جدید در یادگیری تقویت‌شده (RL) با جایگزینی آموزش «از صفر» با انتقال تدریجی کنترل از یک خط‌مبنای عملیاتی به شبکه عصبی، هزینه‌های محاسباتی را کاهش می‌دهد. این روش نرخ رسیدن…

۲ دقیقه خواندن
DARP: افزایش ۴۶ درصدی تعمیم‌پذیری در یادگیری تقلیدی با رویکرد بازیابی محلی

DARP: افزایش ۴۶ درصدی تعمیم‌پذیری در یادگیری تقلیدی با رویکرد بازیابی محلی

رویکرد DARP با جایگزینی سیاست‌های سراسری با ساختارهای بازیابی محلی، خطاهای انباشته در حالت‌های خارج از توزیع را کاهش می‌دهد. این متد منجر به بهبود ۱۵ تا ۴۶ درصدی عملکرد در کنترل…

۱ دقیقه خواندن
چرا یادگیری تقویت‌شده چندعاملی جایگزین محاسبات هندسی در حمل‌ونقل رباتیک می‌شود؟

چرا یادگیری تقویت‌شده چندعاملی جایگزین محاسبات هندسی در حمل‌ونقل رباتیک می‌شود؟

یک چارچوب جدید یادگیری تقویت‌شده چندعاملی (MARL)، تیم‌های رباتیک را قادر می‌سازد تا اجسام با هر شکل و توزیع جرم نامتقارن را به‌طور خودگردان جابه‌جا کنند. این سیستم با ادغام کنترل…

۱ دقیقه خواندن
سازه ReCoVLA: تبدیل VLM به انتخابگر پاداش برای بازیابی خطاهای رباتیک

سازه ReCoVLA: تبدیل VLM به انتخابگر پاداش برای بازیابی خطاهای رباتیک

چارچوب ReCoVLA با استفاده از مدل‌های چندوجهی برای هدایت پاداش‌ها، توانایی ربات‌ها در بازیابی از شکست‌ها را بدون نیاز به بازآموزی سیاست اصلی افزایش می‌دهد. این روش نرخ موفقیت…

۱ دقیقه خواندن
Anything2Skill: تبدیل دانش پراکنده به مهارت‌های اجرایی برای عبور از سد RAG

Anything2Skill: تبدیل دانش پراکنده به مهارت‌های اجرایی برای عبور از سد RAG

چارچوب Anything2Skill با تبدیل دانش خارجی پراکنده به قراردادهای مهارتی ساختاریافته، شکاف بین «خواندن مستندات» و «اجرای وظیفه» را پر می‌کند. این رویکرد باعث افزایش نرخ موفقیت…

۲ دقیقه خواندن
SecureClaw: توقف نشت داده‌ها در عامل‌های هوش مصنوعی با گیت‌های دو-مرزی

SecureClaw: توقف نشت داده‌ها در عامل‌های هوش مصنوعی با گیت‌های دو-مرزی

معماری SecureClaw با ایجاد گیت‌های دو-مرزی، احتمال نشت داده‌های حساس توسط عامل‌های هوش مصنوعی را در بنچمارک ASB به صفر رسانده است. این رویکرد، امنیت را از فیلترهای احتمالیِ متنی…

۱ دقیقه خواندن