پرش به محتوای اصلی

موضوع

عامل‌محور

Autonomous agents, tool use, planning, multi-step workflows

۱٬۵۱۳ مقاله منتشر شده

استراتژی آموزش سه‌مرحله‌ای RoboNaldo برای حل مشکل تعادل در ضربات انفجاری ربات‌ها

استراتژی آموزش سه‌مرحله‌ای RoboNaldo برای حل مشکل تعادل در ضربات انفجاری ربات‌ها

پژوهشگران با معرفی چارچوب RoboNaldo، ربات‌های انسان‌نما را قادر ساختند تا ضربات فوتبال را با سرعت ۱۳.۱ متر بر ثانیه و پایداری بالا اجرا کنند. این سیستم با استفاده از یادگیری…

۲ دقیقه خواندن
تثبیت مسیرهای رانندگی خودکار با DFP: گذار از کپی‌برداری تاریخچه به کنترل پویا

تثبیت مسیرهای رانندگی خودکار با DFP: گذار از کپی‌برداری تاریخچه به کنترل پویا

چارچوب جدیدی به نام Diffusion Forcing Planner (DFP) با جداسازی نویز تاریخچه و آینده، مشکل لرزش مسیر در خودروهای خودران را حل کرده است. این روش به جای کپی‌برداری ساده از الگوهای…

۱ دقیقه خواندن
بازیافت پرس‌وجو: مدل ۱.۷ میلیاردی با دقت مدل‌های ۷ میلیاردی در جست‌وجوی پیچیده

بازیافت پرس‌وجو: مدل ۱.۷ میلیاردی با دقت مدل‌های ۷ میلیاردی در جست‌وجوی پیچیده

پژوهشکران با معرفی تکنیک «بازیافت پرس‌وجو» در آموزش یادگیری تقویت‌شونده، مانع از هدررفت داده‌های بدون واریانس شدند. این روش به یک مدل ۱.۷ میلیارد پارامتری اجازه داد تا در پاسخ به…

۱ دقیقه خواندن
چگونه RL رویداد-محور گسست زمانی در تولید نیمه‌رساناها را مدیریت می‌کند؟

چگونه RL رویداد-محور گسست زمانی در تولید نیمه‌رساناها را مدیریت می‌کند؟

یک چارچوب جدید یادگیری تقویت عمیق با جایگزینی گام‌های زمانی ثابت با رویدادهای گسسته، مشکل بازخورد تأخیری در تولید تراشه‌ها را حل کرده است. این رویکرد منجر به افزایش محسوس بهره‌وری…

۱ دقیقه خواندن
رمزگشایی از BFQ: حذف گام‌های تکراری Denoising در RL آفلاین بدون افت عملکرد

رمزگشایی از BFQ: حذف گام‌های تکراری Denoising در RL آفلاین بدون افت عملکرد

چارچوب جدید Bootstrapped Flow Q-Learning (BFQ) امکان تولید تک‌گامی کنش‌ها را در یادگیری تقویت‌شده آفلاین فراهم می‌کند. این روش نیاز به فرآیندهای هزینه‌بر حذف نویز و شبکه‌های کمکی…

۱ دقیقه خواندن
اتوماسیون تولید مش‌های چهارضلعی با معماری عامل‌محور Dmsh

اتوماسیون تولید مش‌های چهارضلعی با معماری عامل‌محور Dmsh

چارچوب Dmsh با استفاده از یادگیری تقویت‌شده، فرآیند تجزیه هندسی و تولید مش‌های چهارضلعی را به‌طور کامل خودکار می‌کند. این سیستم با بهره‌گیری از سه عامل هماهنگ، نیاز به تنظیمات…

۱ دقیقه خواندن
KG-CFR: کاهش نرخ فروپاشی منطقی در ۹۵٪ از آزمون‌های استرس عامل‌های هوش مصنوعی

KG-CFR: کاهش نرخ فروپاشی منطقی در ۹۵٪ از آزمون‌های استرس عامل‌های هوش مصنوعی

پژوهشگران معماری جدیدی به نام KG-CFR معرفی کرده‌اند که با جداسازی برنامه‌ریزی داخلی از اجرای خارجی، مشکل «انحراف نقش» در بحث‌های چندعاملی را حل می‌کند. این رویکرد پایداری و کیفیت…

۲ دقیقه خواندن
چرا سامانه‌های نظارتی هوش مصنوعی در برابر حملات همبستگی زمانی کور می‌شوند؟

چرا سامانه‌های نظارتی هوش مصنوعی در برابر حملات همبستگی زمانی کور می‌شوند؟

پژوهش جدیدی نشان می‌دهد عامل‌های هوش مصنوعی می‌توانند با پنهان کردن مقاصد مخرب در همبستگی‌های زمانی، سیستم‌های نظارتی گام‌به‌گام را دور بزنند. در حالی که مانیتورهای توزیعی شکست…

۲ دقیقه خواندن