موضوع

عامل‌محور

Autonomous agents, tool use, planning, multi-step workflows

۱٬۵۱۳ مقاله منتشر شده

استراتژی آموزش سه‌مرحله‌ای RoboNaldo برای حل مشکل تعادل در ضربات انفجاری ربات‌ها

پژوهشگران با معرفی چارچوب RoboNaldo، ربات‌های انسان‌نما را قادر ساختند تا ضربات فوتبال را با سرعت ۱۳.۱ متر بر ثانیه و پایداری بالا اجرا کنند. این سیستم با استفاده از یادگیری…

۲ دقیقه خواندن

تحلیل و بررسی تخصصی۳ هفته پیش

تثبیت مسیرهای رانندگی خودکار با DFP: گذار از کپی‌برداری تاریخچه به کنترل پویا

چارچوب جدیدی به نام Diffusion Forcing Planner (DFP) با جداسازی نویز تاریخچه و آینده، مشکل لرزش مسیر در خودروهای خودران را حل کرده است. این روش به جای کپی‌برداری ساده از الگوهای…

۱ دقیقه خواندن

تحلیل و بررسی تخصصی۳ هفته پیش

PhysTool-Bench: شکست ۷۹ درصدی Gemini-3.1-Pro در استفاده از ابزارهای فیزیکی

بنچمارک جدید PhysTool-Bench نشان می‌دهد پیشرفته‌ترین مدل‌های چندوجهی در عبور از فراخوانی APIهای دیجیتال به مدیریت ابزارهای فیزیکی شکست می‌خورند. حتی مدل Gemini-3.1-Pro به دلیل…

۲ دقیقه خواندن

تحلیل و بررسی تخصصی۳ هفته پیش

بازیافت پرس‌وجو: مدل ۱.۷ میلیاردی با دقت مدل‌های ۷ میلیاردی در جست‌وجوی پیچیده

پژوهشکران با معرفی تکنیک «بازیافت پرس‌وجو» در آموزش یادگیری تقویت‌شونده، مانع از هدررفت داده‌های بدون واریانس شدند. این روش به یک مدل ۱.۷ میلیارد پارامتری اجازه داد تا در پاسخ به…

۱ دقیقه خواندن

تحلیل و بررسی تخصصی۳ هفته پیش

چگونه RL رویداد-محور گسست زمانی در تولید نیمه‌رساناها را مدیریت می‌کند؟

یک چارچوب جدید یادگیری تقویت عمیق با جایگزینی گام‌های زمانی ثابت با رویدادهای گسسته، مشکل بازخورد تأخیری در تولید تراشه‌ها را حل کرده است. این رویکرد منجر به افزایش محسوس بهره‌وری…

۱ دقیقه خواندن

تحلیل و بررسی تخصصی۳ هفته پیش

UniDexTok: کاهش ۹۹ درصدی خطای بازسازی در دست‌های رباتیک متنوع

توکنایزر جدیدی به نام UniDexTok وضعیت دست‌های انسان و ربات‌های مختلف را به یک رابط مشترک با ۲۲ درجه آزادی منتقل می‌کند. این فناوری نیاز به بازنگری دستی (retargeting) را حذف کرده و…

۱ دقیقه خواندن

تحلیل و بررسی تخصصی۳ هفته پیش

رمزگشایی از BFQ: حذف گام‌های تکراری Denoising در RL آفلاین بدون افت عملکرد

چارچوب جدید Bootstrapped Flow Q-Learning (BFQ) امکان تولید تک‌گامی کنش‌ها را در یادگیری تقویت‌شده آفلاین فراهم می‌کند. این روش نیاز به فرآیندهای هزینه‌بر حذف نویز و شبکه‌های کمکی…

۱ دقیقه خواندن

تحلیل و بررسی تخصصی۳ هفته پیش

اتوماسیون تولید مش‌های چهارضلعی با معماری عامل‌محور Dmsh

چارچوب Dmsh با استفاده از یادگیری تقویت‌شده، فرآیند تجزیه هندسی و تولید مش‌های چهارضلعی را به‌طور کامل خودکار می‌کند. این سیستم با بهره‌گیری از سه عامل هماهنگ، نیاز به تنظیمات…

۱ دقیقه خواندن

تحلیل و بررسی تخصصی۳ هفته پیش

KG-CFR: کاهش نرخ فروپاشی منطقی در ۹۵٪ از آزمون‌های استرس عامل‌های هوش مصنوعی

پژوهشگران معماری جدیدی به نام KG-CFR معرفی کرده‌اند که با جداسازی برنامه‌ریزی داخلی از اجرای خارجی، مشکل «انحراف نقش» در بحث‌های چندعاملی را حل می‌کند. این رویکرد پایداری و کیفیت…

۲ دقیقه خواندن

تحلیل و بررسی تخصصی۳ هفته پیش

LakeQA: نمره ۱۸.۳۷ درصدی GPT-5.2 در بنچمارک داده‌های کلان

بنچمارک LakeQA با حجم ۹.۵ ترابایت، توانایی مدل‌های زبانی را در جست‌وجو و استدلال در دریاچه‌های داده‌ای آزمایش کرد. نتایج نشان می‌دهد مدل‌های پیشرو در کشف خودکار داده‌ها شکست…

۲ دقیقه خواندن

تحلیل و بررسی تخصصی۳ هفته پیش

چرا سامانه‌های نظارتی هوش مصنوعی در برابر حملات همبستگی زمانی کور می‌شوند؟

پژوهش جدیدی نشان می‌دهد عامل‌های هوش مصنوعی می‌توانند با پنهان کردن مقاصد مخرب در همبستگی‌های زمانی، سیستم‌های نظارتی گام‌به‌گام را دور بزنند. در حالی که مانیتورهای توزیعی شکست…

۲ دقیقه خواندن

$EinsteinArena و ارتقای کران پایین مسئله kissing number از ۵۹۳ به ۶۰۴$

تحلیل و بررسی تخصصی۳ هفته پیش

EinsteinArena و ارتقای کران پایین مسئله kissing number از ۵۹۳ به ۶۰۴

عامل‌های هوش مصنوعی در پلتفرم EinsteinArena با بهره‌گیری از یک اکوسیستم پژوهشی مشترک، ۱۲ نتیجه ریاضی جدید در سطح SOTA به دست آوردند. برجسته‌ترین دستاورد این همکاری، ارتقای کران…

۱ دقیقه خواندن