پرش به محتوای اصلی

موضوع

عامل‌محور

Autonomous agents, tool use, planning, multi-step workflows

۱٬۵۲۷ مقاله منتشر شده

«مالیات استدلال»: کاهش ۲۸ درصدی دقت مدل‌های متوسط در خروجی‌های JSON

«مالیات استدلال»: کاهش ۲۸ درصدی دقت مدل‌های متوسط در خروجی‌های JSON

پژوهشی جدید نشان می‌دهد اجبار مدل‌های زبانی متوسط به تولید خروجی ساختاریافته (JSON)، دقت استدلالی آن‌ها را تا ۲۸ درصد کاهش می‌دهد. این پدیده که «مالیات استدلال» نامیده شده، نشان…

۲ دقیقه خواندن
حل شکاف میان برنامه‌ریز و اجراکننده در LLMها با رویکرد بهینه‌سازی مشترک CAHL

حل شکاف میان برنامه‌ریز و اجراکننده در LLMها با رویکرد بهینه‌سازی مشترک CAHL

رویکرد جدیدی به نام CAHL از طریق یادگیری تقویت‌شده با پاداش‌های قابل تأیید، برنامه‌ریز و اجراکننده مدل‌های زبانی را به‌طور مشترک بهینه می‌کند. این روش همراستاسازی ساختاری را که…

۱ دقیقه خواندن
توقف فروپاشی مدل‌های جهان با مکانیسم زیرهدف‌های سلسله‌مراتبی در FF-JEPA

توقف فروپاشی مدل‌های جهان با مکانیسم زیرهدف‌های سلسله‌مراتبی در FF-JEPA

معماری FF-JEPA با معرفی یک رویکرد سلسله‌مراتبی، مشکل فروپاشی مدل‌های جهان در برنامه‌ریزی‌های بلندمدت را حل کرده است. این مدل با استفاده از یک برنامه‌ریز نهان برای تعیین زیرهدف‌ها،…

۱ دقیقه خواندن
افزایش ۱۷.۱۹ درصدی بینش تجربی در پژوهش‌های علوم اجتماعی با چارچوب MASS

افزایش ۱۷.۱۹ درصدی بینش تجربی در پژوهش‌های علوم اجتماعی با چارچوب MASS

چارچوب جدید MASS از شبیه‌سازی‌های اجتماعی تقویت‌شده با حافظه استفاده می‌کند تا عامل‌های پژوهشی را از سطح ترکیب متون به استدلال تجربی ارتقا دهد. این سیستم توانست نرخ بینش در تولید…

۱ دقیقه خواندن
ترکیب AI و FEA در سیستم‌های چندعاملی برای حذف گلوگاه‌های محاسباتی طراحی موتور

ترکیب AI و FEA در سیستم‌های چندعاملی برای حذف گلوگاه‌های محاسباتی طراحی موتور

پژوهشگران چارچوبی عامل‌محور برای اتوماسیون طراحی موتورهای همگام مغناطیس داخلی (IPMSM) توسعه داده‌اند. این سیستم با ترکیب تولید بازیابی‌افزا (RAG) و رویکرد هیبریدی AI-FEA،…

۲ دقیقه خواندن
چرا ترکیب زنجیره تفکر و MCTS در مهندسی ویژگی‌های جدولی بهین‌ترین بازدهی را دارد؟

چرا ترکیب زنجیره تفکر و MCTS در مهندسی ویژگی‌های جدولی بهین‌ترین بازدهی را دارد؟

چارچوب جدید LATTEArena نشان می‌دهد که ترکیب زنجیره تفکر و جستجوی درختی مونت‌کارلو، بهینه‌ترین روش برای خودکارسازی مهندسی ویژگی‌ها در داده‌های جدولی است. این مطالعه معیارهای…

۱ دقیقه خواندن
فراتر از داوران LLM: مکانیسم «مداخلاتی» برای ردیابی خطاهای خاموش در عامل‌ها

فراتر از داوران LLM: مکانیسم «مداخلاتی» برای ردیابی خطاهای خاموش در عامل‌ها

چارچوب REFLECT با جایگزینی تشخیص‌های غیرفعال با یک چرخه آزمایش-و-خطای فعال، نقاط شکست در سیستم‌های عامل‌محور را شناسایی می‌کند. این روش به‌ویژه برای یافتن «خطاهای خاموش» که از دید…

۱ دقیقه خواندن
چگونه چارچوب «اقتصاد عامل‌ها» از یکسان‌سازی تفکر در مدل‌های زبانی جلوگیری می‌کند

چگونه چارچوب «اقتصاد عامل‌ها» از یکسان‌سازی تفکر در مدل‌های زبانی جلوگیری می‌کند

پژوهشگران چارچوب جدیدی به نام «اقتصاد عامل‌ها» را برای جلوگیری از همگرایی رفتاری عامل‌های خودمختار معرفی کرده‌اند. این سیستم با استفاده از همراستاسازی کثرت‌گرایانه، تنوع استدلالی…

۱ دقیقه خواندن
کالبدشکافی ناپایداری در عامل‌های AI: از نمونه‌برداری توکن تا نویز زیرساختی

کالبدشکافی ناپایداری در عامل‌های AI: از نمونه‌برداری توکن تا نویز زیرساختی

تحلیل فنی جدیدی نشان می‌دهد که نوسانات در خروجی عامل‌های هوش مصنوعی تنها به دلیل تصادفی بودن مدل نیست، بلکه حاصل زنجیره‌ای از خطاهای لایه‌بندی شده است. این پژوهش تفاوت میان تصادفی…

۱ دقیقه خواندن
«امنیت رابطه‌ای»: شکافی در ارزیابی‌های فعلی که شخصی‌سازی LLMها ایجاد می‌کند

«امنیت رابطه‌ای»: شکافی در ارزیابی‌های فعلی که شخصی‌سازی LLMها ایجاد می‌کند

تحلیل جدیدی هشدار می‌دهد که شخصی‌سازی مدل‌های زبانی از طریق RAG و تنظیم دقیق، ریسک‌های «رابطه‌ای» ایجاد می‌کند که فیلترهای امنیتی استاندارد قادر به شناسایی آن‌ها نیستند. این…

۲ دقیقه خواندن
تغییر رویکرد از «دوربین» به «نقشه» در AlloSpatial؛ ارتقای ۱۸ درصدی استدلال مکانی

تغییر رویکرد از «دوربین» به «نقشه» در AlloSpatial؛ ارتقای ۱۸ درصدی استدلال مکانی

چهارچوب AlloSpatial با تبدیل دیدهای محدود به نقشه‌های جهانی، مشکل «شکنندگی مکانی» در مدل‌های چندوجهی را حل کرده است. این سیستم استدلال فضایی در مدل‌هایی مانند Qwen3-VL را تا ۱۸٪…

۱ دقیقه خواندن
کاهش نرخ توهم در تشخیص‌های پزشکی به ۳.۳٪ با معماری عامل‌محور Baichuan-M4

کاهش نرخ توهم در تشخیص‌های پزشکی به ۳.۳٪ با معماری عامل‌محور Baichuan-M4

سیستم Baichuan-M4 رویکرد هوش مصنوعی در پزشکی را از پاسخ‌های تک‌مرحله‌ای به «مراقبت مستمر» تغییر می‌دهد. این سامانه با بهره‌گیری از معماری عامل‌محور (Agentic) و آموزش تخصصی RL، نرخ…

۱ دقیقه خواندن