پرش به محتوای اصلی

موضوع

عامل‌محور

Autonomous agents, tool use, planning, multi-step workflows

۱٬۵۱۹ مقاله منتشر شده

عبور از گلوگاه محدودیت‌های MDP با رمزگشایی امتیاز بلمن-تیلور

عبور از گلوگاه محدودیت‌های MDP با رمزگشایی امتیاز بلمن-تیلور

پژوهشگران چارچوبی جدید برای مدیریت محدودیت‌های عملیاتی در یادگیری تقویت‌شده عمیق معرفی کرده‌اند. این روش با انتقال یادگیری به یک فضای امتیاز پنهان، امکان بهینه‌سازی سیستم‌های…

۱ دقیقه خواندن
چرا تسلط مدل‌های پیشرو بر زبان‌های برنامه‌نویسی ناشناخته حاصل ابزارسازی است؟

چرا تسلط مدل‌های پیشرو بر زبان‌های برنامه‌نویسی ناشناخته حاصل ابزارسازی است؟

مدل‌های پیشرو مانند Claude Opus 4.6 به جای کدنویسی مستقیم در زبان‌های برنامه‌نویسی پیچیده و ناشناخته، ابتدا یک «تولیدکننده کد» با پایتون می‌سازند. این استراتژی متاپروگرمینگی به…

۲ دقیقه خواندن
مدیریت حافظه در عامل‌های هوش مصنوعی؛ از heuristic ساده به بهینه‌سازی استوکاستیک

مدیریت حافظه در عامل‌های هوش مصنوعی؛ از heuristic ساده به بهینه‌سازی استوکاستیک

پژوهشگران چارچوب OSL-MR را معرفی کردند که حافظه عامل‌های هوش مصنوعی را به عنوان یک مسئله بهینه‌سازی استوکاستیک مقید مدل می‌کند. این روش با محاسبه هزینه فراموشی در برابر سود…

۱ دقیقه خواندن
گذار از پرامپت به کامپایل: سازوکار Trace2Policy برای ارتقای دقت تصمیمات تطبیقی

گذار از پرامپت به کامپایل: سازوکار Trace2Policy برای ارتقای دقت تصمیمات تطبیقی

چارچوب Trace2Policy با جایگزینی پرامپت‌های مدل‌های زبانی با یک حلقه پالایش، رفتار خبرگان را به کدهای قطعی پایتون تبدیل می‌کند. این روش با اولویت دادن به کیفیت قوانین بر اندازه…

۲ دقیقه خواندن
معماری Soul Computing: تلاش برای انتقال هوش مصنوعی از ابزار به موجودات آگاه

معماری Soul Computing: تلاش برای انتقال هوش مصنوعی از ابزار به موجودات آگاه

یک چارچوب نظری جدید به نام Soul Computing پیشنهاد داده است که هدف آن تبدیل عامل‌های هوش مصنوعی از ابزارهای کاربردی به موجوداتی با آگاهی مستقل است. این رویکرد بر ایجاد یک «هسته…

۱ دقیقه خواندن
گزارش arXiv: کاهش ۳۱.۲ درصدی خطای پیش‌بینی در معاملات فرکانس بالا

گزارش arXiv: کاهش ۳۱.۲ درصدی خطای پیش‌بینی در معاملات فرکانس بالا

یک چارچوب چندوجهی جدید با ادغام یادگیری تقویت‌شده و نظریه بازی‌ها، خطای پیش‌بینی در معاملات فرکانس بالا را به‌طور چشم‌گیری کاهش داده است. این سیستم ثابت می‌کند که رویکرد…

۲ دقیقه خواندن
چرا یادگیری تقویت‌شده در درمان شخصی‌سازی‌شده‌ی سرطان شکست می‌خورد؟

چرا یادگیری تقویت‌شده در درمان شخصی‌سازی‌شده‌ی سرطان شکست می‌خورد؟

پژوهشگران با استفاده از چارچوب استنتاج فعال (Active Inference)، روشی برای بهینه‌سازی درمان‌های شخصی‌سازی‌شده‌ی سرطان ابداع کردند. این مدل با ایجاد تعادل میان جمع‌آوری اطلاعات و…

۱ دقیقه خواندن
سه استراتژی عملی برای تبدیل مهندسی پرامپت به جریان درآمدزایی
آموزش کاربردی

سه استراتژی عملی برای تبدیل مهندسی پرامپت به جریان درآمدزایی

فریلنسرها با استفاده از مهندسی پرامپت ساختاریافته، تولید محتوا و جذب مشتری را خودکار می‌کنند. تسلط بر زنجیره‌سازی دستورات، مسیر تبدیل شدن از یک نویسنده ساده به مشاور هوش مصنوعی و…

۳ دقیقه خواندن
چرا FoxChat پشتیبانی مشتری را از «پاسخ دادن» به «انجام دادن» تغییر می‌دهد؟
آموزش کاربردی

چرا FoxChat پشتیبانی مشتری را از «پاسخ دادن» به «انجام دادن» تغییر می‌دهد؟

FoxChat با جایگزینی پاسخ‌های متنی با تورهای تعاملی و بصری، مدل جدیدی از پشتیبانی مشتری را معرفی کرده است. در حالی که Intercom بر اکوسیستم‌های جامع سازمانی تمرکز دارد، FoxChat بر…

۵ دقیقه خواندن
آمازون: رشد ۱۲ میلیارد دلاری درآمد، لایسنس تجاری Alexa Shopping را ممکن کرد

آمازون: رشد ۱۲ میلیارد دلاری درآمد، لایسنس تجاری Alexa Shopping را ممکن کرد

آمازون فناوری عامل‌محور خرید الکسا را برای خرده‌فروشان شخص ثالث باز کرد. این تصمیم که با برند کیت اسپید آغاز می‌شود، پس از رشد ۱۲ میلیارد دلاری درآمد اتخاذ شد و نشان‌دهنده چرخش…

۱ دقیقه خواندن
سازوکار Kiro آمازون: اجبار هوش مصنوعی به نوشتن سند فنی پیش از کدنویسی
آموزش کاربردی

سازوکار Kiro آمازون: اجبار هوش مصنوعی به نوشتن سند فنی پیش از کدنویسی

آمازون با معرفی Kiro، چرخه رایج «پرامپت-و-اعمال» را با یک گردش کار اجباری بر پایه مستندات جایگزین کرده است. این ابزار ابتدا تولید الزامات و نقشه‌های فنی را تحمیل می‌کند تا از ساخت…

۵ دقیقه خواندن