اخبار کوتاه روزانه

EvoNash-MARL: سیستم هوش مصنوعی با بازدهی ۱۹.۶٪ در تخصیص سهام

پژوهشگران چارچوبی مبتنی بر یادگیری تقویتی چندعامله توسعه داده‌اند که با ادغام بهینه‌سازی جمعیتی و اصول نظریه بازی، بازدهی سالانه ۱۹.۶٪ را در برابر ۱۱.۷٪ شاخص SPY به ثبت رسانده…

۱ دقیقه خواندن

تحلیل و بررسی تخصصی۲ ماه پیش

تست امنیت LLM: چرا به هر دو روش پرامپتینگ و هدایت فعال‌سازی نیاز است

پژوهشی گسترده روی ۵۵۶۸ شرایط مختلف نشان داده است که آزمایش مدل‌های زبانی تنها با یک روش، بسیاری از آسیب‌پذیری‌های مهم را از قلم می‌اندازد. معماری‌های مختلف این مدل‌ها پروفایل‌های…

۲ دقیقه خواندن

تحلیل و بررسی تخصصی۲ ماه پیش

Safe-SAIL: چارچوبی دقیق برای تفسیر ایمنی در مدل‌های زبانی بزرگ

چارچوب Safe-SAIL با استفاده از کدگذارهای خودکار پراکنده، ویژگی‌های ایمنی را در مدل‌های زبانی بزرگ شناسایی و تفسیر می‌کند. این روش هزینه تحلیل را ۵۵ درصد کاهش می‌دهد و ۱۷۵۸ ویژگی…

۱ دقیقه خواندن

آموزش کاربردی۲ ماه پیش

جی‌اف-اسکور؛ ارزیابی عدالت‌محور استحکام شبکه‌های عصبی

پژوهشگران چارچوبی به نام جی‌اف-اسکور توسعه داده‌اند که استحکام شبکه‌های عصبی را با اندازه‌گیری توزیع عادلانه حفاظت در کلاس‌های مختلف و با بهره‌گیری از ابزارهای اقتصاد رفاه ارزیابی…

۱ دقیقه خواندن

آموزش کاربردی۲ ماه پیش

پژوهشگران چارچوبی ساده برای بهبود حافظه هوش مصنوعی مکالمه‌ای پیشنهاد کردند

تیمی از پژوهشگران چارچوب جدیدی برای حافظه سیستم‌های مکالمه‌ای معرفی کرده‌اند که با شناسایی دو پدیده کلیدی به نام‌های «پراکندگی شواهد قطعی» و «افزونگی دوسطحی»، مشکلات عملکردی در…

۱ دقیقه خواندن

تحلیل و بررسی تخصصی۲ ماه پیش

گریس: انتخاب هوشمند زیرمجموعه داده برای آموزش کارآمد مدل‌های زبانی

پژوهشگران چارچوب «گریس» را معرفی کرده‌اند که با استفاده از گراف و انتخاب تطبیقی، زیرمجموعه‌های نماینده‌ای از داده‌های آموزشی را شناسایی می‌کند تا آموزش مدل‌های زبانی بزرگ را تسریع…

۱ دقیقه خواندن

آموزش کاربردی۲ ماه پیش

BID-LoRA: چارچوبی یکپارچه برای یادگیری مداوم و فراموشی ماشینی

پژوهشگران BID-LoRA را معرفی کردند؛ چارچوبی نوین که یادگیری مداوم و فراموشی ماشینی را با تنها ۵٪ به‌روزرسانی پارامترها ترکیب می‌کند و از مکانیسم‌های تطبیق دوسویه برای جلوگیری از…

۱ دقیقه خواندن

اخبار کوتاه روزانه۲ ماه پیش

نقدهای تکاملی، مشکل بازخوردهای راکد را در یادگیری عاملان هوشمند حل می‌کنند

چارچوب اکو (ECHO) یک رویکرد هم‌تکاملی معرفی می‌کند که در آن مدل‌های ناقد همراه با سیاست یادگیری تطبیق می‌یابند. این روش از راکد شدن بازخوردها جلوگیری کرده و پایداری آموزش را در…

۱ دقیقه خواندن

تحلیل و بررسی تخصصی۲ ماه پیش

روش جدید صفحه‌بندی مشارکتی برای مدیریت سرریز پنجره زمینه در مدل‌های زبانی

پژوهشگران روشی به نام «صفحه‌بندی مشارکتی» معرفی کرده‌اند که با استفاده از نشانک‌های کلمات کلیدی، مکالمات طولانی با مدل‌های زبانی را مدیریت می‌کند. این روش به مدل اجازه می‌دهد…

۱ دقیقه خواندن

اخبار کوتاه روزانه۲ ماه پیش

وب‌فکتوری: فشرده‌سازی هوش مصنوعی زبانی در عامل‌های تعاملی وب

وب‌فکتوری یک سیستم یادگیری تقویتی کاملاً خودکار و بسته معرفی کرده که دانش مدل‌های زبانی بزرگ را به رفتارهای عملی عامل‌های رابط کاربری تبدیل می‌کند. این سیستم با استفاده از حداقل…

۲ دقیقه خواندن

اخبار کوتاه روزانه۲ ماه پیش

چارچوب جدید POMDP برای کنترل دقیق تقاضای حافظه در یادگیری تقویتی

پژوهشگران چارچوبی نظری معرفی کرده‌اند که امکان طراحی دقیق محیط‌های POMDP با ساختارهای تقاضای حافظه از پیش تعیین‌شده را فراهم می‌کند. این رویکرد به محققان اجازه می‌دهد تا به‌صورت…

۱ دقیقه خواندن

تحلیل و بررسی تخصصی۲ ماه پیش

روشی تازه برای مقابله با حملات جیل‌بریک از درون مدل‌های زبانی بزرگ

پژوهشگران چارچوبی به نام ASGuard طراحی کرده‌اند که با تحلیل مسیرهای عصبی داخلی مدل‌های زبانی بزرگ، حملات جیل‌بریک مبتنی بر تغییر زمان فعل را شناسایی و خنثی می‌کند. این روش توانسته…

۲ دقیقه خواندن