
EvoNash-MARL: سیستم هوش مصنوعی با بازدهی ۱۹.۶٪ در تخصیص سهام
پژوهشگران چارچوبی مبتنی بر یادگیری تقویتی چندعامله توسعه دادهاند که با ادغام بهینهسازی جمعیتی و اصول نظریه بازی، بازدهی سالانه ۱۹.۶٪ را در برابر ۱۱.۷٪ شاخص SPY به ثبت رسانده…
دستهبندی
بهروزرسانیهای کوتاه و سریع: عرضهها، شراکتها، سرمایهگذاری، قوانین و اخبار سختافزار. نبض پنجدقیقهای صبح.
۱٬۳۵۰ مقاله منتشر شده

پژوهشگران چارچوبی مبتنی بر یادگیری تقویتی چندعامله توسعه دادهاند که با ادغام بهینهسازی جمعیتی و اصول نظریه بازی، بازدهی سالانه ۱۹.۶٪ را در برابر ۱۱.۷٪ شاخص SPY به ثبت رسانده…

پژوهشی گسترده روی ۵۵۶۸ شرایط مختلف نشان داده است که آزمایش مدلهای زبانی تنها با یک روش، بسیاری از آسیبپذیریهای مهم را از قلم میاندازد. معماریهای مختلف این مدلها پروفایلهای…

چارچوب Safe-SAIL با استفاده از کدگذارهای خودکار پراکنده، ویژگیهای ایمنی را در مدلهای زبانی بزرگ شناسایی و تفسیر میکند. این روش هزینه تحلیل را ۵۵ درصد کاهش میدهد و ۱۷۵۸ ویژگی…

پژوهشگران چارچوبی به نام جیاف-اسکور توسعه دادهاند که استحکام شبکههای عصبی را با اندازهگیری توزیع عادلانه حفاظت در کلاسهای مختلف و با بهرهگیری از ابزارهای اقتصاد رفاه ارزیابی…

تیمی از پژوهشگران چارچوب جدیدی برای حافظه سیستمهای مکالمهای معرفی کردهاند که با شناسایی دو پدیده کلیدی به نامهای «پراکندگی شواهد قطعی» و «افزونگی دوسطحی»، مشکلات عملکردی در…

پژوهشگران چارچوب «گریس» را معرفی کردهاند که با استفاده از گراف و انتخاب تطبیقی، زیرمجموعههای نمایندهای از دادههای آموزشی را شناسایی میکند تا آموزش مدلهای زبانی بزرگ را تسریع…

پژوهشگران BID-LoRA را معرفی کردند؛ چارچوبی نوین که یادگیری مداوم و فراموشی ماشینی را با تنها ۵٪ بهروزرسانی پارامترها ترکیب میکند و از مکانیسمهای تطبیق دوسویه برای جلوگیری از…

چارچوب اکو (ECHO) یک رویکرد همتکاملی معرفی میکند که در آن مدلهای ناقد همراه با سیاست یادگیری تطبیق مییابند. این روش از راکد شدن بازخوردها جلوگیری کرده و پایداری آموزش را در…

پژوهشگران روشی به نام «صفحهبندی مشارکتی» معرفی کردهاند که با استفاده از نشانکهای کلمات کلیدی، مکالمات طولانی با مدلهای زبانی را مدیریت میکند. این روش به مدل اجازه میدهد…

وبفکتوری یک سیستم یادگیری تقویتی کاملاً خودکار و بسته معرفی کرده که دانش مدلهای زبانی بزرگ را به رفتارهای عملی عاملهای رابط کاربری تبدیل میکند. این سیستم با استفاده از حداقل…

پژوهشگران چارچوبی نظری معرفی کردهاند که امکان طراحی دقیق محیطهای POMDP با ساختارهای تقاضای حافظه از پیش تعیینشده را فراهم میکند. این رویکرد به محققان اجازه میدهد تا بهصورت…

پژوهشگران چارچوبی به نام ASGuard طراحی کردهاند که با تحلیل مسیرهای عصبی داخلی مدلهای زبانی بزرگ، حملات جیلبریک مبتنی بر تغییر زمان فعل را شناسایی و خنثی میکند. این روش توانسته…