
سازوکار MAGE: تکامل عاملهای هوش مصنوعی بدون بهروزرسانی وزنهای مدل
چارچوب MAGE با معرفی گرافهای دانش تکاملی، به عاملهای هوش مصنوعی اجازه میدهد بدون تغییر در وزنهای مدل، از شکستها و موفقیتهای خود بیاموزند. این سیستم در ۹ بنچمارک مختلف، از…
دستهبندی
تحلیلهای عمیق مدلها، مقالات و بنچمارکها — پیشچاپها، ارزیابیها، مدلهای زبانی پیشرو و پژوهش همراستاسازی.
۱٬۶۵۸ مقاله منتشر شده

چارچوب MAGE با معرفی گرافهای دانش تکاملی، به عاملهای هوش مصنوعی اجازه میدهد بدون تغییر در وزنهای مدل، از شکستها و موفقیتهای خود بیاموزند. این سیستم در ۹ بنچمارک مختلف، از…

پژوهشگران چارچوب GW-Eyes را معرفی کردند؛ سیستمی عاملمحور که با استفاده از مدلهای زبانی بزرگ، پیوند میان امواج گرانشی و همتایهای الکترومغناطیسی آنها را خودکار میکند. این…

چارچوب جدیدی به نام Metis با استفاده از یک حلقه فراشناختی تکاملی، توانسته است با نرخ موفقیت ۸۹.۲ درصد از سدهای امنیتی مدلهای پیشرو عبور کند. این سیستم بهطور ویژه مدلهای GPT-5 و…

پژوهشگران با معرفی بنچمارک SenseBench دریافتند که مدلهای بینایی-زبانی در تحلیل تصاویر ماهوارهای دچار «توهم روانی» هستند. این مدلها توصیفاتی بسیار متقاعدکننده اما از نظر فیزیکی…

پژوهشگران پروتکل سختگیرانه Acceptance Cards را برای تأیید دفاعهای تنظیم دقیق معرفی کردند. نتایج اولیه نشان میدهد SafeLoRA در مدل Gemma-2-2B-it شکست خورده و ادعاهای ایمنی فعلی…

پژوهشگران با معرفی بنچمارک ThreatCore نشان دادند که مدلهای زبانی بزرگ در شناسایی تهدیدات غیرمستقیم ضعف شدیدی دارند. این مطالعه پیشنهاد میکند که استفاده از برچسبگذاری نقش معنایی…

پژوهشگران چارچوب جدیدی برای رفع عدم توازن کلاسها در هوش مصنوعی چندوجهی معرفی کردهاند. این مدل با وزندهی پویا به منابع داده، سوگیری به سمت کلاسهای اکثریت را کاهش و دقت شناسایی…

پژوهشگران با معرفی مدل HH-SAE توانستند با تفکیک دادهها به سه سطح زمینهای، اتمی و ترکیبی، دقت تشخیص کلاهبرداری را به ۰.۹۱۵۶ برسانند. این مدل با حل مشکل «تضاد تراکم ویژگیها»،…

پژوهش جدید StereoTales نشان میدهد تمام مدلهای زبانی بزرگ، بدون توجه به اندازه یا سازنده، در تولید داستانهای باز، کلیشههای مضر اجتماعی را بازتولید میکنند. این سوگیریها ایستا…

چارچوب جدید FairDRO با هدف قرار دادن «شکستهای پنهان درونگروهی»، دقت مدلهای بخشبندی تصاویر پزشکی را در بدترین سناریوها تا ۷.۴٪ بهبود بخشیده است. این رویکرد بهجای تکیه بر…

مدل جدید IMDM با معرفی ماسکهای تصادفی، محدودیتهای نظری تولید سریع در مدلهای انتشار ماسکدار (MDM) را از بین برد. این دستاورد باعث افزایش چشمگیر سرعت نمونهبرداری بدون کاهش…

پژوهشگران با جایگزینی شبیهسازیهای کند مونتکارلو با تحلیل دسترسی مبتنی بر زونوتوپهای چندجملهای، زمان تأیید سختافزارهای هوش مصنوعی آنالوگ را بهشدت کاهش دادهاند. این روش…