
چالشهای سیستمهای استدلال ریاضی چندوجهی بررسی شد
یک مرور جامع به وضعیت استدلال ریاضی چندوجهی پرداخته و مشکلات اصلی این حوزه را شناسایی کرده است. از مهمترین چالشهای مطرحشده میتوان به misinterpretation نمودارها، عدم تطابق…
دستهبندی
تحلیلهای عمیق مدلها، مقالات و بنچمارکها — پیشچاپها، ارزیابیها، مدلهای زبانی پیشرو و پژوهش همراستاسازی.
۱٬۶۳۳ مقاله منتشر شده

یک مرور جامع به وضعیت استدلال ریاضی چندوجهی پرداخته و مشکلات اصلی این حوزه را شناسایی کرده است. از مهمترین چالشهای مطرحشده میتوان به misinterpretation نمودارها، عدم تطابق…

محققان مجموعه داده INDOTABVQA را با ۱٬۵۹۳ تصویر سند به زبان باهاسا اندونزی و پرسشوپاسخهای چندزبانه منتشر کردند. این معیار برای آزمون مدلهای بینایی-زبانی در درک متقابل جداول…

پژوهشگران چارچوبی نظری معرفی کردهاند که امکان طراحی دقیق محیطهای POMDP با ساختارهای تقاضای حافظه از پیش تعیینشده را فراهم میکند. این رویکرد به محققان اجازه میدهد تا بهصورت…

پژوهشگران چارچوبی به نام ASGuard طراحی کردهاند که با تحلیل مسیرهای عصبی داخلی مدلهای زبانی بزرگ، حملات جیلبریک مبتنی بر تغییر زمان فعل را شناسایی و خنثی میکند. این روش توانسته…

تیمی از محققان روش آموزشی جدیدی به نام «بهینهسازی خطمشی آگاه از کالیبراسیون» (CAPO) معرفی کردهاند که مشکل اعتماد بیش از حد مدلهای زبانی بزرگ را حل میکند. این روش بدون کاهش…

پژوهشی جدید نشان میدهد که تکنیکهای پسآموزش، سرهای توجه تخصصی را در مدلهای هوش مصنوعی پدید میآورند که استدلال پیچیده را ممکن میسازند، اما در عوض دقت محاسبات ساده را کاهش…

دوکسیکر یک چارچوب آموزشی دو مرحلهای برای مدلهای زبانی چندوجهی ارائه میدهد که اسناد طولانی را از طریق سه مرحله تحلیل، محلیسازی و استدلال پردازش میکند. این روش با مشکلات نسبت…

پژوهشگران چارچوبی نوین به نام TimeSAF توسعه دادهاند که محدودیتهای اساسی مدلهای زبانی بزرگ در پیشبینی سریهای زمانی را برطرف میکند. این روش با جداسازی یادگیری ویژگیهای…

پژوهشی تازه منتشر شده در arxiv.org از چارچوب ارزیابی جدیدی به نام IFEval++ رونمایی کرده که «اعتمادپذیری ظریفمحور» در مدلهای زبانی را میسنجد. بررسی ۴۶ مدل نشان داده که عملکرد…

پژوهشگران معیار RT-LRM را برای ارزیابی صداقت، امنیت و کارایی مدلهای استدلالی بزرگ پیشنهاد کردهاند. یافتهها نشان میدهد این مدلها در مقایسه با مدلهای زبانی معمولی، با چالشهای…

پژوهشگران روش «رمزگشایی از طریق اختلال» (DeP) را معرفی کردهاند که بدون نیاز به آموزش مجدد، توهمات مدلهای زبانی چندوجهی را کاهش میدهد. این روش با اعمال مداخلات متنی کنترلشده در…

پژوهشگران در نخستین مطالعه جامع، نزدیک به ۱۷۰۰۰ اجرای عامل هوش مصنوعی را بررسی کردند. یافتهها نشان داد که برنامههای ساختارمند عملکرد را بهبود میبخشند، اما برنامههای ضعیف…