تحلیل و بررسی تخصصی

چالش‌های سیستم‌های استدلال ریاضی چندوجهی بررسی شد

یک مرور جامع به وضعیت استدلال ریاضی چندوجهی پرداخته و مشکلات اصلی این حوزه را شناسایی کرده است. از مهم‌ترین چالش‌های مطرح‌شده می‌توان به misinterpretation نمودارها، عدم تطابق…

۱ دقیقه خواندن

تحلیل و بررسی تخصصی۲ ماه پیش

ارزیابی جدید: مدل‌های هوش مصنوعی در درک جداول اسناد اندونزیایی

محققان مجموعه داده INDOTABVQA را با ۱٬۵۹۳ تصویر سند به زبان باهاسا اندونزی و پرسش‌وپاسخ‌های چندزبانه منتشر کردند. این معیار برای آزمون مدل‌های بینایی-زبانی در درک متقابل جداول…

۱ دقیقه خواندن

اخبار کوتاه روزانه۲ ماه پیش

چارچوب جدید POMDP برای کنترل دقیق تقاضای حافظه در یادگیری تقویتی

پژوهشگران چارچوبی نظری معرفی کرده‌اند که امکان طراحی دقیق محیط‌های POMDP با ساختارهای تقاضای حافظه از پیش تعیین‌شده را فراهم می‌کند. این رویکرد به محققان اجازه می‌دهد تا به‌صورت…

۱ دقیقه خواندن

تحلیل و بررسی تخصصی۲ ماه پیش

روشی تازه برای مقابله با حملات جیل‌بریک از درون مدل‌های زبانی بزرگ

پژوهشگران چارچوبی به نام ASGuard طراحی کرده‌اند که با تحلیل مسیرهای عصبی داخلی مدل‌های زبانی بزرگ، حملات جیل‌بریک مبتنی بر تغییر زمان فعل را شناسایی و خنثی می‌کند. این روش توانسته…

۲ دقیقه خواندن

تحلیل و بررسی تخصصی۲ ماه پیش

محققان روش «کاپو» را برای رفع اعتماد بیش از حد مدل‌های زبانی ارائه دادند

تیمی از محققان روش آموزشی جدیدی به نام «بهینه‌سازی خط‌مشی آگاه از کالیبراسیون» (CAPO) معرفی کرده‌اند که مشکل اعتماد بیش از حد مدل‌های زبانی بزرگ را حل می‌کند. این روش بدون کاهش…

۱ دقیقه خواندن

تحلیل و بررسی تخصصی۲ ماه پیش

ظهور سرهای توجه تخصصی در مدل‌های استدلالی از طریق پس‌آموزش

پژوهشی جدید نشان می‌دهد که تکنیک‌های پس‌آموزش، سرهای توجه تخصصی را در مدل‌های هوش مصنوعی پدید می‌آورند که استدلال پیچیده را ممکن می‌سازند، اما در عوض دقت محاسبات ساده را کاهش…

۲ دقیقه خواندن

تحلیل و بررسی تخصصی۲ ماه پیش

دوک‌سیکر: روشی نوین برای تحلیل هوشمند اسناد بلند با استدلال بصری

دوک‌سیکر یک چارچوب آموزشی دو مرحله‌ای برای مدل‌های زبانی چندوجهی ارائه می‌دهد که اسناد طولانی را از طریق سه مرحله تحلیل، محلی‌سازی و استدلال پردازش می‌کند. این روش با مشکلات نسبت…

۱ دقیقه خواندن

آموزش کاربردی۲ ماه پیش

TimeSAF: ادغام ناهمگام معنایی برای پیش‌بینی سری‌های زمانی

پژوهشگران چارچوبی نوین به نام TimeSAF توسعه داده‌اند که محدودیت‌های اساسی مدل‌های زبانی بزرگ در پیش‌بینی سری‌های زمانی را برطرف می‌کند. این روش با جداسازی یادگیری ویژگی‌های…

۱ دقیقه خواندن

تحلیل و بررسی تخصصی۲ ماه پیش

تحقیق جدید: عملکرد مدل‌های زبانی با تغییرات ظریف در پرامپت تا ۶۱.۸٪ کاهش می‌یابد

پژوهشی تازه منتشر شده در arxiv.org از چارچوب ارزیابی جدیدی به نام IFEval++ رونمایی کرده که «اعتمادپذیری ظریف‌محور» در مدل‌های زبانی را می‌سنجد. بررسی ۴۶ مدل نشان داده که عملکرد…

۱ دقیقه خواندن

تحلیل و بررسی تخصصی۲ ماه پیش

تست نفوذ مدل‌های استدلالی بزرگ: معیاری تازه برای سنجش اعتمادپذیری

پژوهشگران معیار RT-LRM را برای ارزیابی صداقت، امنیت و کارایی مدل‌های استدلالی بزرگ پیشنهاد کرده‌اند. یافته‌ها نشان می‌دهد این مدل‌ها در مقایسه با مدل‌های زبانی معمولی، با چالش‌های…

۲ دقیقه خواندن

تحلیل و بررسی تخصصی۲ ماه پیش

روشی بدون آموزش مجدد برای کاهش توهم در مدل‌های زبانی چندوجهی

پژوهشگران روش «رمزگشایی از طریق اختلال» (DeP) را معرفی کرده‌اند که بدون نیاز به آموزش مجدد، توهمات مدل‌های زبانی چندوجهی را کاهش می‌دهد. این روش با اعمال مداخلات متنی کنترل‌شده در…

۱ دقیقه خواندن

اخبار کوتاه روزانه۲ ماه پیش

آیا عوامل هوش مصنوعی برنامه‌ها را دنبال می‌کنند؟

پژوهشگران در نخستین مطالعه جامع، نزدیک به ۱۷۰۰۰ اجرای عامل هوش مصنوعی را بررسی کردند. یافته‌ها نشان داد که برنامه‌های ساختارمند عملکرد را بهبود می‌بخشند، اما برنامه‌های ضعیف…

۲ دقیقه خواندن