
Lightning OPD: آموزش ۴ برابر سریعتر LLMs بدون سرور معلم
پژوهشگران چارچوبی به نام Lightning OPD معرفی کردهاند که فرآیند آموزش مدلهای زبانی بزرگ را بدون نیاز به سرور آنلاین معلم امکانپذیر میسازد. این روش با پیشمحاسبه احتمالات لاگ از…
دستهبندی
تحلیلهای عمیق مدلها، مقالات و بنچمارکها — پیشچاپها، ارزیابیها، مدلهای زبانی پیشرو و پژوهش همراستاسازی.
۱٬۶۲۹ مقاله منتشر شده

پژوهشگران چارچوبی به نام Lightning OPD معرفی کردهاند که فرآیند آموزش مدلهای زبانی بزرگ را بدون نیاز به سرور آنلاین معلم امکانپذیر میسازد. این روش با پیشمحاسبه احتمالات لاگ از…

پژوهشگران در بررسی جامعی، توهمهای مدلهای زبانی بزرگ ویدیویی را در دو دسته اصلی طبقهبندی کردهاند: تحریف پویا و ساخت محتوای دروغین. آنها ریشه این مشکلات را در ضعف نمایش زمانی و…

تیمی از پژوهشگران روش «همترازی معنایی زبانآگنوستیک» (LASA) را توسعه دادهاند که مکانیزمهای ایمنی هوش مصنوعی را به جای متن سطحی، در فضای معنایی مستقل از زبان verankert میکند.…

پژوهشگران از محاسبات تکاملی مبتنی بر مدلهای زبانی بزرگ برای بهینهسازی پرسوجوهای حدس رمز عبور استفاده کردند. این روش نرخ شکستن رمز را از ۲.۰۲ درصد به ۸.۴۸ درصد افزایش داد. نتایج…

پژوهشگان نشان دادند مدلهای زبانی بزرگ عمومی میتوانند دادههای پرونده الکترونیک سلامت را با کیفیتی مشابه مدلهای تخصصی حوزه پزشکی رمزگذاری کنند. این رویکرد با تبدیل کدهای پزشکی…

پژوهشگران چارچوبی نوین برای انتقال دانش از مدلهای زبانی بزرگ به سیستمهای نمادین توسعه دادهاند. این رویکرد ترکیبی با بهرهگیری از ماشینهای تسِتلین، شفافیت کامل را با درک معنایی…

پژوهشگران معیار EgoEsportsQA را معرفی کردهاند که برای سنجش عملکرد مدلهای ویدئویی-زبانی در محیطهای سریع و مبتنی بر قوانین ورزشهای الکترونیکی طراحی شده است. این مجموعه داده شامل…

پژوهشگران چارچوبی به نام EmergentBridge معرفی کردهاند که انتقال یادگیری صفر-نمونهای میان حالتهای جفتنشده را در مدلهای تعبیهی چندحالتی یکپارچه بهبود میبخشد. این روش نیازی به…

پژوهشگران روش 'StsPatient' را معرفی کردهاند؛ سیستمی برای شبیهسازی دقیق بیماران استاندارد با اختلال شناختی. این روش از مدولاسیون تصادفی توکن و بردارهای هدایت برای کنترل دقیق شدت…

پژوهشگران مؤسسه فناوری بمبئی چارچوبی به نام RePAIR توسعه دادهاند که به کاربران امکان میدهد بدون نیاز به مداخله ارائهدهندگان سرویس، دانش ناخواسته را از مدلهای زبانی بزرگ حذف…

پژوهشگران روش جدید «پیشآموزش زنجیرهای مدلها» را معرفی کردهاند که با انتقال دانش از مدلهای کوچک به بزرگ، سرعت آموزش مدلهای بینایی را تا ۷.۰۹ برابر افزایش میدهد. این رویکرد…

کوموآرافام-۲ یک مدل پایه از پیش آموزشدیده برای دادههای رابطهای است که در ۴۱ معیار عملکردی، تا ۸ درصد بهتر از روشهای نظارتی عمل میکند. این مدل از یادگیری درونمتنی و تنظیم…