تحلیل و بررسی تخصصی

Lightning OPD: آموزش ۴ برابر سریع‌تر LLMs بدون سرور معلم

پژوهشگران چارچوبی به نام Lightning OPD معرفی کرده‌اند که فرآیند آموزش مدل‌های زبانی بزرگ را بدون نیاز به سرور آنلاین معلم امکان‌پذیر می‌سازد. این روش با پیش‌محاسبه احتمالات لاگ از…

تحلیل و بررسی تخصصی۲ ماه پیش

توهم در مدل‌های زبانی ویدیویی: تحریف اطلاعات یا ساخت محتوای جعلی؟

پژوهشگران در بررسی جامعی، توهم‌های مدل‌های زبانی بزرگ ویدیویی را در دو دسته اصلی طبقه‌بندی کرده‌اند: تحریف پویا و ساخت محتوای دروغین. آنها ریشه این مشکلات را در ضعف نمایش زمانی و…

۱ دقیقه خواندن

تحلیل و بررسی تخصصی۲ ماه پیش

روش جدید برای بهبود ایمنی هوش مصنوعی در همه زبان‌ها

تیمی از پژوهشگران روش «هم‌ترازی معنایی زبان‌آگنوستیک» (LASA) را توسعه داده‌اند که مکانیزم‌های ایمنی هوش مصنوعی را به جای متن سطحی، در فضای معنایی مستقل از زبان verankert می‌کند.…

۱ دقیقه خواندن

آموزش کاربردی۲ ماه پیش

بهینه‌سازی پرس‌وجو با هوش مصنوعی، نرخ شکستن رمز عبور را چهار برابر کرد

پژوهشگران از محاسبات تکاملی مبتنی بر مدل‌های زبانی بزرگ برای بهینه‌سازی پرس‌وجوهای حدس رمز عبور استفاده کردند. این روش نرخ شکستن رمز را از ۲.۰۲ درصد به ۸.۴۸ درصد افزایش داد. نتایج…

۱ دقیقه خواندن

آموزش کاربردی۲ ماه پیش

مدل‌های زبانی بزرگ در ۱۵ وظیفه پیش‌بینی بالینی برابر با مدل‌های تخصصی عمل کردند

پژوهشگان نشان دادند مدل‌های زبانی بزرگ عمومی می‌توانند داده‌های پرونده الکترونیک سلامت را با کیفیتی مشابه مدل‌های تخصصی حوزه پزشکی رمزگذاری کنند. این رویکرد با تبدیل کدهای پزشکی…

۱ دقیقه خواندن

آموزش کاربردی۲ ماه پیش

انتقال دانش مدل‌های زبانی بزرگ به ماشین‌های تسِتلین

پژوهشگران چارچوبی نوین برای انتقال دانش از مدل‌های زبانی بزرگ به سیستم‌های نمادین توسعه داده‌اند. این رویکرد ترکیبی با بهره‌گیری از ماشین‌های تسِتلین، شفافیت کامل را با درک معنایی…

۱ دقیقه خواندن

تحلیل و بررسی تخصصی۲ ماه پیش

معیار جدید ارزیابی درک ویدئویی هوش مصنوعی در ورزش‌های الکترونیکی پرسرعت

پژوهشگران معیار EgoEsportsQA را معرفی کرده‌اند که برای سنجش عملکرد مدل‌های ویدئویی-زبانی در محیط‌های سریع و مبتنی بر قوانین ورزش‌های الکترونیکی طراحی شده است. این مجموعه داده شامل…

۱ دقیقه خواندن

تحلیل و بررسی تخصصی۲ ماه پیش

EmergentBridge: گامی نوین در انتقال بدون نمونه میان‌حالتی

پژوهشگران چارچوبی به نام EmergentBridge معرفی کرده‌اند که انتقال یادگیری صفر-نمونه‌ای میان حالت‌های جفت‌نشده را در مدل‌های تعبیه‌ی چندحالتی یکپارچه بهبود می‌بخشد. این روش نیازی به…

۱ دقیقه خواندن

آموزش کاربردی۲ ماه پیش

شبیه‌سازی بیماران استاندارد مبتلا به اختلال شناختی با روش هدایت تصادفی

پژوهشگران روش 'StsPatient' را معرفی کرده‌اند؛ سیستمی برای شبیه‌سازی دقیق بیماران استاندارد با اختلال شناختی. این روش از مدولاسیون تصادفی توکن و بردارهای هدایت برای کنترل دقیق شدت…

۱ دقیقه خواندن

تحلیل و بررسی تخصصی۲ ماه پیش

RePAIR: چارچوبی برای حذف دانش ناخواسته از مدل‌های زبانی بزرگ

پژوهشگران مؤسسه فناوری بمبئی چارچوبی به نام RePAIR توسعه داده‌اند که به کاربران امکان می‌دهد بدون نیاز به مداخله ارائه‌دهندگان سرویس، دانش ناخواسته را از مدل‌های زبانی بزرگ حذف…

۲ دقیقه خواندن

تحلیل و بررسی تخصصی۲ ماه پیش

CoM-PT: روشی نوین برای تسریع آموزش مدل‌های بنیادین بینایی

پژوهشگران روش جدید «پیش‌آموزش زنجیره‌ای مدل‌ها» را معرفی کرده‌اند که با انتقال دانش از مدل‌های کوچک به بزرگ، سرعت آموزش مدل‌های بینایی را تا ۷.۰۹ برابر افزایش می‌دهد. این رویکرد…

۲ دقیقه خواندن

تحلیل و بررسی تخصصی۲ ماه پیش

کوموآراف‌ام-۲: مدل پایه روش‌های نظارتی را شکست داد

کوموآراف‌ام-۲ یک مدل پایه از پیش آموزش‌دیده برای داده‌های رابطه‌ای است که در ۴۱ معیار عملکردی، تا ۸ درصد بهتر از روش‌های نظارتی عمل می‌کند. این مدل از یادگیری درون‌متنی و تنظیم…

۱ دقیقه خواندن