
غلبه مدل ۰.۳ میلیارد پارامتری GLiNER2-PII بر فیلتر حریم خصوصی OpenAI
پژوهشگران مدل GLiNER2-PII را معرفی کردند؛ یک مدل کوچک ۰.۳ میلیارد پارامتری که در شناسایی اطلاعات حساس (PII) از فیلتر OpenAI پیشی گرفته است. این دستاورد از طریق یک خط لولهی تولید…
دستهبندی
تحلیلهای عمیق مدلها، مقالات و بنچمارکها — پیشچاپها، ارزیابیها، مدلهای زبانی پیشرو و پژوهش همراستاسازی.
۱٬۶۶۲ مقاله منتشر شده

پژوهشگران مدل GLiNER2-PII را معرفی کردند؛ یک مدل کوچک ۰.۳ میلیارد پارامتری که در شناسایی اطلاعات حساس (PII) از فیلتر OpenAI پیشی گرفته است. این دستاورد از طریق یک خط لولهی تولید…

چارچوب G-Zero با حذف نیاز به مدلهای داور خارجی، امکان تکامل خودکار مدلهای زبانی در وظایف باز را فراهم میکند. این سیستم از طریق سازوکار Hint-δ، نقاط کور مدل را شناسایی کرده و…

الگوریتم TPAW با جایگزینی نظارت انسانی با یک چارچوب رقابتی تیمی میان نسخههای مختلف مدل، پایداری همراستاسازی را افزایش میدهد. این روش با استفاده از وزندهی تطبیقی، مشکل تقویت…

PruneTIR چارچوبی جدید برای بهینهسازی زمان استنتاج است که با حذف مسیرهای اشتباه و بازنمونهبرداری از تلاشهای شکستخورده، دقت استفاده از ابزارها در مدلهای زبانی را افزایش میدهد.…

پژوهشگران چارچوب جدیدی به نام HGC-Det معرفی کردهاند که با بهرهگیری از فضای هایپربولیک، ادغام دادههای تصویری و ابر نقاط را در تشخیص اشیاء سهبعدی بهینه میکند. این روش با کاهش…

پژوهشگران چارچوب NaiAD را معرفی کردند؛ مجموعهدادهای با ۵۹ هزار نمونه برای بهینهسازی تبلیغات بومی در مدلهای زبانی. این سیستم چهار استراتژی معنایی را شناسایی کرده است که اجازه…

یک مدل یادگیری عمیق جدید توانسته است با تحلیل سیگنالهای خام صوتی، افسردگی و اضطراب را با حساسیت و ویژگی ۷۱ درصدی تشخیص دهد. این دستاورد نشان میدهد نشانگرهای زیستی صوتی مستقل از…

پژوهشگران دریافتند که ترنسفورمرهای با مقداردهی اولیه تصادفی میتوانند در تشخیص مراحل خواب از مدلهای آموزشدیده بهتر عمل کنند. این یافته نشان میدهد که سوگیری استقرایی معماری، و…

پژوهشگران پدیدهای به نام «تأمل کاذب» را شناسایی کردهاند که در آن مدلهای زبانی استدلالهای منطقی میسازند اما در عمل برخلاف آن ارزشها رفتار میکنند. چارچوب جدید VALDI نشان…

پژوهشگران «دیوار هندسی» جدیدی را کشف کردهاند که مانع از بازسازی کامل فعالسازهای مدل توسط اتوانکودرهای پراکنده (SAE) میشود. این مطالعه نشان میدهد که انحنا و ابعاد ذاتی منیفولدِ…

سیستم جدید حافظهی وظایف mnemopay با استفاده از پروتکل MCP، امکان یادآوری موفقیتها و شکستهای پیشین را برای عاملهای هوش مصنوعی فراهم میکند. این رویکرد میتواند فراخوانیهای…

مدلهای زبانی بزرگ چندوجهی (MLLM) به جای استدلال بصری واقعی، از یک «میانبر دکارتی» برای تقلب در بنچمارکها استفاده میکنند. بنچمارک جدید Polaris-Bench نشان میدهد که با تغییر…