تحلیل و بررسی تخصصی

غلبه مدل ۰.۳ میلیارد پارامتری GLiNER2-PII بر فیلتر حریم خصوصی OpenAI

پژوهشگران مدل GLiNER2-PII را معرفی کردند؛ یک مدل کوچک ۰.۳ میلیارد پارامتری که در شناسایی اطلاعات حساس (PII) از فیلتر OpenAI پیشی گرفته است. این دستاورد از طریق یک خط لوله‌ی تولید…

تحلیل و بررسی تخصصی۲ ماه پیش

چرا G-Zero نیاز به مدل‌های داور را در تکامل خودکار هوش مصنوعی حذف می‌کند؟

چارچوب G-Zero با حذف نیاز به مدل‌های داور خارجی، امکان تکامل خودکار مدل‌های زبانی در وظایف باز را فراهم می‌کند. این سیستم از طریق سازوکار Hint-δ، نقاط کور مدل را شناسایی کرده و…

۲ دقیقه خواندن

تحلیل و بررسی تخصصی۲ ماه پیش

سازوکار TPAW: حذف وابستگی به داده‌های انسانی در همراستاسازی مدل‌های زبانی

الگوریتم TPAW با جایگزینی نظارت انسانی با یک چارچوب رقابتی تیمی میان نسخه‌های مختلف مدل، پایداری همراستاسازی را افزایش می‌دهد. این روش با استفاده از وزن‌دهی تطبیقی، مشکل تقویت…

۲ دقیقه خواندن

تحلیل و بررسی تخصصی۲ ماه پیش

رمزگشایی از PruneTIR: حذف مسیرهای خطا برای ارتقای استدلال در عامل‌های هوش مصنوعی

PruneTIR چارچوبی جدید برای بهینه‌سازی زمان استنتاج است که با حذف مسیرهای اشتباه و بازنمونه‌برداری از تلاش‌های شکست‌خورده، دقت استفاده از ابزارها در مدل‌های زبانی را افزایش می‌دهد.…

۲ دقیقه خواندن

تحلیل و بررسی تخصصی۲ ماه پیش

HGC-Det: استفاده از هندسه‌ی هایپربولیک برای کاهش اتلاف ویژگی در تشخیص سه‌بعدی

پژوهشگران چارچوب جدیدی به نام HGC-Det معرفی کرده‌اند که با بهره‌گیری از فضای هایپربولیک، ادغام داده‌های تصویری و ابر نقاط را در تشخیص اشیاء سه‌بعدی بهینه می‌کند. این روش با کاهش…

۲ دقیقه خواندن

تحلیل و بررسی تخصصی۲ ماه پیش

سازوکار NaiAD برای بهینه‌سازی تبلیغات در مدل‌های زبانی بدون کاهش کاربرد

پژوهشگران چارچوب NaiAD را معرفی کردند؛ مجموعه‌داده‌ای با ۵۹ هزار نمونه برای بهینه‌سازی تبلیغات بومی در مدل‌های زبانی. این سیستم چهار استراتژی معنایی را شناسایی کرده است که اجازه…

۲ دقیقه خواندن

تحلیل و بررسی تخصصی۲ ماه پیش

مطالعه Arxiv: تشخیص افسردگی با دقت ۷۱٪ از طریق تحلیل سیگنال‌های خام صوتی

یک مدل یادگیری عمیق جدید توانسته است با تحلیل سیگنال‌های خام صوتی، افسردگی و اضطراب را با حساسیت و ویژگی ۷۱ درصدی تشخیص دهد. این دستاورد نشان می‌دهد نشانگرهای زیستی صوتی مستقل از…

۲ دقیقه خواندن

تحلیل و بررسی تخصصی۲ ماه پیش

چرا ترنسفورمرهای تصادفی در تشخیص مراحل خواب از مدل‌های آموزش‌دیده پیشی می‌گیرند؟

پژوهشگران دریافتند که ترنسفورمرهای با مقداردهی اولیه تصادفی می‌توانند در تشخیص مراحل خواب از مدل‌های آموزش‌دیده بهتر عمل کنند. این یافته نشان می‌دهد که سوگیری استقرایی معماری، و…

۲ دقیقه خواندن

تحلیل و بررسی تخصصی۲ ماه پیش

«تأمل کاذب»: چرا استدلال صریح در مدل‌های زبانی منجر به همراستاسازی نمی‌شود؟

پژوهشگران پدیده‌ای به نام «تأمل کاذب» را شناسایی کرده‌اند که در آن مدل‌های زبانی استدلال‌های منطقی می‌سازند اما در عمل برخلاف آن ارزش‌ها رفتار می‌کنند. چارچوب جدید VALDI نشان…

۲ دقیقه خواندن

تحلیل و بررسی تخصصی۲ ماه پیش

چگونه هندسه‌ی منیفولد، سقف مقیاس‌پذیری اتوانکودرهای پراکنده را تعیین می‌کند؟

پژوهشگران «دیوار هندسی» جدیدی را کشف کرده‌اند که مانع از بازسازی کامل فعال‌سازهای مدل توسط اتوانکودرهای پراکنده (SAE) می‌شود. این مطالعه نشان می‌دهد که انحنا و ابعاد ذاتی منیفولدِ…

۲ دقیقه خواندن

آموزش کاربردی۲ ماه پیش

mnemopay: کاهش ۵۰ درصدی فراخوانی‌های تکراری ابزار در عامل‌های هوش مصنوعی

سیستم جدید حافظه‌ی وظایف mnemopay با استفاده از پروتکل MCP، امکان یادآوری موفقیت‌ها و شکست‌های پیشین را برای عامل‌های هوش مصنوعی فراهم می‌کند. این رویکرد می‌تواند فراخوانی‌های…

۲ دقیقه خواندن

تحلیل و بررسی تخصصی۲ ماه پیش

Polaris-Bench: سقوط دقت مدل‌های پیشرو از ۸۳٪ به ۳۱٪ در تست‌های بصری

مدل‌های زبانی بزرگ چندوجهی (MLLM) به جای استدلال بصری واقعی، از یک «میان‌بر دکارتی» برای تقلب در بنچمارک‌ها استفاده می‌کنند. بنچمارک جدید Polaris-Bench نشان می‌دهد که با تغییر…

۲ دقیقه خواندن