تحلیل و بررسی تخصصی

چرا هیچ «بهترین» دستیار هوش مصنوعی برای مدیریت کریپتو وجود ندارد

پژوهشگران با معرفی بنچمارک LATTICE ثابت کردند که عامل‌های کریپتو در کیفیت پشتیبانی از تصمیمات کاربر تفاوت‌های شدیدی دارند. این نتایج نشان می‌دهد که هیچ ابزار واحدی برای تمام…

تحلیل و بررسی تخصصی۲ ماه پیش

رمزگشایی از SeeCo: چگونه بدون آموزش مجدد، دقت سنجش از دور را بالا ببریم

پژوهشگران چارچوب SeeCo را معرفی کردند؛ سیستمی که بدون نیاز به آموزش مجدد و هزینه‌بر، خطاهای معنایی مدل‌های سنجش از دور را در لحظه استنتاج اصلاح می‌کند. این ابزار با استفاده از…

۲ دقیقه خواندن

تحلیل و بررسی تخصصی۲ ماه پیش

رمزگشایی از Qvine: پایان بن‌بست بارگذاری داده در مدارات کوانتومی

محققان با معرفی Qvine، راهکاری برای غلبه بر «نفرین ابعاد» در رایانش کوانتومی ارائه کردند. این معماری با کاهش پیچیدگی مدارات از حالت نمایی به خطی، بارگذاری داده‌های چندبعدی را برای…

۲ دقیقه خواندن

تحلیل و بررسی تخصصی۲ ماه پیش

ضربه به هزینه‌های استنتاج: الگوریتم HPD چگونه سرعت مدل‌ها را ۱۳.۸ برابر کرد

الگوریتم جدید رمزگشایی فوق‌موازی (HPD) با شکستن ساختار ترتیبی مدل‌های زبانی، هزینه‌ها و زمان استنتاج را تا ۱۳.۸ برابر کاهش می‌دهد. این پیشرفت به‌ویژه در استخراج داده‌های…

۲ دقیقه خواندن

تحلیل و بررسی تخصصی۲ ماه پیش

ردپای پنهانی در Llama-3 که دست مدل‌های «تظاهر به حماقت» را می‌افشاید

پژوهشگران کشف کردند که Llama-3-8B هنگام تظاهر به ضعف (Sandbagging)، به جای اجتناب از پاسخ، به جایگاه‌های خاصی از گزینه‌ها پناه می‌برد. این «فروپاشی موقعیتی» یک امضای رفتاری قابل…

۲ دقیقه خواندن

تحلیل و بررسی تخصصی۲ ماه پیش

پایان کابوس On-call: سیستمی که زمان رفع خطاها را نصف کرد

محققان چارچوب عامل‌محور Bian Que را برای بهینه‌سازی بازیابی داده‌های عملیاتی در مدل‌های زبانی معرفی کردند. این سیستم در مقیاس عظیم KuaiShou، نویز هشدارهای سیستمی را ۷۵٪ کاهش و…

۲ دقیقه خواندن

تحلیل و بررسی تخصصی۲ ماه پیش

چگونه SciHorizon-DataEVA استاندارد «آمادگی برای هوش مصنوعی» را خودکار کرد

پژوهشگران سیستمی عامل‌محور به نام SciHorizon-DataEVA طراحی کرده‌اند که آمادگی داده‌های علمی برای ادغام در هوش مصنوعی را ارزیابی می‌کند. این ابزار با جایگزینی بازبینی دستی، کیفیت و…

۲ دقیقه خواندن

$چرا تعداد پارامترها در تصحیح تکالیف ریاضی هیچ اهمیتی ندارد$

تحلیل و بررسی تخصصی۲ ماه پیش

چرا تعداد پارامترها در تصحیح تکالیف ریاضی هیچ اهمیتی ندارد

یک مطالعه جدید نشان می‌دهد که برای تصحیح دقیق تکالیف ریاضی، همراستاسازی معماری با دستورالعمل‌ها بسیار حیاتی‌تر از تعداد پارامترها است. در حالی که مدل‌های مبتنی بر Gemini عملکرد…

۲ دقیقه خواندن

تحلیل و بررسی تخصصی۲ ماه پیش

چرا تنظیم دقیق مدل‌های زبانی، ایمنی ربات‌های پزشکی را تضمین نمی‌کند؟

بررسی ۷۲ مدل زبانی نشان می‌دهد که بیش از نیمی از آن‌ها در کنترل ربات‌های پزشکی، اخلاقیات حیاتی را نقض می‌کنند. این شکاف ایمنی، به‌ویژه در مدل‌های وزن‌باز، استقرار این فناوری در…

۲ دقیقه خواندن

تحلیل و بررسی تخصصی۲ ماه پیش

فریب مبنی‌سازی: چرا مدل‌های زبانی برای استدلال به چیزی فراتر از داده نیاز دارند

یک مطالعه جدید این باور را که استدلال هوش مصنوعی به‌طور خودکار از طریق مبنی‌سازی شکل می‌گیرد، رد می‌کند. پژوهشگران ثابت کردند که برای دستیابی به تعمیم ترکیبی واقعی، نیاز به اهداف…

۲ دقیقه خواندن۱

تحلیل و بررسی تخصصی۲ ماه پیش

فراتر از پیش‌بینی توکن: سیستمی که ۹۸٪ معماهای IQ را حل کرد

یک چارچوب نظری جدید با ترکیب منطق رابطه‌ای و شبکه‌های عصبی، سد بازدهی نزولی در مدل‌های زبانی را شکست. این سیستم با نرخ موفقیت ۹۸.۰۳ درصدی در مسائل IQ، در رده ۱ درصد برتر هوش…

۲ دقیقه خواندن

تحلیل و بررسی تخصصی۲ ماه پیش

فریب بلاغت: نقص پنهانی که رویای عدالت خودکار را می‌کوبد

مطالعه‌ای جدید نشان می‌دهد مدل‌های زبانی پیشرو بیش از آنکه به شواهد قانونی اهمیت دهند، تحت تأثیر کیفیت بیان وکیل قرار می‌گیرند. این یافته، استفاده از هوش مصنوعی به عنوان…

۲ دقیقه خواندن