تحلیل و بررسی تخصصی

واژگان ابداعی؛ کلید یادگیری مهارت‌های جدید بدون به‌روزرسانی وزن‌های AI

پژوهشگران روشی به نام «واژگان ابداعی» را معرفی کرده‌اند که به مدل‌های زبانی اجازه می‌دهد بدون تغییر وزن‌ها، مهارت‌های جدید کسب کنند. این رویکرد مشکل فراموشی فاجعه‌بار و…

۲ دقیقه خواندن

تحلیل و بررسی تخصصی۲ ماه پیش

چرا فاصله‌ی اقلیدسی در انتقال بهینه‌ی داده‌ها یک اشتباه است؟

معرفی روش ReshapeOT برای اصلاح مدل‌سازی تغییرات توزیع داده‌ها. این متد با جایگزینی معیارهای اقلیدسی با فاصله‌ی ماهالانوبیس، دقت هندسی پیش‌بینی‌ها را در محیط‌های پویا به‌شدت افزایش…

۲ دقیقه خواندن

تحلیل و بررسی تخصصی۲ ماه پیش

چرا مدل‌های استدلالی نباید برای پاسخ درست پاداش بگیرند؟

پژوهشگران با معرفی EP-GRPO، نقص‌های سیستماتیک در بهینه‌سازی سیاست‌های گروهی را برطرف کرده‌اند. این چارچوب با حذف نیاز به مدل‌های پاداش خارجی، دقت و کارایی مدل‌های زبانی در…

۲ دقیقه خواندن

تحلیل و بررسی تخصصی۲ ماه پیش

داده‌های جدید Arxiv: مدل DART دقت بازرسی کابل‌ها را ۳۸٪ جهش داد

مدل DART با ترکیب بینایی و زبان، بازرسی کابل‌های صنعتی را خودکار کرده و دقت تشخیص آسیب را به شکل چشم‌گیری افزایش داده است. این سیستم بدون نیاز به تنظیم دقیق، شدت آسیب را تخمین زده…

۲ دقیقه خواندن

تحلیل و بررسی تخصصی۲ ماه پیش

۷ عامل پنهانی که استنتاج علیتی در شبکه‌های ژنی را مختل می‌کنند

پژوهشگران ۷ «پاتولوژی» یا نقص داده‌ای را شناسایی کردند که مزایای روش‌های علیتی در نقشه‌برداری ژنی را خنثی می‌کند. این مطالعه با ۶,۱۲۰ آزمایش ثابت کرد که مدل‌های علیتی در محیط‌های…

۲ دقیقه خواندن

تحلیل و بررسی تخصصی۲ ماه پیش

تغییر ساختاری در تفکر ماشین‌ها؛ چرا گراف‌ها بر متون پیروز شدند؟

پژوهشگران چارچوب **گراف‌های ایده‌ی تکاملی** (Evolving Idea Graphs) را معرفی کردند که با جایگزینی متون خطی با گراف‌های پویا، کیفیت ایده‌های علمی را متحول می‌کند. این سیستم در…

۲ دقیقه خواندن

تحلیل و بررسی تخصصی۲ ماه پیش

چرا برای ساخت مدل‌های دقیق‌تر، باید کمتر کد بنویسیم؟

پژوهشگران روشی را ابداع کرده‌اند که در آن مدل‌های زبانی به‌جای بازنویسی کامل معماری‌های عصبی، تنها تغییرات ضروری (Diffs) را اعمال می‌کنند. این رویکرد طول خروجی را تا ۸۵٪ کاهش داده…

۲ دقیقه خواندن

تحلیل و بررسی تخصصی۲ ماه پیش

چگونه True Memory بدون GPU و دیتابیس برداری، حافظه‌ی AI را متحول کرد؟

معماری True Memory با جایگزینی خلاصه‌سازی‌های زودهنگام با بازیابی دقیق (Verbatim)، استانداردهای حافظه‌ی عامل‌های هوش مصنوعی را جابه‌جا کرده است. این سیستم که تنها بر بستر SQLite…

۲ دقیقه خواندن

تحلیل و بررسی تخصصی۲ ماه پیش

پایان تبعیض نژادی در تشخیص گلوکوم؛ رمزگشایی از مدل FairEnc

پژوهشگران با معرفی مدل FairEnc توانستند سوگیری‌های نژادی و جنسیتی را از سیستم‌های تشخیص بیماری گلوکوم حذف کنند. این مدل چندوجهی با استفاده از داده‌های مصنوعی و یادگیری تقابلی، دقت…

۲ دقیقه خواندن

تحلیل و بررسی تخصصی۲ ماه پیش

پایان خطای تخمین پاداش؛ تحولی در یادگیری تقویت‌شده برای محیط‌های متغیر

یک مقاله پژوهشی جدید با معرفی اپراتور میانگین هارمونیک اصلاح‌شده، مشکل عدم دقت نرخ پاداش در SMDPها را حل کرده است. این رویکرد باعث می‌شود الگوریتم‌های RL حتی در محیط‌های غیرایستا…

۲ دقیقه خواندن

تحلیل و بررسی تخصصی۲ ماه پیش

آیا می‌توان انقلاب صنعتی بعدی را پیش از ساخت اولین نمونه پیش‌بینی کرد؟

پژوهشگران با معرفی مدل TechToken، سیگنال‌های نوآوری را در زبان پتنت‌ها کشف کرده‌اند. این مدل ترنسفورمر-محور می‌تواند ترکیب‌های تکنولوژیک جدید را دهه‌ها پیش از ظهور واقعی‌شان…

۲ دقیقه خواندن

تحلیل و بررسی تخصصی۲ ماه پیش

پروژه MIA: نقشه‌ی راه شناختی برای درک استعاره‌ها در هوش مصنوعی

یک مجموعه داده جدید از ردیابی چشم نشان می‌دهد که یادگیرندگان زبان دوم ابتدا اصطلاحات را به‌صورت تحت‌اللفظی پردازش می‌کنند. این منبع، معیاری حیاتی برای سنجش میزان شباهت درک مدل‌های…

۲ دقیقه خواندن