
واژگان ابداعی؛ کلید یادگیری مهارتهای جدید بدون بهروزرسانی وزنهای AI
پژوهشگران روشی به نام «واژگان ابداعی» را معرفی کردهاند که به مدلهای زبانی اجازه میدهد بدون تغییر وزنها، مهارتهای جدید کسب کنند. این رویکرد مشکل فراموشی فاجعهبار و…
دستهبندی
تحلیلهای عمیق مدلها، مقالات و بنچمارکها — پیشچاپها، ارزیابیها، مدلهای زبانی پیشرو و پژوهش همراستاسازی.
۱٬۶۴۷ مقاله منتشر شده

پژوهشگران روشی به نام «واژگان ابداعی» را معرفی کردهاند که به مدلهای زبانی اجازه میدهد بدون تغییر وزنها، مهارتهای جدید کسب کنند. این رویکرد مشکل فراموشی فاجعهبار و…

معرفی روش ReshapeOT برای اصلاح مدلسازی تغییرات توزیع دادهها. این متد با جایگزینی معیارهای اقلیدسی با فاصلهی ماهالانوبیس، دقت هندسی پیشبینیها را در محیطهای پویا بهشدت افزایش…

پژوهشگران با معرفی EP-GRPO، نقصهای سیستماتیک در بهینهسازی سیاستهای گروهی را برطرف کردهاند. این چارچوب با حذف نیاز به مدلهای پاداش خارجی، دقت و کارایی مدلهای زبانی در…

مدل DART با ترکیب بینایی و زبان، بازرسی کابلهای صنعتی را خودکار کرده و دقت تشخیص آسیب را به شکل چشمگیری افزایش داده است. این سیستم بدون نیاز به تنظیم دقیق، شدت آسیب را تخمین زده…

پژوهشگران ۷ «پاتولوژی» یا نقص دادهای را شناسایی کردند که مزایای روشهای علیتی در نقشهبرداری ژنی را خنثی میکند. این مطالعه با ۶,۱۲۰ آزمایش ثابت کرد که مدلهای علیتی در محیطهای…

پژوهشگران چارچوب **گرافهای ایدهی تکاملی** (Evolving Idea Graphs) را معرفی کردند که با جایگزینی متون خطی با گرافهای پویا، کیفیت ایدههای علمی را متحول میکند. این سیستم در…

پژوهشگران روشی را ابداع کردهاند که در آن مدلهای زبانی بهجای بازنویسی کامل معماریهای عصبی، تنها تغییرات ضروری (Diffs) را اعمال میکنند. این رویکرد طول خروجی را تا ۸۵٪ کاهش داده…

معماری True Memory با جایگزینی خلاصهسازیهای زودهنگام با بازیابی دقیق (Verbatim)، استانداردهای حافظهی عاملهای هوش مصنوعی را جابهجا کرده است. این سیستم که تنها بر بستر SQLite…

پژوهشگران با معرفی مدل FairEnc توانستند سوگیریهای نژادی و جنسیتی را از سیستمهای تشخیص بیماری گلوکوم حذف کنند. این مدل چندوجهی با استفاده از دادههای مصنوعی و یادگیری تقابلی، دقت…

یک مقاله پژوهشی جدید با معرفی اپراتور میانگین هارمونیک اصلاحشده، مشکل عدم دقت نرخ پاداش در SMDPها را حل کرده است. این رویکرد باعث میشود الگوریتمهای RL حتی در محیطهای غیرایستا…

پژوهشگران با معرفی مدل TechToken، سیگنالهای نوآوری را در زبان پتنتها کشف کردهاند. این مدل ترنسفورمر-محور میتواند ترکیبهای تکنولوژیک جدید را دههها پیش از ظهور واقعیشان…

یک مجموعه داده جدید از ردیابی چشم نشان میدهد که یادگیرندگان زبان دوم ابتدا اصطلاحات را بهصورت تحتاللفظی پردازش میکنند. این منبع، معیاری حیاتی برای سنجش میزان شباهت درک مدلهای…