
تلهی «کدنویسی حسی»: چرا ابزارهای AI شما را کندتر میکنند؟
هوش مصنوعی اغلب در ۳۰ درصد پایانی کارهای پیچیده شکست میخورد و باعث کاهش بهرهوری میشود. راهکار خروج از این بنبست، جایگزینی پرامپتهای ساده با یک گردشکار ساختاریافته و مبتنی بر…
دستهبندی
تحلیلهای عمیق مدلها، مقالات و بنچمارکها — پیشچاپها، ارزیابیها، مدلهای زبانی پیشرو و پژوهش همراستاسازی.
۱٬۶۴۰ مقاله منتشر شده

هوش مصنوعی اغلب در ۳۰ درصد پایانی کارهای پیچیده شکست میخورد و باعث کاهش بهرهوری میشود. راهکار خروج از این بنبست، جایگزینی پرامپتهای ساده با یک گردشکار ساختاریافته و مبتنی بر…

کاخ سفید دسترسی شرکتها به مدل Mythos را به دلیل کمبود شدید قدرت محاسباتی متوقف کرد. این تصمیم در حالی اتخاذ شد که پنتاگون شرکت Anthropic را یک ریسک امنیتی در زنجیره تأمین میداند.

تنسنت یک مدل ترجمه فوقفشرده و آفلاین را معرفی کرد که با حجم تنها ۴۴۰ مگابایت، کیفیتی در سطح سیستمهای تجاری بزرگ دارد. این مدل ۳۳ زبان را پشتیبانی میکند و نیاز به اتصال ابری را…

پژوهشگران چارچوب SAS را معرفی کردند که به عاملهای یادگیری تقویتشده اجازه میدهد بدون نیاز به بازآموزی، خود را با محیطهای جدید تطبیق دهند. این سیستم با استفاده از «تخیل…

ابزارهای تجاری Meta شاهد جهشی ۱۰ برابری در میزان استفاده بودهاند و تعداد گفتگوهای هفتگی را به ۱۰ میلیون مورد رساندند. این شرکت اکنون با مدل Muse Spark در حال گسترش ابزارهای…

پژوهشگران با خلق مجموعهداده Naamah، بیش از ۱۰۰ هزار جمله مصنوعی برای زبان سانسکریت تولید کردند تا مشکل کمبود داده در شناسایی موجودات نامگذاری شده را حل کنند. این پروژه ثابت…

پژوهشگران با معرفی چارچوب QYOLO توانستند حجم مدلهای تشخیص شیء را بیش از ۲۰ درصد کاهش دهند. این دستاورد با جایگزینی ماژولهای سنگین با میکسینگ الهامگرفته از کوانتوم به دست آمده و…

IBM با معرفی خانوادهی Granite 4.1 ثابت کرد که مدلهای کوچکتر با دادههای باکیفیت میتوانند مدلهای غولپیکر را شکست دهند. نسخهی ۸ میلیاردی این مدل در بنچمارکهای کلیدی، عملکرد…

معرفی چارچوب EnterpriseDocBench نشان میدهد سیستمهای تحلیل اسناد علیرغم دقت بالا، در ارائه پاسخهای جامع شکست میخورند. این مطالعه همچنین برتری بازیابی ترکیبی بر بردارهای معنایی…

پژوهشگران مجموعهداده عظیم و چندوجهی CheXthought را معرفی کردند که مسیر تفکر و نقاط تمرکز رادیولوژیستها را ثبت کرده است. این ابزار با آموزش مدلها برای «دیدن» مانند انسان، توهمات…

عصر چتباکسهای متنی به پایان میرسد و جای خود را به رابط کاربری زاینده میدهد. در این مدل، عاملها به جای تولید متن، مؤلفههای بصری طراحیشده را فراخوانی میکنند تا اصطکاک کاربر…

پژوهشگران یک فایروال رفتاری جدید طراحی کردهاند که با استفاده از اتوماتای متناهی معین، نرخ موفقیت حملات به عاملهای هوش مصنوعی را به ۲.۲٪ کاهش میدهد. این سیستم با جایگزینی…