
مدلهای هوش مصنوعی در هنر متقاعدسازی از انسانهای خبره پیشی گرفتند
یک مطالعه گسترده با ۱۹٬۰۰۰ گفتگو نشان میدهد که سیستمهای پیشرفته هوش مصنوعی در تغییر باورها بسیار اثرگذارتر از متخصصان انسانی هستند. در تستهای واقعی جذب سرمایه، این مدلها…
دستهبندی
تحلیلهای عمیق مدلها، مقالات و بنچمارکها — پیشچاپها، ارزیابیها، مدلهای زبانی پیشرو و پژوهش همراستاسازی.
۱٬۶۴۵ مقاله منتشر شده

یک مطالعه گسترده با ۱۹٬۰۰۰ گفتگو نشان میدهد که سیستمهای پیشرفته هوش مصنوعی در تغییر باورها بسیار اثرگذارتر از متخصصان انسانی هستند. در تستهای واقعی جذب سرمایه، این مدلها…

سامانه LLM Wiki با استفاده از ساختار Markdown، حافظهٔ موقت عاملها را به یک مرکز دانش دائمی و قابل نسخهبندی تبدیل میکند. این ابزار با جداسازی حافظه عملیاتی از دانش انباشته،…

گزارش جدید Hugging Face نشان میدهد که لورا (LoRA) با وجود محبوبیت زیاد، لزوماً بهینهترین انتخاب برای تنظیم دقیق نیست. تحلیلها ثابت میکند برخی متدهای جایگزین، دقت بالاتر و مصرف…

شرکت XGIMI عینکهای هوشمند MemoMind One را معرفی کرد که تجربه نمایشگر دوم را به صورت دستآزاد فراهم میکند. با این حال، ویژگی ثبت صوتی همیشگی این دستگاه برای تولید روزنامههای…

دو مطالعه در نشریه Nature نشان میدهد عاملهای هوش مصنوعی MIRA و AMIE در تشخیصهای شبیهسازیشده و رعایت دستورالعملهای پزشکی از پزشکان پیشی گرفتهاند. با این حال، یافتهها حاکی…

یک ابزار امنیتی جدید نشان میدهد که انتخاب مدل زبانی در پسزمینهٔ عاملهای هوش مصنوعی، مستقیماً بر نرخ نشت دادههای حساس اثر میگذارد. در حالی که برخی مدلها مقاوم هستند، برخی…

پلتفرم Browse.sh با معرفی زیرساختی مبتنی بر «دستورپختهای مهارت»، مانع از شکستهای مکرر عاملهای هوش مصنوعی در مواجهه با تغییرات ساختاری وبسایتها میشود. این ابزار برای…

لایهی حافظهی متنباز Lorekeeper از طریق چرخههای بازاندیشی در زمانهای بیکاری، از تکرار اشتباهات و فراموشی ترجیحات پروژه در عاملهای هوش مصنوعی جلوگیری میکند. این ابزار با…

یک چارچوب جدید ارزیابی معرفی شده است که بهجای تمرکز صرف بر پاسخ نهایی، مسیر و کارایی عاملهای هوش مصنوعی در استفاده از ابزارها را میسنجد. این رویکرد نشان میدهد که برای موفقیت…

ساخت عاملهای هوشمند اکنون بیش از آنکه به مهندسی پرامپت وابسته باشد، نیازمند مدیریت «حلقهٔ عامل» (Agent Loop) است. این معماری با کنترل اجرای ابزارها و حفظ وضعیت، مانع از فراموشی…

پروژهی متنباز Network-AI با معرفی یک لایهی هماهنگی، مشکل «بازنویسی خاموش» را در سامانههای چندعاملی حل کرد. این ابزار بهجای نوشتن مستقیم در حافظه، از یک چرخهٔ تأیید استفاده…

سه چارچوب جدید برای رفع گلوگاه حافظه در مدلهای زبانی با پنجره متنی بلند معرفی شدند. این روشها از طریق فشردهسازی حافظه KV Cache، امکان اجرای مدلهای حجیم با سختافزار محدودتر را…