
پژوهش: مدلهای زبانی در شبیهسازی احساسات بوروکراتیک ناکارآمد هستند
تحقیقی جدید نشان میدهد مدلهای زبانی بزرگ در شبیهسازی واکنشهای عاطفی شهروندان نسبت به بروکراسی عملکرد ضعیفی دارند. این ناکارآمدی بهویژه در مورد فرهنگهای شرقی بیشتر مشاهده…
دستهبندی
تحلیلهای عمیق مدلها، مقالات و بنچمارکها — پیشچاپها، ارزیابیها، مدلهای زبانی پیشرو و پژوهش همراستاسازی.
۱٬۶۲۸ مقاله منتشر شده

تحقیقی جدید نشان میدهد مدلهای زبانی بزرگ در شبیهسازی واکنشهای عاطفی شهروندان نسبت به بروکراسی عملکرد ضعیفی دارند. این ناکارآمدی بهویژه در مورد فرهنگهای شرقی بیشتر مشاهده…

پژوهشگران بنچمارک ManyIH-Bench را معرفی کردهاند؛ اولین معیار سنجش توانایی عاملهای LLM در مدیریت تعارض دستورات در سطوح مختلف اختیار. این مطالعه نشان میدهد حتی مدلهای پیشروی هوش…

یک روش نوین یادگیری مستمر برای مقابله با تجمع سوگیری در سیگنالهای مغزی ارائه شده است. این رویکرد با بهبود عملکرد مدلها در درک بصری-مغزی، نتایج چشمگیری به دست آورده است.

محققان چارچوب HintMR را معرفی کردند؛ رویکردی که در آن مدلهای زبانی کوچکتر با تولید سرنخهای متنی به جای ارائه راهحل کامل، در حل مسائل پیچیده ریاضی همکاری میکنند. این روش دقت…

گزارش شاخص هوش مصنوعی ۲۰۲۶ نشان میدهد که ۵۰ درصد اختلاف میان دیدگاه متخصصان و عموم مردم آمریکا درباره تأثیر این فناوری بر مشاغل وجود دارد. این شکاف ادراکی، پرسشهای مهمی درباره…

پژوهشگران دریافتند که روش تجمیع میانگین در طبقهبندی بیماری عملکرد بهتری دارد، در حالی که تجمیع توجه برای بازیابی متقاطع بینحوزهای برتری دارد. همچنین، کدگذاری چندپنجرهای نسبت…

جک کلارک، همبنیانگذار آنتروپیک، تأیید کرد که این شرکت دولت ترامپ را درباره مدل مایتوس توجیه کرده است؛ مدلی که بهدلیل خطرناک بودن برای انتشار عمومی در نظر گرفته نمیشود. این…

تیمی تحقیقاتی معیار ARGOS را رونمایی کرد؛ نخستین ابزار ارزیابی که جستجوی فرد با دوربینهای متعدد را بهعنوان یک مسئله استدلال تعاملی بازتعریف میکند. این چارچوب عاملهای هوشمند را…