EVA-Bench 2.0: ارزیابی قابلیت اطمینان عاملهای صوتی با ۲۱۳ سناریوی تخصصی
پلتفرم ServiceNow-AI ابزار EVA-Bench 2.0 را برای سنجش دقیق عاملهای صوتی در حوزههای بهداشت، فناوری اطلاعات و هواپیمایی منتشر کرد. این بنچمارک با معرفی ۲۱۳ سناریوی اعتبارسنجیشده،…