واژه‌نامهٔ هوش مصنوعی

محک چیست؟

benchmark

مجموعه‌ای استاندارد از وظایف و داده‌ها که برای سنجش و مقایسه کارایی مدل‌های مختلف بر یک مبنای یکسان به‌کار می‌رود.

واژه‌های دیگر

تعادلی بنیادی که در آن کاستن از خطای ناشی از سادگیِ بیش از حد مدل، معمولاً خطای ناشی از حساسیتش به داده آموزش را افزایش می‌دهد و برعکس.

معیاری برای ارزیابی ترجمه ماشینی که همپوشانی واژگان و عبارت‌های متن تولیدشده را با چند ترجمه مرجع انسانی می‌سنجد.

میزان همخوانی اطمینان اعلام‌شده مدل با درستی واقعی آن؛ مدلِ کالیبره وقتی نود درصد اطمینان می‌دهد، حدود نود درصد مواقع درست می‌گوید.

پدیده‌ای که در آن مدل هنگام آموزش روی داده یا کار جدید، بخش بزرگی از آنچه پیش‌تر آموخته بود را از دست می‌دهد.

روشی در طراحی پرامپت که در آن مدل پیش از پاسخ‌دادن، گام‌به‌گام استدلال می‌کند.

ذخیرهٔ وضعیت کامل یک مدل و وزن‌های آن در میانهٔ آموزش، تا بتوان آموزش را از همان نقطه ادامه داد یا همان نسخهٔ مدل را برای استفاده بازیابی کرد.

همهٔ اصطلاحات را در واژه‌نامهٔ هوش مصنوعی ببینید، یا کار با هوش مصنوعی را در آموزش از پایه یاد بگیرید.