پرش به محتوای اصلی
بازگشت به واژه‌نامه

واژه‌نامهٔ هوش مصنوعی

محک چیست؟

benchmark

مجموعه‌ای استاندارد از وظایف و داده‌ها که برای سنجش و مقایسه کارایی مدل‌های مختلف بر یک مبنای یکسان به‌کار می‌رود.

واژه‌های دیگر

موازنه اریبی و واریانسbias-variance tradeoff

تعادلی بنیادی که در آن کاستن از خطای ناشی از سادگیِ بیش از حد مدل، معمولاً خطای ناشی از حساسیتش به داده آموزش را افزایش می‌دهد و برعکس.

معیار BLEUbleu

معیاری برای ارزیابی ترجمه ماشینی که همپوشانی واژگان و عبارت‌های متن تولیدشده را با چند ترجمه مرجع انسانی می‌سنجد.

کالیبراسیونcalibration

میزان همخوانی اطمینان اعلام‌شده مدل با درستی واقعی آن؛ مدلِ کالیبره وقتی نود درصد اطمینان می‌دهد، حدود نود درصد مواقع درست می‌گوید.

فراموشی فاجعه‌بارcatastrophic forgetting

پدیده‌ای که در آن مدل هنگام آموزش روی داده یا کار جدید، بخش بزرگی از آنچه پیش‌تر آموخته بود را از دست می‌دهد.

زنجیره تفکرchain-of-thought

روشی در طراحی پرامپت که در آن مدل پیش از پاسخ‌دادن، گام‌به‌گام استدلال می‌کند.

نقطهٔ بازرسیcheckpoint

ذخیرهٔ وضعیت کامل یک مدل و وزن‌های آن در میانهٔ آموزش، تا بتوان آموزش را از همان نقطه ادامه داد یا همان نسخهٔ مدل را برای استفاده بازیابی کرد.

همهٔ اصطلاحات را در واژه‌نامهٔ هوش مصنوعی ببینید، یا کار با هوش مصنوعی را در آموزش از پایه یاد بگیرید.