واژهنامهٔ هوش مصنوعی
محک چیست؟
مجموعهای استاندارد از وظایف و دادهها که برای سنجش و مقایسه کارایی مدلهای مختلف بر یک مبنای یکسان بهکار میرود.
واژههای دیگر
موازنه اریبی و واریانسbias-variance tradeoff
تعادلی بنیادی که در آن کاستن از خطای ناشی از سادگیِ بیش از حد مدل، معمولاً خطای ناشی از حساسیتش به داده آموزش را افزایش میدهد و برعکس.
معیار BLEUbleu
معیاری برای ارزیابی ترجمه ماشینی که همپوشانی واژگان و عبارتهای متن تولیدشده را با چند ترجمه مرجع انسانی میسنجد.
کالیبراسیونcalibration
میزان همخوانی اطمینان اعلامشده مدل با درستی واقعی آن؛ مدلِ کالیبره وقتی نود درصد اطمینان میدهد، حدود نود درصد مواقع درست میگوید.
فراموشی فاجعهبارcatastrophic forgetting
پدیدهای که در آن مدل هنگام آموزش روی داده یا کار جدید، بخش بزرگی از آنچه پیشتر آموخته بود را از دست میدهد.
زنجیره تفکرchain-of-thought
روشی در طراحی پرامپت که در آن مدل پیش از پاسخدادن، گامبهگام استدلال میکند.
نقطهٔ بازرسیcheckpoint
ذخیرهٔ وضعیت کامل یک مدل و وزنهای آن در میانهٔ آموزش، تا بتوان آموزش را از همان نقطه ادامه داد یا همان نسخهٔ مدل را برای استفاده بازیابی کرد.
همهٔ اصطلاحات را در واژهنامهٔ هوش مصنوعی ببینید، یا کار با هوش مصنوعی را در آموزش از پایه یاد بگیرید.