پرش به محتوای اصلی
بازگشت به واژه‌نامه

واژه‌نامهٔ هوش مصنوعی

منظم‌سازی چیست؟

regularization

مجموعه‌ای از روش‌ها که با محدودکردن پیچیدگی مدل، از بیش‌برازش جلوگیری می‌کند تا مدل روی داده‌های تازه بهتر عمل کند.

واژه‌های دیگر

جریمهٔ تکرارrepetition penalty

پارامتری در تولید متن که احتمال توکن‌های پیش‌تر تولیدشده را کاهش می‌دهد تا مدل از تکرار بیش‌ازحدِ واژه‌ها و عبارت‌ها بپرهیزد.

بازرتبه‌بندیreranking

مرحله‌ای که در آن نتایج بازیابی‌شده با مدلی دقیق‌تر دوباره امتیازدهی و مرتب می‌شوند تا مرتبط‌ترین آن‌ها به بالای فهرست بیایند.

بازیابیretrieval

یافتن و بیرون‌کشیدن قطعه‌های مرتبطِ اطلاعات از یک مجموعهٔ بزرگ داده در پاسخ به یک پرسش.

تولید بازیابی‌افزاretrieval-augmented generation (RAG)

مبنی‌سازیِ پاسخ‌های مدل زبانی با بازیابیِ اسناد مرتبط از یک پایگاه دانش، پیش از تولید پاسخ.

سوءاستفاده از پاداشreward hacking

زمانی که مدل راهی برای بیشینه‌کردن امتیاز پاداش می‌یابد که هدف واقعی طراح را برآورده نمی‌کند، مثل ظاهرفریبی به‌جای پاسخ درست.

مدل پاداشreward model

مدلی که آموزش دیده تا کیفیت پاسخ‌های یک مدل دیگر را بر اساس ترجیحات انسانی امتیازدهی کند و این امتیاز راهنمای آموزش بعدی شود.

همهٔ اصطلاحات را در واژه‌نامهٔ هوش مصنوعی ببینید، یا کار با هوش مصنوعی را در آموزش از پایه یاد بگیرید.