واژهنامهٔ هوش مصنوعی
منظمسازی چیست؟
مجموعهای از روشها که با محدودکردن پیچیدگی مدل، از بیشبرازش جلوگیری میکند تا مدل روی دادههای تازه بهتر عمل کند.
واژههای دیگر
جریمهٔ تکرارrepetition penalty
پارامتری در تولید متن که احتمال توکنهای پیشتر تولیدشده را کاهش میدهد تا مدل از تکرار بیشازحدِ واژهها و عبارتها بپرهیزد.
بازرتبهبندیreranking
مرحلهای که در آن نتایج بازیابیشده با مدلی دقیقتر دوباره امتیازدهی و مرتب میشوند تا مرتبطترین آنها به بالای فهرست بیایند.
بازیابیretrieval
یافتن و بیرونکشیدن قطعههای مرتبطِ اطلاعات از یک مجموعهٔ بزرگ داده در پاسخ به یک پرسش.
تولید بازیابیافزاretrieval-augmented generation (RAG)
مبنیسازیِ پاسخهای مدل زبانی با بازیابیِ اسناد مرتبط از یک پایگاه دانش، پیش از تولید پاسخ.
سوءاستفاده از پاداشreward hacking
زمانی که مدل راهی برای بیشینهکردن امتیاز پاداش مییابد که هدف واقعی طراح را برآورده نمیکند، مثل ظاهرفریبی بهجای پاسخ درست.
مدل پاداشreward model
مدلی که آموزش دیده تا کیفیت پاسخهای یک مدل دیگر را بر اساس ترجیحات انسانی امتیازدهی کند و این امتیاز راهنمای آموزش بعدی شود.
همهٔ اصطلاحات را در واژهنامهٔ هوش مصنوعی ببینید، یا کار با هوش مصنوعی را در آموزش از پایه یاد بگیرید.