پرش به محتوای اصلی
بازگشت به واژه‌نامه

واژه‌نامهٔ هوش مصنوعی

یادگیری تقویتی با بازخورد هوش مصنوعی (RLAIF) چیست؟

rlaif

روشی که به‌جای داوران انسانی، از یک مدل هوش مصنوعی برای امتیازدهی به پاسخ‌ها استفاده می‌کند تا فرایند همسوسازی ارزان‌تر و مقیاس‌پذیرتر شود.

واژه‌های دیگر

همهٔ اصطلاحات را در واژه‌نامهٔ هوش مصنوعی ببینید، یا کار با هوش مصنوعی را در آموزش از پایه یاد بگیرید.