پرش به محتوای اصلی
بازگشت به واژه‌نامه

واژه‌نامهٔ هوش مصنوعی

[RLHF] چیست؟

rlhf

روش یادگیری تقویتی با بازخورد انسانی (RLHF): آموزش مدل‌های زبانی که در آن پاداش‌ها از قضاوت‌های مستقیم انسان به‌جای قوانین از پیش تعریف‌شده مشتق می‌شوند.

معادل انگلیسی

rlhf

تعریف مرجع (انگلیسی)

Auto-flagged during WF-7 localization

واژه‌های دیگر

همهٔ اصطلاحات را در واژه‌نامهٔ هوش مصنوعی ببینید، یا کار با هوش مصنوعی را در آموزش از پایه یاد بگیرید.