پرش به محتوای اصلی
بازگشت به واژه‌نامه

واژه‌نامهٔ هوش مصنوعی

بازیابی چیست؟

retrieval

یافتن و بیرون‌کشیدن قطعه‌های مرتبطِ اطلاعات از یک مجموعهٔ بزرگ داده در پاسخ به یک پرسش.

واژه‌های دیگر

تولید بازیابی‌افزاretrieval-augmented generation (RAG)

مبنی‌سازیِ پاسخ‌های مدل زبانی با بازیابیِ اسناد مرتبط از یک پایگاه دانش، پیش از تولید پاسخ.

سوءاستفاده از پاداشreward hacking

زمانی که مدل راهی برای بیشینه‌کردن امتیاز پاداش می‌یابد که هدف واقعی طراح را برآورده نمی‌کند، مثل ظاهرفریبی به‌جای پاسخ درست.

مدل پاداشreward model

مدلی که آموزش دیده تا کیفیت پاسخ‌های یک مدل دیگر را بر اساس ترجیحات انسانی امتیازدهی کند و این امتیاز راهنمای آموزش بعدی شود.

یادگیری تقویتی با بازخورد هوش مصنوعی (RLAIF)rlaif

روشی که به‌جای داوران انسانی، از یک مدل هوش مصنوعی برای امتیازدهی به پاسخ‌ها استفاده می‌کند تا فرایند همسوسازی ارزان‌تر و مقیاس‌پذیرتر شود.

[RLHF]rlhf

روش یادگیری تقویتی با بازخورد انسانی (RLHF): آموزش مدل‌های زبانی که در آن پاداش‌ها از قضاوت‌های مستقیم انسان به‌جای قوانین از پیش تعریف‌شده مشتق می‌شوند.

منحنی ROCroc curve

نموداری که برای یک دسته‌بند، نرخ مثبت درست را در برابر نرخ مثبت کاذب در آستانه‌های تصمیم‌گیری گوناگون نشان می‌دهد.

همهٔ اصطلاحات را در واژه‌نامهٔ هوش مصنوعی ببینید، یا کار با هوش مصنوعی را در آموزش از پایه یاد بگیرید.