واژهنامهٔ هوش مصنوعی
[KV Cache] چیست؟
حافظهای در مدلهای زبانی بزرگ که برای ذخیره نتایج میانی محاسبات لایههای توجه (kv cache) در هنگام تولید متن بهصورت ترتیبی به کار میرود و از محاسبات تکراری جلوگیری میکند.
معادل انگلیسی
kv cache
تعریف مرجع (انگلیسی)
Auto-flagged during WF-7 localization
واژههای دیگر
برچسبlabel
پاسخ یا مقدار درستی که در یادگیری نظارتشده به هر نمونهی آموزشی نسبت داده میشود تا مدل آن را هدفِ پیشبینی قرار دهد.
مدل زبانی بزرگlarge language model (LLM)
یک مدل بنیادی که روی حجم عظیمی از دادههای متنی آموزش دیده تا زبان را بفهمد و تولید کند.
تأخیرlatency
فاصلهٔ زمانی میان فرستادن درخواست به مدل و دریافت پاسخ، که در سرویسهای بیدرنگ اهمیت زیادی دارد.
فضای نهانlatent space
فضای عددیِ فشردهای که مدل ویژگیهای پنهان داده را در آن نگه میدارد، بهگونهای که نمونههای شبیه به هم در آن نزدیک یکدیگر قرار میگیرند.
نرخ یادگیریlearning rate
ابرپارامتری که اندازهٔ هر گام بهروزرسانی وزنها را تعیین میکند؛ مقدار بسیار بزرگ آموزش را ناپایدار و مقدار بسیار کوچک آن را کند میکند.
لاماسیپلاسپلاس (llama.cpp)llama.cpp
یک کتابخانهٔ متنباز نوشتهشده به ++C برای اجرای محلی مدلهای زبانی روی پردازندهٔ معمولی، بدون نیاز به کارت گرافیک قدرتمند.
همهٔ اصطلاحات را در واژهنامهٔ هوش مصنوعی ببینید، یا کار با هوش مصنوعی را در آموزش از پایه یاد بگیرید.