پرش به محتوای اصلی

موضوع

بازیابی‌افزا

RAG architectures, vector stores, grounding LLMs in private data

۲۸۲ مقاله منتشر شده

چگونه با تغییر دو خط کد، OpenAI را از زیرساخت اپلیکیشن خود خارج کنیم؟
آموزش کاربردی

چگونه با تغییر دو خط کد، OpenAI را از زیرساخت اپلیکیشن خود خارج کنیم؟

توسعه‌دهندگان می‌توانند بدون بازنویسی منطق برنامه، بک‌اند خود را به رله‌های سازگار با API منتقل کنند. این انتقال تنها با تغییر کلید API و آدرس URL پایه، مسیر آزمون مدل‌های مختلف و…

۲ دقیقه خواندن
حافظه یک میلیارد توکنی OpenHuman؛ تلاش برای تبدیل AI به سیستم‌عامل شخصی
آموزش کاربردی

حافظه یک میلیارد توکنی OpenHuman؛ تلاش برای تبدیل AI به سیستم‌عامل شخصی

OpenHuman یک دستیار بازمتن و محلی است که با حافظه یک میلیارد توکنی، نقش «مغز دوم» را برای کاربر ایفا می‌کند. این ابزار با حذف وابستگی به ابر، حریم خصوصی را تضمین کرده و به ۱۱۸…

۲ دقیقه خواندن
گزارش dev.to: معماری غلط باعث اتلاف ۴۳٪ بودجهٔ API مدل‌های زبانی می‌شود
آموزش کاربردی

گزارش dev.to: معماری غلط باعث اتلاف ۴۳٪ بودجهٔ API مدل‌های زبانی می‌شود

گزارش جدیدی نشان می‌دهد ۴۳٪ از بودجه API مدل‌های زبانی به دلیل خطاهای معماری مثل «طوفان‌های تکرار» هدر می‌رود. پیاده‌سازی ابزارهای ساده‌ی ردیابی هزینه می‌تواند این هزینه‌ها را در…

۲ دقیقه خواندن
انتخاب مدل بردار معنایی؛ مرز میان دقت بازیابی و سقوط بودجه در RAG
آموزش کاربردی

انتخاب مدل بردار معنایی؛ مرز میان دقت بازیابی و سقوط بودجه در RAG

انتخاب درست مدل بردار معنایی و متریک شباهت، تعیین‌کننده دقت جست‌وجوی معنایی و سیستم‌های RAG است. این راهنما توازن میان ابعاد بردار و پیش‌پردازش داده‌ها برای بهینه‌سازی بازیابی را…

۲ دقیقه خواندن
سازوکار RAG: مهار توهمات هوش مصنوعی با بهینه‌سازی خط لوله داده
آموزش کاربردی

سازوکار RAG: مهار توهمات هوش مصنوعی با بهینه‌سازی خط لوله داده

تولید بازیابی‌افزا (RAG) با اتصال مدل‌های زبانی به داده‌های خصوصی و به‌روز، مشکل توهم و تاریخ انقضای دانش را حل می‌کند. در این معماری، تمرکز مهندسی از طراحی پرامپت به بهینه‌سازی…

۲ دقیقه خواندن
چرا عامل‌های برنامه‌نویسی حافظه‌شان را می‌بازند و راهکار dtoolkit چیست؟
آموزش کاربردی

چرا عامل‌های برنامه‌نویسی حافظه‌شان را می‌بازند و راهکار dtoolkit چیست؟

اکثر عامل‌های کدنویسی در هر جلسه جدید، پیشینه پروژه را فراموش می‌کنند و دچار توهم می‌شوند. dtoolkit یک لایه زیرساختی متن‌باز است که با استفاده از SQLite، حافظه پایدار و مدیریت…

۲ دقیقه خواندن
چگونه حلقه‌های تفکر-عمل در ReAct توهمات هوش مصنوعی را متوقف می‌کنند؟
آموزش کاربردی

چگونه حلقه‌های تفکر-عمل در ReAct توهمات هوش مصنوعی را متوقف می‌کنند؟

چارچوب ReAct مدل‌های زبانی را مجبور می‌کند پیش از پاسخ، فرض‌های خود را با ابزارهای خارجی بسنجند. این روش با جایگزینی پیش‌بینی‌های آماری با داده‌های واقعی، نرخ توهمات را به‌شدت…

۲ دقیقه خواندن
AI
آموزش کاربردی

سازوکار akm 0.8.0 برای توقف حلقه‌ی تخریب داده‌ها در عامل‌های هوش مصنوعی

نسخه‌ی 0.8.0 ابزار akm با معرفی «حافظه‌ی آگاه به باور»، از جایگزینی حقایق تأییدشده توسط انسان با داده‌های قدیمی یا توهمات عامل‌ها جلوگیری می‌کند. این سیستم با استفاده از حالت‌های…

۲ دقیقه خواندن
AI
آموزش کاربردی

Mnemo: پیاده‌سازی حافظه بلندمدت با سرعت ۴.۲ میلی‌ثانیه برای عامل‌های هوش مصنوعی

ابزار Mnemo یک لایه‌ی حافظه محلی است که با استفاده از SQLite، گراف دانشی دائمی برای مدل‌های زبانی ایجاد می‌کند. این سیستم با سرعت کمتر از ۵۰ میلی‌ثانیه، با مدل‌های OpenAI،…

۲ دقیقه خواندن
AI

درون معماری «مغز شرکتی» Hyper برای حل مشکل فراموشی عامل‌های هوش مصنوعی

پلتفرم **Hyper** با تبدیل ارتباطات پراکنده شرکتی به یک گراف دانش پویا، مشکل فراموشی یا به‌روز نبودن داده‌ها در عامل‌های هوش مصنوعی را حل می‌کند. این سیستم اجازه می‌دهد حقایق جدید…

۲ دقیقه خواندن
AI
آموزش کاربردی

سازوکار NemoClaw: آموزش مهارت‌های جدید به عامل‌های هوش مصنوعی از طریق چت

پشته‌ی نرم‌افزاری NemoClaw از شرکت NVIDIA به عامل‌های هوش مصنوعی اجازه می‌دهد مهارت‌های جدید را مستقیماً از گفتگو با کاربر بیاموزند و آن‌ها را ذخیره کنند. این سیستم با استفاده از…

۲ دقیقه خواندن