موضوع

بازیابی‌افزا

RAG architectures, vector stores, grounding LLMs in private data

۲۸۲ مقاله منتشر شده

چگونه با تغییر دو خط کد، OpenAI را از زیرساخت اپلیکیشن خود خارج کنیم؟

توسعه‌دهندگان می‌توانند بدون بازنویسی منطق برنامه، بک‌اند خود را به رله‌های سازگار با API منتقل کنند. این انتقال تنها با تغییر کلید API و آدرس URL پایه، مسیر آزمون مدل‌های مختلف و…

۲ دقیقه خواندن

آموزش کاربردی۳ هفته پیش

حافظه یک میلیارد توکنی OpenHuman؛ تلاش برای تبدیل AI به سیستم‌عامل شخصی

OpenHuman یک دستیار بازمتن و محلی است که با حافظه یک میلیارد توکنی، نقش «مغز دوم» را برای کاربر ایفا می‌کند. این ابزار با حذف وابستگی به ابر، حریم خصوصی را تضمین کرده و به ۱۱۸…

۲ دقیقه خواندن

آموزش کاربردی۳ هفته پیش

گزارش dev.to: معماری غلط باعث اتلاف ۴۳٪ بودجهٔ API مدل‌های زبانی می‌شود

گزارش جدیدی نشان می‌دهد ۴۳٪ از بودجه API مدل‌های زبانی به دلیل خطاهای معماری مثل «طوفان‌های تکرار» هدر می‌رود. پیاده‌سازی ابزارهای ساده‌ی ردیابی هزینه می‌تواند این هزینه‌ها را در…

۲ دقیقه خواندن

آموزش کاربردی۳ هفته پیش

انتخاب مدل بردار معنایی؛ مرز میان دقت بازیابی و سقوط بودجه در RAG

انتخاب درست مدل بردار معنایی و متریک شباهت، تعیین‌کننده دقت جست‌وجوی معنایی و سیستم‌های RAG است. این راهنما توازن میان ابعاد بردار و پیش‌پردازش داده‌ها برای بهینه‌سازی بازیابی را…

۲ دقیقه خواندن

آموزش کاربردی۳ هفته پیش

سازوکار RAG: مهار توهمات هوش مصنوعی با بهینه‌سازی خط لوله داده

تولید بازیابی‌افزا (RAG) با اتصال مدل‌های زبانی به داده‌های خصوصی و به‌روز، مشکل توهم و تاریخ انقضای دانش را حل می‌کند. در این معماری، تمرکز مهندسی از طراحی پرامپت به بهینه‌سازی…

۲ دقیقه خواندن

آموزش کاربردی۳ هفته پیش

چرا عامل‌های برنامه‌نویسی حافظه‌شان را می‌بازند و راهکار dtoolkit چیست؟

اکثر عامل‌های کدنویسی در هر جلسه جدید، پیشینه پروژه را فراموش می‌کنند و دچار توهم می‌شوند. dtoolkit یک لایه زیرساختی متن‌باز است که با استفاده از SQLite، حافظه پایدار و مدیریت…

۲ دقیقه خواندن

آموزش کاربردی۳ هفته پیش

چگونه حلقه‌های تفکر-عمل در ReAct توهمات هوش مصنوعی را متوقف می‌کنند؟

چارچوب ReAct مدل‌های زبانی را مجبور می‌کند پیش از پاسخ، فرض‌های خود را با ابزارهای خارجی بسنجند. این روش با جایگزینی پیش‌بینی‌های آماری با داده‌های واقعی، نرخ توهمات را به‌شدت…

۲ دقیقه خواندن

آموزش کاربردی۳ هفته پیش

سازوکار akm 0.8.0 برای توقف حلقه‌ی تخریب داده‌ها در عامل‌های هوش مصنوعی

نسخه‌ی 0.8.0 ابزار akm با معرفی «حافظه‌ی آگاه به باور»، از جایگزینی حقایق تأییدشده توسط انسان با داده‌های قدیمی یا توهمات عامل‌ها جلوگیری می‌کند. این سیستم با استفاده از حالت‌های…

۲ دقیقه خواندن

آموزش کاربردی۴ هفته پیش

Mnemo: پیاده‌سازی حافظه بلندمدت با سرعت ۴.۲ میلی‌ثانیه برای عامل‌های هوش مصنوعی

ابزار Mnemo یک لایه‌ی حافظه محلی است که با استفاده از SQLite، گراف دانشی دائمی برای مدل‌های زبانی ایجاد می‌کند. این سیستم با سرعت کمتر از ۵۰ میلی‌ثانیه، با مدل‌های OpenAI،…

۲ دقیقه خواندن

اخبار کوتاه روزانه۴ هفته پیش

درون معماری «مغز شرکتی» Hyper برای حل مشکل فراموشی عامل‌های هوش مصنوعی

پلتفرم **Hyper** با تبدیل ارتباطات پراکنده شرکتی به یک گراف دانش پویا، مشکل فراموشی یا به‌روز نبودن داده‌ها در عامل‌های هوش مصنوعی را حل می‌کند. این سیستم اجازه می‌دهد حقایق جدید…

۲ دقیقه خواندن

آموزش کاربردی۴ هفته پیش

سازوکار NemoClaw: آموزش مهارت‌های جدید به عامل‌های هوش مصنوعی از طریق چت

پشته‌ی نرم‌افزاری NemoClaw از شرکت NVIDIA به عامل‌های هوش مصنوعی اجازه می‌دهد مهارت‌های جدید را مستقیماً از گفتگو با کاربر بیاموزند و آن‌ها را ذخیره کنند. این سیستم با استفاده از…

۲ دقیقه خواندن

آموزش کاربردی۴ هفته پیش

چگونه ktx توهمات SQL را در عامل‌های هوش مصنوعی حذف می‌کند؟

ابزار ktx یک لایه‌ی محلی است که به عامل‌های هوش مصنوعی یاد می‌دهد داده‌های انبار را با معیارهای تأییدشده استخراج کنند. این سیستم نیاز به بازنویسی منطق SQL در هر درخواست را از بین…

۲ دقیقه خواندن