موضوع

بازیابی‌افزا

RAG architectures, vector stores, grounding LLMs in private data

۲۸۲ مقاله منتشر شده

چگونه پروتکل UMP وابستگی حافظه عامل‌های هوش مصنوعی به یک فروشنده را می‌شکند؟

پروتکل حافظه جهانی (UMP) روش ذخیره‌سازی و جابه‌جایی حافظه در عامل‌های هوش مصنوعی را استاندارد می‌کند. این سیستم با استفاده از رکوردهای JSON، مالکیت داده‌ها را از شرکت‌های…

۵ دقیقه خواندن

آموزش کاربردی۳ هفته پیش

چرا تکیه بر پنجره‌های متنی غول‌پیکر برای حافظه هوش مصنوعی یک اشتباه است؟

استارتاپ Backboard با معرفی معماری حافظه در سطح پیام، رتبه اول بنچمارک‌های LoCoMo و LongMemEval را کسب کرد. این روش برخلاف رویکرد رایج صنعت، به جای گسترش پنجره متنی، بر استخراج…

۴ دقیقه خواندن

آموزش کاربردی۳ هفته پیش

کاهش ۶۷ درصدی هزینه‌ی ذخیره‌سازی بردارها با بهینه‌سازی ابعاد مدل OpenAI

کاهش ابعاد بردارها در مدل text-embedding-3-small از ۱۵۳۶ به ۵۱۲، فضای مورد نیاز در دیتابیس‌های برداری را ۶۷٪ کاهش می‌دهد. این تغییر باعث کاهش تأخیر و هزینه‌ی حافظه می‌شود، اما…

۸ دقیقه خواندن

آموزش کاربردی۳ هفته پیش

چطور Obsidian را به مغز دوم و حافظهٔ دائمی Claude تبدیل کنیم؟

دیگر لازم نیست هر بار پیشینهٔ پروژه‌های خود را برای هوش مصنوعی توضیح دهید. با اتصال پوشه‌های Obsidian به Claude، یک پایگاه دانش دائمی می‌سازید که زمینهٔ کاری شما را برای همیشه حفظ…

۱ دقیقه خواندن

آموزش کاربردی۳ هفته پیش

سازوکار Omega Walls برای مسدود کردن تزریق پرامپت در خطوط لوله Haystack

شرکت Omega Walls با معرفی «مرز اعتماد»، راهکاری برای جلوگیری از تسخیر مدل‌های زبانی در سیستم‌های RAG ارائه کرد. این ابزار اجازه می‌دهد اسناد خطرناک بدون توقف کل خط لوله فیلتر شوند…

۲ دقیقه خواندن

آموزش کاربردی۳ هفته پیش

گزارش MIT: ۹۵٪ از پیلوت‌های هوش مصنوعی سازمانی شکست مالی خورده‌اند

عامل‌های هوش مصنوعی نه به دلیل ضعف مدل‌ها، بلکه به دلیل نقص‌های معماری مثل «بدهی متنی» در محیط عملیاتی شکست می‌خورند. متخصصان برای عبور از این نرخ شکست ۹۵ درصدی، استفاده از معماری…

۲ دقیقه خواندن۱

آموزش کاربردی۳ هفته پیش

چرا مهندسی بک‌اند از کدنویسی قطعی به ارکستراسیون عامل‌محور کوچ می‌کند؟

توسعه‌دهندگان بک‌اند در حال گذار از نوشتن کدهای صلب به مدیریت جریان‌های کاری عامل‌محور هستند. با ترکیب مدل‌های زبانی و پروتکل‌های استاندارد، اکنون می‌توان سیستم‌های هوش مصنوعی را…

۳ دقیقه خواندن

آموزش کاربردی۳ هفته پیش

کاهش تأخیر جست‌وجو از ۴.۲ ثانیه به ۴۵۰ میلی‌ثانیه با رنکر سفارشی Rust

یک تیم توسعه با جایگزینی سیستم امتیازدهی کند Veltrix و استفاده از یک رنکر سفارشی به زبان Rust، تأخیر p95 را از ۴.۲ ثانیه به ۴۵۰ میلی‌ثانیه رساند. این تغییر ساختاری نرخ خطا را به…

۲ دقیقه خواندن

آموزش کاربردی۳ هفته پیش

چطور گره‌های محلی هوش مصنوعی هزینه‌های ماهانه CRM را به صفر می‌رسانند؟

پلتفرم BizNode با انتقال مدیریت مشتریان و جذب لید از فضای ابری به سخت‌افزار محلی، مدل اشتراکی SaaS را با خرید یک‌باره جایگزین کرده است. این ابزار با استفاده از یک استک محلی، امنیت…

۲ دقیقه خواندن

آموزش کاربردی۳ هفته پیش

Pi-Memoir: کاهش ۹۹.۹ درصدی هزینه توکن‌های کدنویسی با حافظهٔ پایدار

ابزار Pi-memoir با ایجاد یک پایگاه دانش دائمی، مشکل «حافظه ماهی» در عامل‌های کدنویسی را حل می‌کند. این رویکرد نیاز به اسکن‌های تکراری فایل‌ها را حذف کرده و هزینه‌های توکن را در…

۲ دقیقه خواندن

آموزش کاربردی۳ هفته پیش

Synthadoc: کاهش تأخیر جست‌وجو در ۱۰ هزار صفحه به ۲۴ میلی‌ثانیه

نسخه‌ی ۰.۴.۰ Synthadoc با معرفی لایه‌ی مسیریابی و بسته‌های متنی، تأخیر پاسخگویی را در مقیاس ۱۰ هزار صفحه به شدت کاهش داد. این به‌روزرسانی، ابزار را از یک ویکی ساده به یک زیرساخت…

۳ دقیقه خواندن

آموزش کاربردی۳ هفته پیش

از ۲۰ یورو تا ۱۲۳۰ یورو؛ هزینه‌ی واقعی زیرساخت برای ۸ محصول SaaS هوش مصنوعی

دیوید فریدمن، بنیان‌گذار AppBrewers، جزئیات فنی و مالی ساخت ۸ محصول SaaS هوش مصنوعی در سال ۲۰۲۵ را افشا کرد. این گزارش بازه‌های زمانی دقیق و هزینه‌های ماهانه زیرساخت را برای ۶…

۲ دقیقه خواندن