پرش به محتوای اصلی

موضوع

بازیابی‌افزا

RAG architectures, vector stores, grounding LLMs in private data

۲۸۲ مقاله منتشر شده

آموزش کاربردی

چگونه پروتکل UMP وابستگی حافظه عامل‌های هوش مصنوعی به یک فروشنده را می‌شکند؟

پروتکل حافظه جهانی (UMP) روش ذخیره‌سازی و جابه‌جایی حافظه در عامل‌های هوش مصنوعی را استاندارد می‌کند. این سیستم با استفاده از رکوردهای JSON، مالکیت داده‌ها را از شرکت‌های…

۵ دقیقه خواندن
آموزش کاربردی

چرا تکیه بر پنجره‌های متنی غول‌پیکر برای حافظه هوش مصنوعی یک اشتباه است؟

استارتاپ Backboard با معرفی معماری حافظه در سطح پیام، رتبه اول بنچمارک‌های LoCoMo و LongMemEval را کسب کرد. این روش برخلاف رویکرد رایج صنعت، به جای گسترش پنجره متنی، بر استخراج…

۴ دقیقه خواندن
آموزش کاربردی

کاهش ۶۷ درصدی هزینه‌ی ذخیره‌سازی بردارها با بهینه‌سازی ابعاد مدل OpenAI

کاهش ابعاد بردارها در مدل text-embedding-3-small از ۱۵۳۶ به ۵۱۲، فضای مورد نیاز در دیتابیس‌های برداری را ۶۷٪ کاهش می‌دهد. این تغییر باعث کاهش تأخیر و هزینه‌ی حافظه می‌شود، اما…

۸ دقیقه خواندن
سازوکار Omega Walls برای مسدود کردن تزریق پرامپت در خطوط لوله Haystack
آموزش کاربردی

سازوکار Omega Walls برای مسدود کردن تزریق پرامپت در خطوط لوله Haystack

شرکت Omega Walls با معرفی «مرز اعتماد»، راهکاری برای جلوگیری از تسخیر مدل‌های زبانی در سیستم‌های RAG ارائه کرد. این ابزار اجازه می‌دهد اسناد خطرناک بدون توقف کل خط لوله فیلتر شوند…

۲ دقیقه خواندن
گزارش MIT: ۹۵٪ از پیلوت‌های هوش مصنوعی سازمانی شکست مالی خورده‌اند
آموزش کاربردی

گزارش MIT: ۹۵٪ از پیلوت‌های هوش مصنوعی سازمانی شکست مالی خورده‌اند

عامل‌های هوش مصنوعی نه به دلیل ضعف مدل‌ها، بلکه به دلیل نقص‌های معماری مثل «بدهی متنی» در محیط عملیاتی شکست می‌خورند. متخصصان برای عبور از این نرخ شکست ۹۵ درصدی، استفاده از معماری…

۲ دقیقه خواندن۱
چرا مهندسی بک‌اند از کدنویسی قطعی به ارکستراسیون عامل‌محور کوچ می‌کند؟
آموزش کاربردی

چرا مهندسی بک‌اند از کدنویسی قطعی به ارکستراسیون عامل‌محور کوچ می‌کند؟

توسعه‌دهندگان بک‌اند در حال گذار از نوشتن کدهای صلب به مدیریت جریان‌های کاری عامل‌محور هستند. با ترکیب مدل‌های زبانی و پروتکل‌های استاندارد، اکنون می‌توان سیستم‌های هوش مصنوعی را…

۳ دقیقه خواندن
کاهش تأخیر جست‌وجو از ۴.۲ ثانیه به ۴۵۰ میلی‌ثانیه با رنکر سفارشی Rust
آموزش کاربردی

کاهش تأخیر جست‌وجو از ۴.۲ ثانیه به ۴۵۰ میلی‌ثانیه با رنکر سفارشی Rust

یک تیم توسعه با جایگزینی سیستم امتیازدهی کند Veltrix و استفاده از یک رنکر سفارشی به زبان Rust، تأخیر p95 را از ۴.۲ ثانیه به ۴۵۰ میلی‌ثانیه رساند. این تغییر ساختاری نرخ خطا را به…

۲ دقیقه خواندن
چطور گره‌های محلی هوش مصنوعی هزینه‌های ماهانه CRM را به صفر می‌رسانند؟
آموزش کاربردی

چطور گره‌های محلی هوش مصنوعی هزینه‌های ماهانه CRM را به صفر می‌رسانند؟

پلتفرم BizNode با انتقال مدیریت مشتریان و جذب لید از فضای ابری به سخت‌افزار محلی، مدل اشتراکی SaaS را با خرید یک‌باره جایگزین کرده است. این ابزار با استفاده از یک استک محلی، امنیت…

۲ دقیقه خواندن
Pi-Memoir: کاهش ۹۹.۹ درصدی هزینه توکن‌های کدنویسی با حافظهٔ پایدار
آموزش کاربردی

Pi-Memoir: کاهش ۹۹.۹ درصدی هزینه توکن‌های کدنویسی با حافظهٔ پایدار

ابزار Pi-memoir با ایجاد یک پایگاه دانش دائمی، مشکل «حافظه ماهی» در عامل‌های کدنویسی را حل می‌کند. این رویکرد نیاز به اسکن‌های تکراری فایل‌ها را حذف کرده و هزینه‌های توکن را در…

۲ دقیقه خواندن
از ۲۰ یورو تا ۱۲۳۰ یورو؛ هزینه‌ی واقعی زیرساخت برای ۸ محصول SaaS هوش مصنوعی
آموزش کاربردی

از ۲۰ یورو تا ۱۲۳۰ یورو؛ هزینه‌ی واقعی زیرساخت برای ۸ محصول SaaS هوش مصنوعی

دیوید فریدمن، بنیان‌گذار AppBrewers، جزئیات فنی و مالی ساخت ۸ محصول SaaS هوش مصنوعی در سال ۲۰۲۵ را افشا کرد. این گزارش بازه‌های زمانی دقیق و هزینه‌های ماهانه زیرساخت را برای ۶…

۲ دقیقه خواندن