پرش به محتوای اصلی

موضوع

بازیابی‌افزا

RAG architectures, vector stores, grounding LLMs in private data

۲۸۱ مقاله منتشر شده

AI

OpenAI: ادغام اخبار تأییدشده‌ی برزیل در ChatGPT برای کاهش توهمات محلی

OpenAI با همکاری دو گروه خبری بزرگ برزیل، اخبار تأییدشده را به پاسخ‌های ChatGPT اضافه کرد. این توافق باعث می‌شود ۹۰۰ میلیون کاربر به خلاصه‌های خبری دقیق دسترسی داشته باشند و…

۲ دقیقه خواندن
AI
آموزش کاربردی

گوگل و NYU: کاهش ۸ برابری حافظه مورد نیاز برای جستجوی برداری بدون آموزش

کتابخانه turbovec با معرفی روشی جدید برای کوانتایز کردن بردارها، مصرف حافظه در سیستم‌های RAG را ۸ برابر کاهش می‌دهد. این فناوری برخلاف روش‌های سنتی، نیازی به داده‌های آموزشی ندارد…

۲ دقیقه خواندن
AI
آموزش کاربردی

چرا نباید حافظه پروژه‌های خود را به دست یک شرکت هوش مصنوعی بسپارید؟

پلتفرم Alma با جداسازی حافظه از مدل‌های زبانی، اجازه می‌دهد هویت و بافت پروژه‌های شما در جابه‌جایی بین مدل‌های مختلف حفظ شود. این سیستم با استفاده از رایانش لبه، دسترسی به داده‌ها…

۳ دقیقه خواندن
AI
آموزش کاربردی

۵ تاکتیک برای تبدیل شدن به منبع اصلی استنادات هوش مصنوعی زاینده

بهینه‌سازی موتورهای زاینده (GEO) در حال جایگزینی سئوی سنتی است. هدف دیگر رتبه گرفتن در لیست لینک‌ها نیست، بلکه تبدیل شدن به منبعی است که مدل‌های زبانی در پاسخ‌های خود نقل می‌کنند.

۲ دقیقه خواندن
AI

بنچمارک CiteVQA: دقت GPT-5.4 در استناد به منابع تا ۵۹ درصد سقوط کرد

پژوهشگران با معرفی بنچمارک CiteVQA، پدیده‌ی «توهم استنادی» را شناسایی کردند؛ وضعیتی که در آن مدل‌ها پاسخ درست می‌دهند اما منبع اشتباهی را ذکر می‌کنند. نتایج نشان می‌دهد حتی…

۳ دقیقه خواندن
AI
آموزش کاربردی

سازوکار NVIDIA AI-Q برای تفکیک خط لوله‌ی پژوهش از عامل‌های هوشمند

انویدیا با معرفی AI-Q، طرحی بازمتن برای انتقال وظایف پیچیده‌ی پژوهشی از عامل‌هایی مثل Claude Code به سرورهای اختصاصی ارائه داد. این ابزار اجازه می‌دهد داده‌های حساس سازمانی بدون…

۲ دقیقه خواندن
راهکار MemPrivacy برای تأمین حریم خصوصی حافظه ابری با جایگزین‌های نوع‌بندی‌شده

راهکار MemPrivacy برای تأمین حریم خصوصی حافظه ابری با جایگزین‌های نوع‌بندی‌شده

پژوهشگران چارچوب MemPrivacy را برای محافظت از داده‌های حساس در عامل‌های هوش مصنوعی لبه-ابر معرفی کردند. این روش با جایگزینی اطلاعات خصوصی با توصیف‌گرهای معنایی، توانایی استدلال…

۲ دقیقه خواندن
افزایش ۲.۷ درصدی نرخ افزودن به سبد خرید با معماری متوالی LLM

افزایش ۲.۷ درصدی نرخ افزودن به سبد خرید با معماری متوالی LLM

یک چارچوب جدید مبتنی بر مدل‌های زبانی متوالی، نرخ افزودن کالا به سبد خرید در فروشگاه‌های آنلاین را ۲.۷٪ افزایش داد. این سیستم با استفاده از فرآیند تولید دو مرحله‌ای و تنظیم دقیق…

۲ دقیقه خواندن
چرا ذخیره‌سازهای برداری برای حافظه بلندمدت عامل‌های هوش مصنوعی کافی نیستند؟
آموزش کاربردی

چرا ذخیره‌سازهای برداری برای حافظه بلندمدت عامل‌های هوش مصنوعی کافی نیستند؟

روش‌های رایج بازیابی داده در عامل‌های هوش مصنوعی با افزایش حجم اطلاعات شکست می‌خورند. معماری جدیدی با چهار لایه حافظه و یک موتور مشاهده، رویدادهای خام را به قوانین رفتاری دائمی…

۲ دقیقه خواندن