موضوع

بازیابی‌افزا

RAG architectures, vector stores, grounding LLMs in private data

۲۸۱ مقاله منتشر شده

OpenAI: ادغام اخبار تأییدشده‌ی برزیل در ChatGPT برای کاهش توهمات محلی

OpenAI با همکاری دو گروه خبری بزرگ برزیل، اخبار تأییدشده را به پاسخ‌های ChatGPT اضافه کرد. این توافق باعث می‌شود ۹۰۰ میلیون کاربر به خلاصه‌های خبری دقیق دسترسی داشته باشند و…

۲ دقیقه خواندن

آموزش کاربردیماه گذشته

گوگل و NYU: کاهش ۸ برابری حافظه مورد نیاز برای جستجوی برداری بدون آموزش

کتابخانه turbovec با معرفی روشی جدید برای کوانتایز کردن بردارها، مصرف حافظه در سیستم‌های RAG را ۸ برابر کاهش می‌دهد. این فناوری برخلاف روش‌های سنتی، نیازی به داده‌های آموزشی ندارد…

۲ دقیقه خواندن

آموزش کاربردیماه گذشته

چرا نباید حافظه پروژه‌های خود را به دست یک شرکت هوش مصنوعی بسپارید؟

پلتفرم Alma با جداسازی حافظه از مدل‌های زبانی، اجازه می‌دهد هویت و بافت پروژه‌های شما در جابه‌جایی بین مدل‌های مختلف حفظ شود. این سیستم با استفاده از رایانش لبه، دسترسی به داده‌ها…

۳ دقیقه خواندن

آموزش کاربردیماه گذشته

۵ تاکتیک برای تبدیل شدن به منبع اصلی استنادات هوش مصنوعی زاینده

بهینه‌سازی موتورهای زاینده (GEO) در حال جایگزینی سئوی سنتی است. هدف دیگر رتبه گرفتن در لیست لینک‌ها نیست، بلکه تبدیل شدن به منبعی است که مدل‌های زبانی در پاسخ‌های خود نقل می‌کنند.

۲ دقیقه خواندن

تحلیل و بررسی تخصصیماه گذشته

بنچمارک CiteVQA: دقت GPT-5.4 در استناد به منابع تا ۵۹ درصد سقوط کرد

پژوهشگران با معرفی بنچمارک CiteVQA، پدیده‌ی «توهم استنادی» را شناسایی کردند؛ وضعیتی که در آن مدل‌ها پاسخ درست می‌دهند اما منبع اشتباهی را ذکر می‌کنند. نتایج نشان می‌دهد حتی…

۳ دقیقه خواندن

آموزش کاربردیماه گذشته

سازوکار NVIDIA AI-Q برای تفکیک خط لوله‌ی پژوهش از عامل‌های هوشمند

انویدیا با معرفی AI-Q، طرحی بازمتن برای انتقال وظایف پیچیده‌ی پژوهشی از عامل‌هایی مثل Claude Code به سرورهای اختصاصی ارائه داد. این ابزار اجازه می‌دهد داده‌های حساس سازمانی بدون…

۲ دقیقه خواندن

آموزش کاربردیماه گذشته

چگونه مدل‌های Ettin با حذف توکن‌های اضافی، سرعت RAG را ۸ برابر کردند؟

شرکت Hugging Face خانواده مدل‌های Ettin Reranker را معرفی کرد که با استفاده از تکنیک حذف توکن‌های اضافی (unpadding)، سرعت و دقت رتبه‌بندی اسناد را در سیستم‌های RAG به‌شدت افزایش…

۳ دقیقه خواندن

تحلیل و بررسی تخصصیماه گذشته

راهکار MemPrivacy برای تأمین حریم خصوصی حافظه ابری با جایگزین‌های نوع‌بندی‌شده

پژوهشگران چارچوب MemPrivacy را برای محافظت از داده‌های حساس در عامل‌های هوش مصنوعی لبه-ابر معرفی کردند. این روش با جایگزینی اطلاعات خصوصی با توصیف‌گرهای معنایی، توانایی استدلال…

۲ دقیقه خواندن

تحلیل و بررسی تخصصیماه گذشته

افزایش ۲.۷ درصدی نرخ افزودن به سبد خرید با معماری متوالی LLM

یک چارچوب جدید مبتنی بر مدل‌های زبانی متوالی، نرخ افزودن کالا به سبد خرید در فروشگاه‌های آنلاین را ۲.۷٪ افزایش داد. این سیستم با استفاده از فرآیند تولید دو مرحله‌ای و تنظیم دقیق…

۲ دقیقه خواندن

اخبار کوتاه روزانهماه گذشته

رمزگشایی از استراتژی OpenAI برای استقرار Codex در سرورهای محلی Dell

OpenAI و Dell برای اجرای Codex در محیط‌های محلی و ترکیبی همکاری می‌کنند. این اقدام به شرکت‌ها اجازه می‌دهد بدون ارسال کدهای حساس به ابر، از عامل‌های کدنویسی استفاده کنند.

۲ دقیقه خواندن

آموزش کاربردیماه گذشته

اتصال PaddleOCR 3.5 به Transformers؛ راهکاری برای حذف اصطکاک در خط لوله‌های RAG

نسخه ۳.۵ ابزار PaddleOCR اکنون امکان اجرای مدل‌های پردازش اسناد را در بستر Transformers فراهم کرده است. این تغییر، یکپارچه‌سازی مدل‌های OCR را برای توسعه‌دهندگانی که از اکوسیستم…

۲ دقیقه خواندن

آموزش کاربردیماه گذشته

چرا ذخیره‌سازهای برداری برای حافظه بلندمدت عامل‌های هوش مصنوعی کافی نیستند؟

روش‌های رایج بازیابی داده در عامل‌های هوش مصنوعی با افزایش حجم اطلاعات شکست می‌خورند. معماری جدیدی با چهار لایه حافظه و یک موتور مشاهده، رویدادهای خام را به قوانین رفتاری دائمی…

۲ دقیقه خواندن