OpenAI: ادغام اخبار تأییدشدهی برزیل در ChatGPT برای کاهش توهمات محلی
OpenAI با همکاری دو گروه خبری بزرگ برزیل، اخبار تأییدشده را به پاسخهای ChatGPT اضافه کرد. این توافق باعث میشود ۹۰۰ میلیون کاربر به خلاصههای خبری دقیق دسترسی داشته باشند و…
موضوع
RAG architectures, vector stores, grounding LLMs in private data
۲۸۱ مقاله منتشر شده
OpenAI با همکاری دو گروه خبری بزرگ برزیل، اخبار تأییدشده را به پاسخهای ChatGPT اضافه کرد. این توافق باعث میشود ۹۰۰ میلیون کاربر به خلاصههای خبری دقیق دسترسی داشته باشند و…
کتابخانه turbovec با معرفی روشی جدید برای کوانتایز کردن بردارها، مصرف حافظه در سیستمهای RAG را ۸ برابر کاهش میدهد. این فناوری برخلاف روشهای سنتی، نیازی به دادههای آموزشی ندارد…
پلتفرم Alma با جداسازی حافظه از مدلهای زبانی، اجازه میدهد هویت و بافت پروژههای شما در جابهجایی بین مدلهای مختلف حفظ شود. این سیستم با استفاده از رایانش لبه، دسترسی به دادهها…
بهینهسازی موتورهای زاینده (GEO) در حال جایگزینی سئوی سنتی است. هدف دیگر رتبه گرفتن در لیست لینکها نیست، بلکه تبدیل شدن به منبعی است که مدلهای زبانی در پاسخهای خود نقل میکنند.
پژوهشگران با معرفی بنچمارک CiteVQA، پدیدهی «توهم استنادی» را شناسایی کردند؛ وضعیتی که در آن مدلها پاسخ درست میدهند اما منبع اشتباهی را ذکر میکنند. نتایج نشان میدهد حتی…
انویدیا با معرفی AI-Q، طرحی بازمتن برای انتقال وظایف پیچیدهی پژوهشی از عاملهایی مثل Claude Code به سرورهای اختصاصی ارائه داد. این ابزار اجازه میدهد دادههای حساس سازمانی بدون…

شرکت Hugging Face خانواده مدلهای Ettin Reranker را معرفی کرد که با استفاده از تکنیک حذف توکنهای اضافی (unpadding)، سرعت و دقت رتبهبندی اسناد را در سیستمهای RAG بهشدت افزایش…

پژوهشگران چارچوب MemPrivacy را برای محافظت از دادههای حساس در عاملهای هوش مصنوعی لبه-ابر معرفی کردند. این روش با جایگزینی اطلاعات خصوصی با توصیفگرهای معنایی، توانایی استدلال…

یک چارچوب جدید مبتنی بر مدلهای زبانی متوالی، نرخ افزودن کالا به سبد خرید در فروشگاههای آنلاین را ۲.۷٪ افزایش داد. این سیستم با استفاده از فرآیند تولید دو مرحلهای و تنظیم دقیق…

OpenAI و Dell برای اجرای Codex در محیطهای محلی و ترکیبی همکاری میکنند. این اقدام به شرکتها اجازه میدهد بدون ارسال کدهای حساس به ابر، از عاملهای کدنویسی استفاده کنند.

نسخه ۳.۵ ابزار PaddleOCR اکنون امکان اجرای مدلهای پردازش اسناد را در بستر Transformers فراهم کرده است. این تغییر، یکپارچهسازی مدلهای OCR را برای توسعهدهندگانی که از اکوسیستم…

روشهای رایج بازیابی داده در عاملهای هوش مصنوعی با افزایش حجم اطلاعات شکست میخورند. معماری جدیدی با چهار لایه حافظه و یک موتور مشاهده، رویدادهای خام را به قوانین رفتاری دائمی…