موضوع

بازیابی‌افزا

RAG architectures, vector stores, grounding LLMs in private data

۲۸۱ مقاله منتشر شده

گزارش NJIT: هم‌پوشانی منابع در سه سیستم جستجوی گوگل کمتر از ۲۰٪ است

پژوهشی جدید نشان می‌دهد گوگل سرچ، AI Overviews و Gemini به عنوان سه سیستم اطلاعاتی مجزا با منطق‌های رتبه‌بندی متفاوت عمل می‌کنند. این ابزارها به‌ندرت بر سر منابع مورد استناد توافق…

۴ دقیقه خواندن

تحلیل و بررسی تخصصیماه گذشته

دقت ۹۵.۹۸ درصدی Qwen3 در درک اسناد پیچیده اوکراینی

یک خط‌لوله جدید تولید بازیابی‌افزا (RAG) با استفاده از مدل‌های Qwen3 توانست به دقت ۹۵.۹۸ درصدی در درک اسناد چنددامنه اوکراینی دست یابد. این سیستم ثابت می‌کند که بازرتب‌بندی آگاه…

۲ دقیقه خواندن

تحلیل و بررسی تخصصیماه گذشته

چرا مکانیسم‌های خوداصلاحی مدل‌های زبانی در برابر حملات M³Att شکست می‌خورند؟

پژوهشگران چارچوب M³Att را معرفی کردند که با استفاده از محرک‌های بصری و اطلاعات گمراه‌کننده، سیستم‌های RAG پزشکی را هدف قرار می‌دهد. این حمله مدل‌ها را فریب می‌دهد تا تشخیص‌های…

۲ دقیقه خواندن

تحلیل و بررسی تخصصیماه گذشته

LegalCiteBench: نرخ خطای ۹۴ درصدی مدل‌های زبانی در بازیابی استنادات حقوقی

یک بنچمارک جدید نشان می‌دهد که پیشرفته‌ترین مدل‌های زبانی در بازیابی دقیق استنادات حقوقی بدون دسترسی به منابع خارجی شکست می‌خورند. این مطالعه ثابت می‌کند که مقیاس مدل و پیش‌آموزش…

۲ دقیقه خواندن

آموزش کاربردی۲ ماه پیش

نقشه راه SuperML.dev برای تبدیل دموهای هوش مصنوعی به سیستم‌های صنعتی

برگ برنده در هوش مصنوعی سازمانی دیگر مدل نیست، بلکه معماری پیرامونی آن است. پلتفرم SuperML.dev لایه‌های حیاتی مانند قراردادهای معنایی و صفحات کنترل عامل را برای عبور از مرحله‌ی…

۲ دقیقه خواندن

تحلیل و بررسی تخصصی۲ ماه پیش

چرا شباهت کسینوسی برای استخراج عوامل ریشه‌ای در گزارش‌های پزشکی ناکارآمد است؟

پژوهشی جدید نشان می‌دهد انتخاب نمونه‌های Few-shot بر اساس برچسب‌های متنی، بسیار پایدارتر از شباهت کسینوسی در تولید گزارش‌های حوادث پزشکی است. این روش در مدل‌های GPT-4o و LLaMA 3.3…

۲ دقیقه خواندن

تحلیل و بررسی تخصصی۲ ماه پیش

چرا پرسوناهای دیجیتال در پیش‌بینی رفتارهای نادر انسانی شکست می‌خورند؟

پژوهش‌های جدید نشان می‌دهد پرسوناهای مبتنی بر مدل‌های زبانی در بازسازی میانگین‌های گروهی موفق‌اند، اما در پیش‌بینی پاسخ‌های فردی و رفتارهای نادر ناتوان هستند. با وجود بهبود عملکرد…

۲ دقیقه خواندن

تحلیل و بررسی تخصصی۲ ماه پیش

DeepRefine: عبور از RAG ایستا به لایه‌ی دانش خود-ترمیم‌شونده

مدل DeepRefine با استفاده از یادگیری تقویت‌شده، نقص‌ها و افزونگی‌های پایگاه دانش در عامل‌های هوش مصنوعی را شناسایی و اصلاح می‌کند. این مدل با معرفی پاداش GBD، نیاز به داده‌های…

۲ دقیقه خواندن

تحلیل و بررسی تخصصی۲ ماه پیش

چرا حذف کامل «سندهای مزاحم» حیاتی‌تر از کاهش حجم پنجره متنی است؟

حضور مقدار اندکی اطلاعات گمراه‌کننده در متون طولانی، باعث سقوط غیرخطی عملکرد مدل‌های زبانی می‌شود. این یافته نشان می‌دهد که دقت در بازیابی داده‌ها بسیار حیاتی‌تر از کاهش کلی حجم…

۲ دقیقه خواندن

تحلیل و بررسی تخصصی۲ ماه پیش

چرا برترین عامل‌های هوش مصنوعی در محیط‌های پیچیده از سد ۶۰ درصد عبور نمی‌کنند؟

بنچمارک جدید ComplexMCP نشان می‌دهد برترین عامل‌های هوش مصنوعی در محیط‌های ابزاری پیچیده تنها ۶۰ درصد موفقیت دارند، در حالی که این رقم برای انسان‌ها ۹۰ درصد است. این مطالعه…

۲ دقیقه خواندن

تحلیل و بررسی تخصصی۲ ماه پیش

استخراج استدلال؛ سازوکاری برای کاهش توهمات مدل‌های زبانی در روایت‌های سلامت

پژوهشگران با ترکیب استخراج استدلال و گراف‌های دانش، سیستمی برای کاهش توهمات مدل‌های زبانی در روایت‌های سلامت سالمندان طراحی کرده‌اند. این معماری بازتابی تضمین می‌کند که داستان‌های…

۲ دقیقه خواندن

تحلیل و بررسی تخصصی۲ ماه پیش

گزارش arXiv: ابزارهای پژوهشی هوش مصنوعی در معیارهای بازتولیدپذیری مردود شدند

ابزارهای هوش مصنوعی در خلاصه‌سازی متون موفق هستند اما در استخراج دقیق داده‌های علمی شکست می‌خورند. یک چارچوب ارزیابی جدید نشان می‌دهد که ویژگی‌های هوش مصنوعی توضیح‌پذیر اغلب به…

۲ دقیقه خواندن