پرش به محتوای اصلی

موضوع

بازیابی‌افزا

RAG architectures, vector stores, grounding LLMs in private data

۲۸۱ مقاله منتشر شده

گزارش NJIT: هم‌پوشانی منابع در سه سیستم جستجوی گوگل کمتر از ۲۰٪ است

گزارش NJIT: هم‌پوشانی منابع در سه سیستم جستجوی گوگل کمتر از ۲۰٪ است

پژوهشی جدید نشان می‌دهد گوگل سرچ، AI Overviews و Gemini به عنوان سه سیستم اطلاعاتی مجزا با منطق‌های رتبه‌بندی متفاوت عمل می‌کنند. این ابزارها به‌ندرت بر سر منابع مورد استناد توافق…

۴ دقیقه خواندن
چرا مکانیسم‌های خوداصلاحی مدل‌های زبانی در برابر حملات M³Att شکست می‌خورند؟

چرا مکانیسم‌های خوداصلاحی مدل‌های زبانی در برابر حملات M³Att شکست می‌خورند؟

پژوهشگران چارچوب M³Att را معرفی کردند که با استفاده از محرک‌های بصری و اطلاعات گمراه‌کننده، سیستم‌های RAG پزشکی را هدف قرار می‌دهد. این حمله مدل‌ها را فریب می‌دهد تا تشخیص‌های…

۲ دقیقه خواندن
LegalCiteBench: نرخ خطای ۹۴ درصدی مدل‌های زبانی در بازیابی استنادات حقوقی

LegalCiteBench: نرخ خطای ۹۴ درصدی مدل‌های زبانی در بازیابی استنادات حقوقی

یک بنچمارک جدید نشان می‌دهد که پیشرفته‌ترین مدل‌های زبانی در بازیابی دقیق استنادات حقوقی بدون دسترسی به منابع خارجی شکست می‌خورند. این مطالعه ثابت می‌کند که مقیاس مدل و پیش‌آموزش…

۲ دقیقه خواندن
نقشه راه SuperML.dev برای تبدیل دموهای هوش مصنوعی به سیستم‌های صنعتی
آموزش کاربردی

نقشه راه SuperML.dev برای تبدیل دموهای هوش مصنوعی به سیستم‌های صنعتی

برگ برنده در هوش مصنوعی سازمانی دیگر مدل نیست، بلکه معماری پیرامونی آن است. پلتفرم SuperML.dev لایه‌های حیاتی مانند قراردادهای معنایی و صفحات کنترل عامل را برای عبور از مرحله‌ی…

۲ دقیقه خواندن
چرا شباهت کسینوسی برای استخراج عوامل ریشه‌ای در گزارش‌های پزشکی ناکارآمد است؟

چرا شباهت کسینوسی برای استخراج عوامل ریشه‌ای در گزارش‌های پزشکی ناکارآمد است؟

پژوهشی جدید نشان می‌دهد انتخاب نمونه‌های Few-shot بر اساس برچسب‌های متنی، بسیار پایدارتر از شباهت کسینوسی در تولید گزارش‌های حوادث پزشکی است. این روش در مدل‌های GPT-4o و LLaMA 3.3…

۲ دقیقه خواندن
چرا پرسوناهای دیجیتال در پیش‌بینی رفتارهای نادر انسانی شکست می‌خورند؟

چرا پرسوناهای دیجیتال در پیش‌بینی رفتارهای نادر انسانی شکست می‌خورند؟

پژوهش‌های جدید نشان می‌دهد پرسوناهای مبتنی بر مدل‌های زبانی در بازسازی میانگین‌های گروهی موفق‌اند، اما در پیش‌بینی پاسخ‌های فردی و رفتارهای نادر ناتوان هستند. با وجود بهبود عملکرد…

۲ دقیقه خواندن
چرا حذف کامل «سندهای مزاحم» حیاتی‌تر از کاهش حجم پنجره متنی است؟

چرا حذف کامل «سندهای مزاحم» حیاتی‌تر از کاهش حجم پنجره متنی است؟

حضور مقدار اندکی اطلاعات گمراه‌کننده در متون طولانی، باعث سقوط غیرخطی عملکرد مدل‌های زبانی می‌شود. این یافته نشان می‌دهد که دقت در بازیابی داده‌ها بسیار حیاتی‌تر از کاهش کلی حجم…

۲ دقیقه خواندن
چرا برترین عامل‌های هوش مصنوعی در محیط‌های پیچیده از سد ۶۰ درصد عبور نمی‌کنند؟

چرا برترین عامل‌های هوش مصنوعی در محیط‌های پیچیده از سد ۶۰ درصد عبور نمی‌کنند؟

بنچمارک جدید ComplexMCP نشان می‌دهد برترین عامل‌های هوش مصنوعی در محیط‌های ابزاری پیچیده تنها ۶۰ درصد موفقیت دارند، در حالی که این رقم برای انسان‌ها ۹۰ درصد است. این مطالعه…

۲ دقیقه خواندن
استخراج استدلال؛ سازوکاری برای کاهش توهمات مدل‌های زبانی در روایت‌های سلامت

استخراج استدلال؛ سازوکاری برای کاهش توهمات مدل‌های زبانی در روایت‌های سلامت

پژوهشگران با ترکیب استخراج استدلال و گراف‌های دانش، سیستمی برای کاهش توهمات مدل‌های زبانی در روایت‌های سلامت سالمندان طراحی کرده‌اند. این معماری بازتابی تضمین می‌کند که داستان‌های…

۲ دقیقه خواندن
گزارش arXiv: ابزارهای پژوهشی هوش مصنوعی در معیارهای بازتولیدپذیری مردود شدند

گزارش arXiv: ابزارهای پژوهشی هوش مصنوعی در معیارهای بازتولیدپذیری مردود شدند

ابزارهای هوش مصنوعی در خلاصه‌سازی متون موفق هستند اما در استخراج دقیق داده‌های علمی شکست می‌خورند. یک چارچوب ارزیابی جدید نشان می‌دهد که ویژگی‌های هوش مصنوعی توضیح‌پذیر اغلب به…

۲ دقیقه خواندن