پرش به محتوای اصلی

موضوع

بازیابی‌افزا

RAG architectures, vector stores, grounding LLMs in private data

۲۸۲ مقاله منتشر شده

KG-CFR: کاهش نرخ فروپاشی منطقی در ۹۵٪ از آزمون‌های استرس عامل‌های هوش مصنوعی

KG-CFR: کاهش نرخ فروپاشی منطقی در ۹۵٪ از آزمون‌های استرس عامل‌های هوش مصنوعی

پژوهشگران معماری جدیدی به نام KG-CFR معرفی کرده‌اند که با جداسازی برنامه‌ریزی داخلی از اجرای خارجی، مشکل «انحراف نقش» در بحث‌های چندعاملی را حل می‌کند. این رویکرد پایداری و کیفیت…

۲ دقیقه خواندن
چرا استنتاج آفلاین در معماری AIR سرعت توصیه‌های هوش مصنوعی را ۴۰۰ برابر کرد؟

چرا استنتاج آفلاین در معماری AIR سرعت توصیه‌های هوش مصنوعی را ۴۰۰ برابر کرد؟

چارچوب AIR با انتقال استدلال مدل‌های زبانی به فاز آفلاین، گلوگاه تأخیر در سیستم‌های توصیه‌گر صنعتی را برطرف کرده است. این رویکرد در Kuaishou موجب افزایش ۳.۴۴۶ درصدی حجم کالاهای…

۱ دقیقه خواندن
مدیریت حافظه در عامل‌های هوش مصنوعی؛ از heuristic ساده به بهینه‌سازی استوکاستیک

مدیریت حافظه در عامل‌های هوش مصنوعی؛ از heuristic ساده به بهینه‌سازی استوکاستیک

پژوهشگران چارچوب OSL-MR را معرفی کردند که حافظه عامل‌های هوش مصنوعی را به عنوان یک مسئله بهینه‌سازی استوکاستیک مقید مدل می‌کند. این روش با محاسبه هزینه فراموشی در برابر سود…

۱ دقیقه خواندن
مطالعه ArXiv: افزایش مقاومت مدل‌های زبانی در برابر داده‌های متناقض تا ۳۳٪

مطالعه ArXiv: افزایش مقاومت مدل‌های زبانی در برابر داده‌های متناقض تا ۳۳٪

پژوهشگران یک پارادایم رمزگشایی «آگاه از تضاد» معرفی کرده‌اند که مانع از اعتماد کورکورانه‌ی مدل‌ها به داده‌های خارجی نادرست می‌شود. این سازوکار با استفاده از مسیریابی رژیم تطبیقی…

۱ دقیقه خواندن
چرا FoxChat پشتیبانی مشتری را از «پاسخ دادن» به «انجام دادن» تغییر می‌دهد؟
آموزش کاربردی

چرا FoxChat پشتیبانی مشتری را از «پاسخ دادن» به «انجام دادن» تغییر می‌دهد؟

FoxChat با جایگزینی پاسخ‌های متنی با تورهای تعاملی و بصری، مدل جدیدی از پشتیبانی مشتری را معرفی کرده است. در حالی که Intercom بر اکوسیستم‌های جامع سازمانی تمرکز دارد، FoxChat بر…

۵ دقیقه خواندن
همان نگهبانان، ایستگاه‌های عوارضی جدید در بازار مجوز محتوا برای هوش مصنوعی

گزارش بروکینگز: سقوط ۶ برابری نرخ ارجاع، تهدیدی برای بقای رسانه‌ها

گزارش جدید مؤسسه بروکینگز هشدار می‌دهد که مدل‌های مجوز محتوای هوش مصنوعی در حال تکرار انحصار گوگل هستند. این ساختار باعث ایجاد یک «تله دوجانبه» شده که در آن غول‌های فناوری هم…

۹ دقیقه خواندن
رای تاریخی آلمان: خلاصه‌های هوش مصنوعی گوگل سخنان خود گوگل است و گوگل مسئول پاسخ‌های نادرست.

چرا دفاعیه «بررسی منابع» گوگل در دادگاه آلمان شکست خورد؟

دادگاه مونیخ حکم داد که گوگل مسئول مستقیم ادعاهای نادرست در خلاصه‌های AI است. این تصمیم، گوگل را از یک «نمایانگر لینک‌ها» به یک «ناشر محتوا» تبدیل می‌کند و پیش‌هنگامی حقوقی برای…

۶ دقیقه خواندن
چرا برای اکثر سیستم‌های RAG، دیتابیس‌های برداری تخصصی یک اتلاف هزینه هستند؟
آموزش کاربردی

چرا برای اکثر سیستم‌های RAG، دیتابیس‌های برداری تخصصی یک اتلاف هزینه هستند؟

بسیاری از توسعه‌دهندگان به اشتباه از دیتابیس‌های برداری پیچیده و گران‌قیمت استفاده می‌کنند. در مقیاس‌های متوسط، جایگزین‌های ساده‌تری مثل pgvector عملکرد مشابهی دارند و هزینه‌ها را…

۸ دقیقه خواندن
چرا مقیاس‌پذیری مدل‌های زبانی توهمات حقوقی را درمان نمی‌کند؟

چرا مقیاس‌پذیری مدل‌های زبانی توهمات حقوقی را درمان نمی‌کند؟

خطاهای سیستم‌های هوش مصنوعی حقوقی، مانند استنادهای ساختگی، ریشه در نقص معماری و عدم تطابق بازیابی احتمالی با ساختار سلسله‌مراتبی قوانین دارند. چارچوب پیشنهادی جدید با رویکرد…

۲ دقیقه خواندن
DARP: افزایش ۴۶ درصدی تعمیم‌پذیری در یادگیری تقلیدی با رویکرد بازیابی محلی

DARP: افزایش ۴۶ درصدی تعمیم‌پذیری در یادگیری تقلیدی با رویکرد بازیابی محلی

رویکرد DARP با جایگزینی سیاست‌های سراسری با ساختارهای بازیابی محلی، خطاهای انباشته در حالت‌های خارج از توزیع را کاهش می‌دهد. این متد منجر به بهبود ۱۵ تا ۴۶ درصدی عملکرد در کنترل…

۱ دقیقه خواندن
Anything2Skill: تبدیل دانش پراکنده به مهارت‌های اجرایی برای عبور از سد RAG

Anything2Skill: تبدیل دانش پراکنده به مهارت‌های اجرایی برای عبور از سد RAG

چارچوب Anything2Skill با تبدیل دانش خارجی پراکنده به قراردادهای مهارتی ساختاریافته، شکاف بین «خواندن مستندات» و «اجرای وظیفه» را پر می‌کند. این رویکرد باعث افزایش نرخ موفقیت…

۲ دقیقه خواندن