موضوع

بازیابی‌افزا

RAG architectures, vector stores, grounding LLMs in private data

۲۸۲ مقاله منتشر شده

KG-CFR: کاهش نرخ فروپاشی منطقی در ۹۵٪ از آزمون‌های استرس عامل‌های هوش مصنوعی

پژوهشگران معماری جدیدی به نام KG-CFR معرفی کرده‌اند که با جداسازی برنامه‌ریزی داخلی از اجرای خارجی، مشکل «انحراف نقش» در بحث‌های چندعاملی را حل می‌کند. این رویکرد پایداری و کیفیت…

۲ دقیقه خواندن

تحلیل و بررسی تخصصی۳ هفته پیش

LakeQA: نمره ۱۸.۳۷ درصدی GPT-5.2 در بنچمارک داده‌های کلان

بنچمارک LakeQA با حجم ۹.۵ ترابایت، توانایی مدل‌های زبانی را در جست‌وجو و استدلال در دریاچه‌های داده‌ای آزمایش کرد. نتایج نشان می‌دهد مدل‌های پیشرو در کشف خودکار داده‌ها شکست…

۲ دقیقه خواندن

تحلیل و بررسی تخصصی۳ هفته پیش

چرا استنتاج آفلاین در معماری AIR سرعت توصیه‌های هوش مصنوعی را ۴۰۰ برابر کرد؟

چارچوب AIR با انتقال استدلال مدل‌های زبانی به فاز آفلاین، گلوگاه تأخیر در سیستم‌های توصیه‌گر صنعتی را برطرف کرده است. این رویکرد در Kuaishou موجب افزایش ۳.۴۴۶ درصدی حجم کالاهای…

۱ دقیقه خواندن

تحلیل و بررسی تخصصی۳ هفته پیش

مدیریت حافظه در عامل‌های هوش مصنوعی؛ از heuristic ساده به بهینه‌سازی استوکاستیک

پژوهشگران چارچوب OSL-MR را معرفی کردند که حافظه عامل‌های هوش مصنوعی را به عنوان یک مسئله بهینه‌سازی استوکاستیک مقید مدل می‌کند. این روش با محاسبه هزینه فراموشی در برابر سود…

۱ دقیقه خواندن

تحلیل و بررسی تخصصی۳ هفته پیش

مطالعه ArXiv: افزایش مقاومت مدل‌های زبانی در برابر داده‌های متناقض تا ۳۳٪

پژوهشگران یک پارادایم رمزگشایی «آگاه از تضاد» معرفی کرده‌اند که مانع از اعتماد کورکورانه‌ی مدل‌ها به داده‌های خارجی نادرست می‌شود. این سازوکار با استفاده از مسیریابی رژیم تطبیقی…

۱ دقیقه خواندن

آموزش کاربردی۳ هفته پیش

چرا FoxChat پشتیبانی مشتری را از «پاسخ دادن» به «انجام دادن» تغییر می‌دهد؟

FoxChat با جایگزینی پاسخ‌های متنی با تورهای تعاملی و بصری، مدل جدیدی از پشتیبانی مشتری را معرفی کرده است. در حالی که Intercom بر اکوسیستم‌های جامع سازمانی تمرکز دارد، FoxChat بر…

۵ دقیقه خواندن

همان نگهبانان، ایستگاه‌های عوارضی جدید در بازار مجوز محتوا برای هوش مصنوعی

اخبار کوتاه روزانه۳ هفته پیش

گزارش بروکینگز: سقوط ۶ برابری نرخ ارجاع، تهدیدی برای بقای رسانه‌ها

گزارش جدید مؤسسه بروکینگز هشدار می‌دهد که مدل‌های مجوز محتوای هوش مصنوعی در حال تکرار انحصار گوگل هستند. این ساختار باعث ایجاد یک «تله دوجانبه» شده که در آن غول‌های فناوری هم…

۹ دقیقه خواندن

رای تاریخی آلمان: خلاصه‌های هوش مصنوعی گوگل سخنان خود گوگل است و گوگل مسئول پاسخ‌های نادرست.

اخبار کوتاه روزانه۳ هفته پیش

چرا دفاعیه «بررسی منابع» گوگل در دادگاه آلمان شکست خورد؟

دادگاه مونیخ حکم داد که گوگل مسئول مستقیم ادعاهای نادرست در خلاصه‌های AI است. این تصمیم، گوگل را از یک «نمایانگر لینک‌ها» به یک «ناشر محتوا» تبدیل می‌کند و پیش‌هنگامی حقوقی برای…

۶ دقیقه خواندن

آموزش کاربردی۳ هفته پیش

چرا برای اکثر سیستم‌های RAG، دیتابیس‌های برداری تخصصی یک اتلاف هزینه هستند؟

بسیاری از توسعه‌دهندگان به اشتباه از دیتابیس‌های برداری پیچیده و گران‌قیمت استفاده می‌کنند. در مقیاس‌های متوسط، جایگزین‌های ساده‌تری مثل pgvector عملکرد مشابهی دارند و هزینه‌ها را…

۸ دقیقه خواندن

تحلیل و بررسی تخصصی۳ هفته پیش

چرا مقیاس‌پذیری مدل‌های زبانی توهمات حقوقی را درمان نمی‌کند؟

خطاهای سیستم‌های هوش مصنوعی حقوقی، مانند استنادهای ساختگی، ریشه در نقص معماری و عدم تطابق بازیابی احتمالی با ساختار سلسله‌مراتبی قوانین دارند. چارچوب پیشنهادی جدید با رویکرد…

۲ دقیقه خواندن

تحلیل و بررسی تخصصی۳ هفته پیش

DARP: افزایش ۴۶ درصدی تعمیم‌پذیری در یادگیری تقلیدی با رویکرد بازیابی محلی

رویکرد DARP با جایگزینی سیاست‌های سراسری با ساختارهای بازیابی محلی، خطاهای انباشته در حالت‌های خارج از توزیع را کاهش می‌دهد. این متد منجر به بهبود ۱۵ تا ۴۶ درصدی عملکرد در کنترل…

۱ دقیقه خواندن

تحلیل و بررسی تخصصی۳ هفته پیش

Anything2Skill: تبدیل دانش پراکنده به مهارت‌های اجرایی برای عبور از سد RAG

چارچوب Anything2Skill با تبدیل دانش خارجی پراکنده به قراردادهای مهارتی ساختاریافته، شکاف بین «خواندن مستندات» و «اجرای وظیفه» را پر می‌کند. این رویکرد باعث افزایش نرخ موفقیت…

۲ دقیقه خواندن