موضوع

بازیابی‌افزا

RAG architectures, vector stores, grounding LLMs in private data

۲۸۱ مقاله منتشر شده

دیتابریکس: خطای عامل‌های سازمانی با GPT-5.5 تا ۴۶٪ کاهش یافت

دیتابریکس مدل GPT-5.5 را به جریان‌های کاری عامل‌های خود اضافه کرد. این مدل با عبور از مرز ۵۰٪ دقت در بنچمارک OfficeQA Pro، نرخ خطای پردازش اسناد قدیمی و PDFهای اسکن‌شده را ۴۶٪…

۲ دقیقه خواندن

آموزش کاربردیماه گذشته

کاهش هزینه API به صفر؛ تجربه ۶ ماهه یک توسعه‌دهنده با مدل‌های محلی

یک توسعه‌دهنده با انتقال به سخت‌افزار محلی و استفاده از مدل‌های Qwen و Ollama، هزینه‌های API خود را کاملاً حذف کرد. این تغییر، هزینه ماهانه را از پرداخت به شرکت‌های ابری به قبض…

۲ دقیقه خواندن

آموزش کاربردیماه گذشته

چرا مهندسی پرامپت برای مدیریت عامل‌های هوش مصنوعی در مقیاس واقعی شکست می‌خورد؟

مهندسی پرامپت بر تک‌درخواست‌ها تمرکز دارد، اما «مهندسی کانتکست» کل معماری اطلاعات را برای چرخه حیات یک عامل طراحی می‌کند. با استفاده از حافظه ۴ لایه و قوانین مشترک، می‌توان تعداد…

۲ دقیقه خواندن

آموزش کاربردیماه گذشته

OpenData Vector: جستجوی ۱۰۰ میلیون بردار با هزینه ۳۵۰ دلار در ماه

یک موتور جستجوی جدید با مجوز MIT معرفی شد که کاملاً روی حافظه ابری اجرا می‌شود. این سیستم هزینه میزبانی ۱۰۰ میلیون بردار را به حدود ۳۵۰ دلار در ماه کاهش می‌دهد.

۲ دقیقه خواندن

آموزش کاربردیماه گذشته

IBM: مدل ۹۷ میلیون پارامتری در بازیابی چندزبانه از رقبای ۳۰۰ میلیونی پیشی گرفت

IBM دو مدل بردار معنایی چندزبانه بر پایه ModernBERT عرضه کرد. مدل کوچک ۹۷ میلیون پارامتری این مجموعه، در بنچمارک‌های MTEB از رقبای بسیار بزرگ‌تر خود پیشی گرفته است.

۲ دقیقه خواندن

آموزش کاربردیماه گذشته

چرا استراتژی AIBOM شما در بازرسی‌های ۲۰۲۶ اتحادیه اروپا شکست می‌خورد؟

بسیاری از ابزارهای AIBOM فعلی تنها کتابخانه‌های نرم‌افزاری را لیست می‌کنند و مدل‌ها، پرامپت‌ها و منابع RAG را نادیده می‌گیرند. برای عبور از بازرسی‌های ۲۰۲۶ اتحادیه اروپا، AIBOM…

۲ دقیقه خواندن

آموزش کاربردیماه گذشته

OpenHuman: کاهش ۸۰ درصدی هزینه‌های LLM با لایه‌ی فشرده‌سازی TokenJuice

OpenHuman یک عامل هوش مصنوعی متن‌باز و محلی است که با استفاده از «درخت حافظه» و لایه‌ی فشرده‌سازی، هزینه‌های API را تا ۸۰٪ کاهش می‌دهد. این ابزار با اولویت دادن به حریم خصوصی،…

۲ دقیقه خواندن

آموزش کاربردیماه گذشته

چرا عامل‌های دیتابیس شما اعداد درآمد را حدس می‌زنند و نه محاسبه می‌کنند؟

عامل‌های هوش مصنوعی اغلب کدهای SQL صحیحی می‌نویسند که از نظر منطق تجاری غلط هستند. برای حل این مشکل، توسعه‌دهندگان باید به‌جای تکیه بر پرامپت‌های شکننده، از «نماهای تأییدشده»…

۲ دقیقه خواندن

تحلیل و بررسی تخصصیماه گذشته

چرا بازیابی لغت‌محور هنوز در پژوهش‌های عمیق از جستجوی متراکم پیش می‌گیرد؟

پژوهش جدید Pi-Serini نشان می‌دهد که ترکیب بازیابی لغت‌محور (BM25) با مدل‌های پیشرو مانند GPT-5.5 در وظایف پژوهشی عمیق، عملکرد بهتری نسبت به سیستم‌های جستجوی متراکم دارد. این سیستم…

۲ دقیقه خواندن

آموزش کاربردیماه گذشته

چرا برای اصلاح رفتار عامل‌های هوش مصنوعی نباید کد را تغییر داد؟

لنگ‌چین با معرفی Context Hub در پلتفرم LangSmith، مدیریت دستورالعمل‌ها و سیاست‌های عامل‌ها را از کد برنامه‌نویسی جدا کرد. این ابزار به تیم‌ها اجازه می‌دهد بدون نیاز به استقرار…

۲ دقیقه خواندن

آموزش کاربردیماه گذشته

چگونه درگاه‌های مدل یکپارچه هزینه ساخت همراهان هوش مصنوعی را ۴۰٪ کاهش می‌دهند؟

توسعه‌گران همراهان هوش مصنوعی با جایگزینی APIهای تک‌مدلی با درگاه‌های یکپارچه، هزینه‌های استنتاج را تا ۴۰٪ کاهش داده‌اند. این رویکرد اجازه می‌دهد شخصیت‌های دیجیتال از وابستگی به…

۲ دقیقه خواندن

آموزش کاربردیماه گذشته

کاهش ۳۲ درصدی زمان رفع خرابی در امریکن اکسپرس با استفاده از عامل‌های هوش مصنوعی

تیم‌های SRE در حال گذار از تحلیل ساده‌ی هشدارها به «بررسی عامل‌محور» هستند؛ سیستمی که در آن هوش مصنوعی برای یافتن علت ریشه‌ای خطا، مستقیماً ابزارهای زیرساختی را اجرا می‌کند. این…

۲ دقیقه خواندن