
دیتابریکس: خطای عاملهای سازمانی با GPT-5.5 تا ۴۶٪ کاهش یافت
دیتابریکس مدل GPT-5.5 را به جریانهای کاری عاملهای خود اضافه کرد. این مدل با عبور از مرز ۵۰٪ دقت در بنچمارک OfficeQA Pro، نرخ خطای پردازش اسناد قدیمی و PDFهای اسکنشده را ۴۶٪…
موضوع
RAG architectures, vector stores, grounding LLMs in private data
۲۸۱ مقاله منتشر شده

دیتابریکس مدل GPT-5.5 را به جریانهای کاری عاملهای خود اضافه کرد. این مدل با عبور از مرز ۵۰٪ دقت در بنچمارک OfficeQA Pro، نرخ خطای پردازش اسناد قدیمی و PDFهای اسکنشده را ۴۶٪…

یک توسعهدهنده با انتقال به سختافزار محلی و استفاده از مدلهای Qwen و Ollama، هزینههای API خود را کاملاً حذف کرد. این تغییر، هزینه ماهانه را از پرداخت به شرکتهای ابری به قبض…

مهندسی پرامپت بر تکدرخواستها تمرکز دارد، اما «مهندسی کانتکست» کل معماری اطلاعات را برای چرخه حیات یک عامل طراحی میکند. با استفاده از حافظه ۴ لایه و قوانین مشترک، میتوان تعداد…

یک موتور جستجوی جدید با مجوز MIT معرفی شد که کاملاً روی حافظه ابری اجرا میشود. این سیستم هزینه میزبانی ۱۰۰ میلیون بردار را به حدود ۳۵۰ دلار در ماه کاهش میدهد.

IBM دو مدل بردار معنایی چندزبانه بر پایه ModernBERT عرضه کرد. مدل کوچک ۹۷ میلیون پارامتری این مجموعه، در بنچمارکهای MTEB از رقبای بسیار بزرگتر خود پیشی گرفته است.

بسیاری از ابزارهای AIBOM فعلی تنها کتابخانههای نرمافزاری را لیست میکنند و مدلها، پرامپتها و منابع RAG را نادیده میگیرند. برای عبور از بازرسیهای ۲۰۲۶ اتحادیه اروپا، AIBOM…

OpenHuman یک عامل هوش مصنوعی متنباز و محلی است که با استفاده از «درخت حافظه» و لایهی فشردهسازی، هزینههای API را تا ۸۰٪ کاهش میدهد. این ابزار با اولویت دادن به حریم خصوصی،…

عاملهای هوش مصنوعی اغلب کدهای SQL صحیحی مینویسند که از نظر منطق تجاری غلط هستند. برای حل این مشکل، توسعهدهندگان باید بهجای تکیه بر پرامپتهای شکننده، از «نماهای تأییدشده»…

پژوهش جدید Pi-Serini نشان میدهد که ترکیب بازیابی لغتمحور (BM25) با مدلهای پیشرو مانند GPT-5.5 در وظایف پژوهشی عمیق، عملکرد بهتری نسبت به سیستمهای جستجوی متراکم دارد. این سیستم…

لنگچین با معرفی Context Hub در پلتفرم LangSmith، مدیریت دستورالعملها و سیاستهای عاملها را از کد برنامهنویسی جدا کرد. این ابزار به تیمها اجازه میدهد بدون نیاز به استقرار…

توسعهگران همراهان هوش مصنوعی با جایگزینی APIهای تکمدلی با درگاههای یکپارچه، هزینههای استنتاج را تا ۴۰٪ کاهش دادهاند. این رویکرد اجازه میدهد شخصیتهای دیجیتال از وابستگی به…

تیمهای SRE در حال گذار از تحلیل سادهی هشدارها به «بررسی عاملمحور» هستند؛ سیستمی که در آن هوش مصنوعی برای یافتن علت ریشهای خطا، مستقیماً ابزارهای زیرساختی را اجرا میکند. این…