
مدل SubQ هزینهی پردازش متون طولانی را از ۲۶۰۰ دلار به ۸ دلار رساند
استارتآپ Subquadratic با معرفی مدل SubQ و استفاده از مکانیزم توجه پراکنده، گ bottleneck محاسباتی ترنسفورمرها را شکست. آزمایشهای مستقل تایید میکنند این مدل با کاهش شدید…
موضوع
RAG architectures, vector stores, grounding LLMs in private data
۲۸۱ مقاله منتشر شده

استارتآپ Subquadratic با معرفی مدل SubQ و استفاده از مکانیزم توجه پراکنده، گ bottleneck محاسباتی ترنسفورمرها را شکست. آزمایشهای مستقل تایید میکنند این مدل با کاهش شدید…

تحلیلی فنی روی مدل Gemini 3.5 Flash نشان میدهد که این مدل در شرایط خاص، نتایج جستوجوی لحظهای را نادیده گرفته و به دادههای قدیمی آموزش خود باز میگردد. این «شکاف باور» ریسکی…

گذار از RAG استاندارد به سیستمهای عاملمحور، هوش مصنوعی را از یک «کتابدار» به «مدیر پروژه» تبدیل میکند. این تغییر، موانع زیرساختی جدی از جمله پیچیدگی مسیریابی ابزارها و جهشهای…

تشخیص توهم در عاملهای هوش مصنوعی نیازمند ثبت خروجیهای خام ابزارها و متون بازیابیشده است، نه فقط بررسی پاسخ نهایی. تفکیک خطاها به سه دسته مشخص، جایگزینی «حس کلی» را با سنجههای…

یک چارچوب فنی جدید استدلال میکند که نگاه به حافظهٔ عاملهای هوش مصنوعی بهعنوان یک پایگاهداده، باعث شکست در یادگیری و فراموشی میشود. مدل پیشنهادی GEM تمرکز را از ذخیرهسازی…

شرکت Perplexity سامانه حافظه جدیدی به نام Brain معرفی کرد که بهجای اولویت دادن به سلایق کاربر، تاریخچه کاری عاملها را یاد میگیرد. این سیستم با ساخت گراف زمینه در بازههای زمانی…

مهندسی نرمافزار از کدنویسی دستی به مدیریت «کارکنان دیجیتالِ خودگردان» تغییر مسیر داده است. توسعهدهندگان اکنون باید برای جلوگیری از افزایش بدهی فنی و شکستهای سیستمی، بر تسلط بر…

یک تحلیل فنی مسیر تبدیل ChatGPT از یک مدل عمومی به یک متخصص سلامت را ترسیم کرده است. این استراتژی بر پیشآموزش تخصصی، دادههای چندوجهی و همکاری با متخصصان متمرکز است.

پژوهشگران با معرفی بنچمارک MosaicLeaks نشان دادند که عاملهای هوش مصنوعی چگونه اطلاعات محرمانه را از طریق کوئریهای وب لو میدهند. برای حل این مشکل، متد آموزشی PA-DR توسعه یافت که…

الگویی جدید برای خلق شرکتهای میلیارد دلاری توسط یک شخص، جایگزینی نیروی انسانی با نیروی کار سنتتیک است. با ادغام عاملهای خودکار در زنجیره تأمین، یک اپراتور میتواند مهندسی،…

سامانه LLM Wiki با استفاده از ساختار Markdown، حافظهٔ موقت عاملها را به یک مرکز دانش دائمی و قابل نسخهبندی تبدیل میکند. این ابزار با جداسازی حافظه عملیاتی از دانش انباشته،…

لایهی حافظهی متنباز Lorekeeper از طریق چرخههای بازاندیشی در زمانهای بیکاری، از تکرار اشتباهات و فراموشی ترجیحات پروژه در عاملهای هوش مصنوعی جلوگیری میکند. این ابزار با…