
OpenData Vector: جستجوی ۱۰۰ میلیون بردار با هزینه ۳۵۰ دلار در ماه
یک موتور جستجوی جدید با مجوز MIT معرفی شد که کاملاً روی حافظه ابری اجرا میشود. این سیستم هزینه میزبانی ۱۰۰ میلیون بردار را به حدود ۳۵۰ دلار در ماه کاهش میدهد.
موضوع
Open-source models, open weights, local hosting, licensing
۴۸۶ مقاله منتشر شده

یک موتور جستجوی جدید با مجوز MIT معرفی شد که کاملاً روی حافظه ابری اجرا میشود. این سیستم هزینه میزبانی ۱۰۰ میلیون بردار را به حدود ۳۵۰ دلار در ماه کاهش میدهد.

گوگل دیپمایند خانواده مدلهای Gemma 4 را با وزنهای باز عرضه کرد تا استدلال سطح پیشرو را به سختافزارهای محلی بیاورد. مدل ۳۱ میلیارد پارامتری این خانواده، جهشی خیرهکننده در…

IBM دو مدل بردار معنایی چندزبانه بر پایه ModernBERT عرضه کرد. مدل کوچک ۹۷ میلیون پارامتری این مجموعه، در بنچمارکهای MTEB از رقبای بسیار بزرگتر خود پیشی گرفته است.

فرمت GGUF با یکپارچهسازی وزنها و متادیتا، استقرار مدلهای محلی را ساده کرده است. با این حال، نبود استانداردی برای فراخوانی ابزارها و توکنهای استدلالی، توسعهدهندگان را مجبور به…

مدل Qwen-Image-2.0 شرکت علیبابا با دوبرابر کردن فشردهسازی VAE و تقطیر استنتاج، تعداد گامهای تولید تصویر را از ۴۰ به ۴ کاهش داده است. این مدل با استفاده از بلوکهای SwiGLU و یک…

مدل DeepSeek-V4 با معرفی معماری Hybrid Attention، هزینه محاسباتی استنتاج در پنجرههای متنی یک میلیون توکنی را بهشدت کاهش داد. این مدل با تمرکز بر بهینهسازی عاملهای خودکار،…

پژوهشکده Nous Research روشی به نام آموزش برهمنهی توکنها (TST) را معرفی کرده که سرعت پیشآموزش مدلهای زبانی بزرگ را تا ۲.۵ برابر افزایش میدهد. این متد با پردازش دستهای توکنها…

OpenHuman یک عامل هوش مصنوعی متنباز و محلی است که با استفاده از «درخت حافظه» و لایهی فشردهسازی، هزینههای API را تا ۸۰٪ کاهش میدهد. این ابزار با اولویت دادن به حریم خصوصی،…

لنگچین (LangChain) سرویس Managed Deep Agents را در بتای خصوصی عرضه کرد تا مدیریت زیرساختی عاملها را بر عهده بگیرد. این محیط اجرایی، مواردی چون حافظه پایدار و محیطهای ایزوله را…

مدل DeepSeek V4-Pro عملکردی نزدیک به مدلهای پیشرو و پنجره متنی ۱ میلیون توکنی را با کسری از هزینه GPT-5.5 ارائه میدهد. در حالی که OpenAI در گردشهای کاری عاملمحور پیشتاز است،…

تیمهای SRE در حال گذار از تحلیل سادهی هشدارها به «بررسی عاملمحور» هستند؛ سیستمی که در آن هوش مصنوعی برای یافتن علت ریشهای خطا، مستقیماً ابزارهای زیرساختی را اجرا میکند. این…

توسعهدهندگان میتوانند بهجای تنظیم دقیق هزینهبر، از یک مدل بزرگتر برای تولید و امتیازدهی به پرامپتهای مدلهای لبه استفاده کنند. این روش «ارتقای مهارت پرامپت» پایداری سیستم را…