
گزارش Ramp: Deepseek محبوبترین تأمینکننده هوش مصنوعی در ژوئن ۲۰۲۶ شد
شرکتهای آمریکایی به دلیل نسبت بهینه قیمت به عملکرد، بهطور گسترده به مدلهای Deepseek روی آوردهاند. این روند آغاز «اقتصاد توکنی» است؛ جایی که کاهش هزینه بر عملکرد مطلق مدل…
موضوع
Open-source models, open weights, local hosting, licensing
۴۸۸ مقاله منتشر شده

شرکتهای آمریکایی به دلیل نسبت بهینه قیمت به عملکرد، بهطور گسترده به مدلهای Deepseek روی آوردهاند. این روند آغاز «اقتصاد توکنی» است؛ جایی که کاهش هزینه بر عملکرد مطلق مدل…

ابزار Her لاگهای متراکم Claude Code را به گزارشهای متنی خوانا تبدیل میکند. این ابزار با ترکیب یک موتور تحلیل قطعی و یک مدل زبانی کوچک، ریسکهای عملیاتی را شناسایی و بازرسیهای…

پژوهشگران ثابت کردند که عملیات و اعداد ریاضی را میتوان مستقیماً از فعالسازهای داخلی مدلهای Llama استخراج کرد. این دستاورد اجازه میدهد ابزارهای خارجی بهجای تحلیل متنی پرامپت،…

یک پسرفت فنی در macOS 0.30.6 باعث کرش مدل qwen3-embedding هنگام پردازش متنهای طولانی میشود. برای رفع این مشکل، کاربران باید به نسخه 0.24.0 بازگردند یا ورودیها را تکهتکه کنند.

نسخه ۰.۳۰.x ابزار Ollama به دلیل مدیریت تهاجمی حافظه Vulkan، باعث خطای کمبود حافظه (OOM) در کارتهای گرافیکی ۴ گیگابایتی شده است. این مشکل دسترسی به مدلهای کوانتیزه شده را مختل…

ابزار Garak از شرکت NVIDIA فرآیند تست نفوذ یا همان Red-teaming را برای مدلهای زبانی خودکار میکند. این چارچوب با جایگزینی تستهای دستی با معیارهای عددی، به توسعهدهندگان اجازه…

ابزار متنباز oproxy با ادغام یک دستیار هوشمند، فرآیند رهگیری و تغییر ترافیک شبکه را برای توسعهدهندگان متحول کرده است. این ابزار امکان مدیریت حالتهای پروکسی و آمادهسازی تغییرات…

پلتفرم AIBridge امکان دسترسی به مدلهای پیشرو از جمله DeepSeek و Qwen را تنها با یک کلید API فراهم کرده است. این ابزار با سازگاری کامل با SDK شرکت OpenAI، هزینههای عملیاتی…

پروژه Yumii یک دستیار هوشمند متنباز و محلی است که برخلاف مدلهای رایج، تماماً روی CPU اجرا میشود. این ابزار با ترکیب آواتارهای Live2D و حافظه بلندمدت، نیاز به سختافزارهای…

برنامهنویسان اکنون میتوانند به جای APIهای ابری، از سرور محلی Ollama برای اجرای عاملهای کدنویسی استفاده کنند. این ترکیب با مدل Qwen3-Coder:30B، نشت دادهها را متوقف و هزینههای…

مدلهای زبانی واقعاً حقایق را نمیشناسند، بلکه موتورهای آماری برای پیشبینی توکن بعدی هستند. درک معماری ترنسفورمر و فرآیند RLHF به کاربران کمک میکند تا توهمات را کاهش داده و…

گزارش فنی جدیدی نشان میدهد که ترکیب چهار مدل زبانی کوچک از آزمایشگاههای مختلف، رفتارهای ارگانیکتر و استراتژیهای اقتصادی پیچیدهتری را نسبت به یک مدل واحد ایجاد میکند. این…