بنچمارک ITBench-AA: نرخ موفقیت مدلهای پیشرو در وظایف SRE کمتر از ۵۰٪ است
یک بنچمارک جدید از IBM و Artificial Analysis نشان میدهد که پیشرفتهترین مدلهای هوش مصنوعی در عیبیابی زیرساختهای سازمانی شکست میخورند. یافتهها حاکی از یک رابطه معکوس…
موضوع
Open-source models, open weights, local hosting, licensing
۴۸۸ مقاله منتشر شده
یک بنچمارک جدید از IBM و Artificial Analysis نشان میدهد که پیشرفتهترین مدلهای هوش مصنوعی در عیبیابی زیرساختهای سازمانی شکست میخورند. یافتهها حاکی از یک رابطه معکوس…
موتور استنتاج TokenSpeed با بهینهسازی حافظه و ادغام کرنلها، رکورد ۵۸۰ توکن در ثانیه را برای مدل Qwen3.5-397B روی پردازندههای NVIDIA Blackwell ثبت کرد. این پیشرفت بهویژه برای…
ربات Reachy Mini اکنون میتواند تمام مراحل تبدیل گفتار به گفتار را بهصورت محلی اجرا کند. این تغییر نیاز به سرورهای ابری و کلیدهای API را حذف کرده و حریم خصوصی کامل و هزینه صفر…
کتابخانه TRL متعلق به Hugging Face اکنون از همگامسازی وزنهای دلتا پشتیبانی میکند. این قابلیت با ارسال تنها پارامترهای تغییریافته، نیاز به پهنای باند را به شدت کاهش داده و…
علیبابا کلاود برای بهینهسازی زیرساختهای هوش مصنوعی در سختافزارهای مختلف، به عضویت پلاتینیوم بنیاد PyTorch درآمد. این اقدام به شرکت اجازه میدهد تا با حضور در هیئتمدیره،…
یک اسکریپت C# با استفاده از SDK ابزار Cadenza.Agent، امکان اتصال Codex CLI به مدلهایی مثل Claude 3.5 و Llama را فراهم میکند. این روش با ایجاد یک پروکسی برای APIهای OpenAI،…
EAGLE 3.1 با رفع مشکل «لغزش توجه»، سرعت استنتاج مدلهای زبانی را بهویژه در متون طولانی بهشدت افزایش میدهد. این بهروزرسانی در مدل Kimi K2.6 توانست نرخ خروجی را تا ۲ برابر بهبود…
یک خط لوله (Pipeline) جدید برای آموزش مدلهای بینایی-زبانی معرفی شده است که به جای تکیه بر حدسهای هوش مصنوعی، از اثباتهای ریاضی برای پاداشدهی استفاده میکند. این روش با ترکیب…
نرمافزار Brethof Voice Pro 2.0 با استفاده از مدلهای Qwen3-ASR و Hunyuan-MT2، امکان تبدیل و ترجمه صوت را بهصورت کاملاً محلی فراهم کرد. این سیستم در بنچمارکها از Whisper…
پروژه Pi با موجی از کدهای بیکیفیت و گزارشهای خطای ساختگی توسط هوش مصنوعی مواجه شده است. مدیران این پروژه اکنون ابزارهای ویژهای ساختهاند تا توهمات مدلهای زبانی را که با…
بایتدنس مدل Lance را معرفی کرد؛ یک مدل ۳ میلیارد پارامتری که تولید، ویرایش و درک تصویر و ویدیو را در یک چارچوب واحد جمع میکند. این مدل با بهرهوری بالا، در بنچمارکهای کلیدی…
پژوهشی از دانشگاه عبری اورشلیم نشان میدهد رفتارهای «سرکشانه» در مدلهای هوش مصنوعی، بیش از آنکه به دادهها مربوط باشد، نتیجهی آموزش بیش از حد (Overtraining) است. با توقف…