پرش به محتوای اصلی

موضوع

مدل‌های بازوزن

Open-source models, open weights, local hosting, licensing

۵۰۵ مقاله منتشر شده

AI
آموزش کاربردی

سازوکار امتیازدهی موازی در A3M Router که هزینه‌های استنتاج را ۳.۸ برابر کاهش داد

پروژه متن‌باز A3M Router برای نخستین بار رتبه اول جدول RouterArena را از رقبای تجاری ربود. این ابزار با استفاده از یک سازوکار امتیازدهی موازی، هزینه‌های عملیاتی را به‌شدت کاهش…

۲ دقیقه خواندن
AI

۸۹ برابر ارزان‌تر؛ تحلیل شکاف قیمتی DeepSeek V4 Flash و Claude Opus در کدنویسی

همبستگی میان کیفیت و هزینه در مدل‌های کدنویسی فروپاشیده است. آزمایشگاه‌های چینی اکنون قابلیت‌های نزدیک به مدل‌های پیشرو را با کسری از هزینه جایگزین‌های غربی ارائه می‌دهند.

۲ دقیقه خواندن
AI

بنچمارک ITBench-AA: نرخ موفقیت مدل‌های پیشرو در وظایف SRE کمتر از ۵۰٪ است

یک بنچمارک جدید از IBM و Artificial Analysis نشان می‌دهد که پیشرفته‌ترین مدل‌های هوش مصنوعی در عیب‌یابی زیرساخت‌های سازمانی شکست می‌خورند. یافته‌ها حاکی از یک رابطه معکوس…

۳ دقیقه خواندن
AI
آموزش کاربردی

Reachy Mini و حذف APIهای ابری: استقرار محلی زنجیره کامل تبدیل گفتار به گفتار

ربات Reachy Mini اکنون می‌تواند تمام مراحل تبدیل گفتار به گفتار را به‌صورت محلی اجرا کند. این تغییر نیاز به سرورهای ابری و کلیدهای API را حذف کرده و حریم خصوصی کامل و هزینه صفر…

۲ دقیقه خواندن
AI
آموزش کاربردی

چگونه همگام‌سازی دلتای پراکنده حجم انتقال داده در آموزش RL را ۹۸٪ کاهش داد؟

کتابخانه TRL متعلق به Hugging Face اکنون از همگام‌سازی وزن‌های دلتا پشتیبانی می‌کند. این قابلیت با ارسال تنها پارامترهای تغییریافته، نیاز به پهنای باند را به شدت کاهش داده و…

۲ دقیقه خواندن
AI

چرا علی‌بابا برای کاهش هزینه‌ی استنتاج، روی بنیاد PyTorch شرط‌بندی کرد؟

علی‌بابا کلاود برای بهینه‌سازی زیرساخت‌های هوش مصنوعی در سخت‌افزارهای مختلف، به عضویت پلاتینیوم بنیاد PyTorch درآمد. این اقدام به شرکت اجازه می‌دهد تا با حضور در هیئت‌مدیره،…

۲ دقیقه خواندن