پرش به محتوای اصلی

موضوع

مدل‌های بازوزن

Open-source models, open weights, local hosting, licensing

۴۸۸ مقاله منتشر شده

AI

بنچمارک ITBench-AA: نرخ موفقیت مدل‌های پیشرو در وظایف SRE کمتر از ۵۰٪ است

یک بنچمارک جدید از IBM و Artificial Analysis نشان می‌دهد که پیشرفته‌ترین مدل‌های هوش مصنوعی در عیب‌یابی زیرساخت‌های سازمانی شکست می‌خورند. یافته‌ها حاکی از یک رابطه معکوس…

۳ دقیقه خواندن
AI
آموزش کاربردی

Reachy Mini و حذف APIهای ابری: استقرار محلی زنجیره کامل تبدیل گفتار به گفتار

ربات Reachy Mini اکنون می‌تواند تمام مراحل تبدیل گفتار به گفتار را به‌صورت محلی اجرا کند. این تغییر نیاز به سرورهای ابری و کلیدهای API را حذف کرده و حریم خصوصی کامل و هزینه صفر…

۲ دقیقه خواندن
AI
آموزش کاربردی

چگونه همگام‌سازی دلتای پراکنده حجم انتقال داده در آموزش RL را ۹۸٪ کاهش داد؟

کتابخانه TRL متعلق به Hugging Face اکنون از همگام‌سازی وزن‌های دلتا پشتیبانی می‌کند. این قابلیت با ارسال تنها پارامترهای تغییریافته، نیاز به پهنای باند را به شدت کاهش داده و…

۲ دقیقه خواندن
AI

چرا علی‌بابا برای کاهش هزینه‌ی استنتاج، روی بنیاد PyTorch شرط‌بندی کرد؟

علی‌بابا کلاود برای بهینه‌سازی زیرساخت‌های هوش مصنوعی در سخت‌افزارهای مختلف، به عضویت پلاتینیوم بنیاد PyTorch درآمد. این اقدام به شرکت اجازه می‌دهد تا با حضور در هیئت‌مدیره،…

۲ دقیقه خواندن
AI
آموزش کاربردی

چگونه Open-MM-RL توهمات ریاضی در مدل‌های چندوجهی را حذف می‌کند؟

یک خط لوله (Pipeline) جدید برای آموزش مدل‌های بینایی-زبانی معرفی شده است که به جای تکیه بر حدس‌های هوش مصنوعی، از اثبات‌های ریاضی برای پاداش‌دهی استفاده می‌کند. این روش با ترکیب…

۲ دقیقه خواندن
AI
زندگی با AI

چرا کمتر از ۱۰ درصد کدهای هوش مصنوعی در پروژه Pi پذیرفته می‌شوند؟

پروژه Pi با موجی از کدهای بی‌کیفیت و گزارش‌های خطای ساختگی توسط هوش مصنوعی مواجه شده است. مدیران این پروژه اکنون ابزارهای ویژه‌ای ساخته‌اند تا توهمات مدل‌های زبانی را که با…

۳ دقیقه خواندن
AI
آموزش کاربردی

بایت‌دنس: مدل ۳ میلیارد پارامتری Lance با امتیاز ۸۵.۱۱ در بنچمارک VBench

بایت‌دنس مدل Lance را معرفی کرد؛ یک مدل ۳ میلیارد پارامتری که تولید، ویرایش و درک تصویر و ویدیو را در یک چارچوب واحد جمع می‌کند. این مدل با بهره‌وری بالا، در بنچمارک‌های کلیدی…

۲ دقیقه خواندن
AI

توقف زودهنگام آموزش: راهکاری برای حذف ۷۱ درصدی رفتارهای مخرب در مدل‌های زبانی

پژوهشی از دانشگاه عبری اورشلیم نشان می‌دهد رفتارهای «سرکشانه» در مدل‌های هوش مصنوعی، بیش از آنکه به داده‌ها مربوط باشد، نتیجه‌ی آموزش بیش از حد (Overtraining) است. با توقف…

۳ دقیقه خواندن