
تزریق ویژگیهای لایهای: رمز پیروزی MOSS-Audio بر مدلهای حجیم
پلتفرم OpenMOSS با معرفی MOSS-Audio، مرزهای تحلیل صوتی را جابهجا کرد. این مدل بنیادی با معماری نوآورانه، توانسته است در نسخهی ۸ میلیاردی خود، مدلهای ۳۰ میلیاردی را در دقت تحلیل…
موضوع
Open-source models, open weights, local hosting, licensing
۴۸۳ مقاله منتشر شده

پلتفرم OpenMOSS با معرفی MOSS-Audio، مرزهای تحلیل صوتی را جابهجا کرد. این مدل بنیادی با معماری نوآورانه، توانسته است در نسخهی ۸ میلیاردی خود، مدلهای ۳۰ میلیاردی را در دقت تحلیل…

اوپنایآی مدل متنباز Privacy Filter را برای شناسایی و حذف خودکار اطلاعات حساس در پنجرههای حجیم ۱۲۸ هزار توکنی معرفی کرد. این ابزار با حذف نیاز به تکهتکه کردن متن، امنیت…

پروژه متنباز Dirac با بهینهسازی هوشمند بافتار، هزینههای API عاملهای کدنویسی را بهطور میانگین ۶۴.۸٪ کاهش داده است. این ابزار با کسب رتبه اول در بنچمارک Terminal-Bench-2، حتی…

Mistral AI با اولویت دادن به «حاکمیت دادهای» و مدلهای وزنباز، به ارزش ۱۴ میلیارد دلار رسیده است. این استارتاپ فرانسوی به جای رقابت در بنچمارکها، روی نیاز دولتها و شرکتهای…

شرکت Cohere ابزار Transcribe را برای تبدیل دقیق صدا به متن در محیطهای پر سر و صدا معرفی کرد. این سیستم با پشتیبانی از وزنهای باز و استقرار محلی، امنیت دادههای سازمانی را در ۱۴…

شرکت MoonshotAI با معرفی مدل Moonlight و بهینهساز Muon، هزینههای آموزش مدلهای MoE را تا ۵۲ درصد کاهش داد. این دستاورد ثابت میکند که میتوان با تغییر در لایهی ریاضی…

مایکروسافت با معرفی OpenMementos، روشی برای جایگزینی استدلالهای طولانی با خلاصههای فشرده ارائه کرد. این متد مصرف توکنها را تا ۶ برابر کاهش میدهد بدون آنکه دقت مدل در مسائل…

یک توسعهدهنده ادعا کرده است که توانسته معماری AGI را به نسخهای فشرده تبدیل کند که روی CPU لپتاپهای معمولی اجرا میشود. این پروژه با به چالش کشیدن قوانین مقیاسپذیری، نشان…

مدل TinyR1-32B-Preview با وجود اندازه کوچکتر، رقیب ۷۰ میلیاردی خود را در بنچمارکهای استدلالی شکست داد. این دستاورد از طریق ترکیب متخصصهای دامنهای و استفاده از ابزار Mergekit…

بنیاد LightSeek با معرفی SMG، گلوگاههای پایتون را حذف و پردازشهای سنگین را به زبان Rust منتقل کرد. این تغییر معماری باعث شد سرعت استنتاج مدل Llama-3.3 تا ۳.۵ برابر افزایش یابد.

یک توسعهدهنده طی ۱۸ ماه، موتور کامل ترنسفورمر را از صفر با زبان C بازنویسی کرد. TRiP امکان آموزش و استنتاج مدلهایی مثل Llama 2 را بدون نیاز به پایتون یا فریمورکهای سنگین فراهم…

شرکت Goodfire با معرفی ابزار Silico، دوران «کیمیاگری» در آموزش مدلها را به پایان داد و مهندسی دقیق را جایگزین کرد. این پلتفرم با نقشهبرداری از نورونهای داخلی، امکان حذف توهمات…