
پایان عصر مدلهای حجیم؟ Phi-4-mini قواعد بازی را تغییر میدهد
مایکروسافت با معرفی Phi-4-mini-instruct، مدلی با ۳.۸ میلیارد پارامتر عرضه کرد که در ریاضیات و استدلال، رقبای دو برابر بزرگتر خود را شکست میدهد. این مدل با پنجره بافت ۱۲۸ هزار…
موضوع
Open-source models, open weights, local hosting, licensing
۴۸۳ مقاله منتشر شده

مایکروسافت با معرفی Phi-4-mini-instruct، مدلی با ۳.۸ میلیارد پارامتر عرضه کرد که در ریاضیات و استدلال، رقبای دو برابر بزرگتر خود را شکست میدهد. این مدل با پنجره بافت ۱۲۸ هزار…

مایکروسافت با معرفی Magma-8B، مرز میان مدیریت رابط کاربری و کنترل رباتیک را از بین برد. این مدل چندوجهی با وزنهای باز، در بسیاری از بنچمارکها از GPT-4V پیشی گرفته و عصر مدلهای…

مایکروسافت با معرفی OmniParser V2، سرعت پردازش رابط کاربری را ۶۰٪ افزایش داد. این ابزار به عاملهای هوشمند اجازه میدهد بدون نیاز به کد، هر نرمافزاری را تنها با دیدن تصویر کنترل…

مدل متنباز Wan2.1 با شکستن انحصار مدلهای تجاری، تولید ویدیوهای باکیفیت را روی کارتهای گرافیک معمولی ممکن کرده است. این ابزار با نیاز به حافظه گرافیکی بسیار کم، استانداردهای…

Kijai با تجمیع مدلهای پراکنده WanVideo در یک مخزن واحد، سد ورود به دنیای تولید ویدئوی محلی را شکست. این اقدام دسترسی به مدلهای کوانتیزه شده از ByteDance و Alibaba را برای…

مدل جدید علیبابا با ۲۷ میلیارد پارامتر، مدل غولپیکر ۳۹۷ میلیاردی предшеل خود را در بنچمارکهای کدنویسی شکست داد. این دستاورد ثابت میکند که بهینهسازی معماری بر حجم عظیم دادهها…

شرکت StepFun AI با معرفی مدل Step-Video-T2V، استانداردهای تولید ویدیوهای بازمتن را جابهجا کرد. این مدل ۳۰ میلیارد پارامتری با کیفیت سینمایی خیرهکننده میآید، اما به سختافزاری…

دکتر رالف دبوسمن لایسنس HSL v0.2 را معرفی کرد تا مانع از استخراج رایگان کدهای انسانی توسط شرکتهای بزرگ AI شود. این لایسنس استفاده رایگان برای افراد را حفظ میکند اما برای…

تیم Unsloth با ارائه نسخههای بهینهشدهی DeepSeek-R1، مدل ۶۷۱ میلیارد پارامتری را برای سختافزارهای مصرفکننده در دسترس قرار داد. این دستاورد به لطف تکنیک کوانتایزیشن ۱.۵۸ بیتی،…

مایکروسافت مدل WHAM را معرفی کرد؛ یک مدل دنیای زاینده که میتواند بصریات بازی و اقدامات بازیکن را پیشبینی کند. این مدل با انتشار وزنهای باز در Hugging Face، مسیر جدیدی برای…

مدل Kokoro با تنها ۸۲ میلیون پارامتر، کیفیت صدای رقبای بزرگتر را با هزینهای کمتر از ۱ دلار برای هر میلیون نویسه به دست آورده است. این مدل با لایسنس آپاچی منتشر شده و مسیر جدیدی…

مؤسسه Allen AI مدل olmOCR را برای استخراج ساختاریافتهی متن از تصاویر اسناد معرفی کرد. این مدل با وزنهای باز، جایگزینی قدرتمند و محلی برای سرویسهای تجاری OCR است که پردازش انبوه…