
گزارش IBM: مدل ۸ میلیاردی Granite 4.1 مدلهای ۳۲ میلیاردی MoE را شکست داد
شرکت IBM با معرفی خانواده مدلهای Granite 4.1 ثابت کرد که مهندسی دقیق داده میتواند جایگزین حجم عظیم پارامترها شود. مدل ۸ میلیارد پارامتری این مجموعه، با تکیه بر کیفیت داده،…
موضوع
Chain-of-thought, reasoning models (o-series, R-series), test-time compute
۶۰۳ مقاله منتشر شده

شرکت IBM با معرفی خانواده مدلهای Granite 4.1 ثابت کرد که مهندسی دقیق داده میتواند جایگزین حجم عظیم پارامترها شود. مدل ۸ میلیارد پارامتری این مجموعه، با تکیه بر کیفیت داده،…

شرکت Poolside AI با معرفی خانواده مدلهای Laguna، ثابت کرد که بهرهوری معماری میتواند جایگزین مقیاس خام شود. استفاده از بهینهساز Muon و چارچوب AutoMixer، عملکرد مدلهای کدنویسی…

مدلهای Qwen و DeepSeek با معرفی ابزارهای تفسیرپذیری و چارچوبهای جدید استدلالی، قدرت مدلهای محلی را به سطح جدیدی رساندند. این تحول به معنای گذار از مدلهای «جعبه سیاه» به…

شرکت Poolside AI با معرفی خانواده مدلهای Laguna، استانداردهای کدنویسی عاملمحور را تغییر داد. مدل بازمتن Laguna XS.2 اکنون میتواند پیچیدهترین وظایف مهندسی نرمافزار را با دقتی…

انویدیا با معرفی Nemotron 3 Nano Omni، استانداردهای تحلیل اسناد و ویدئو را جابهجا کرد. این مدل با معماری ترکیبی، کارایی را در پردازشهای پیچیده تا ۹ برابر افزایش داده است.

انویدیا با معرفی یک چارچوب **عاملمحور** (Agentic)، توقفهای تحلیل دستی در مهندسی زیرزمینی را حذف کرد. این سیستم با جایگزینی «جوخههای خودکار» به جای تحلیلگران انسانی، سرعت…

سری مدلهای جدید Qwen3-VL با معرفی معماریهای DeepStack و MRope، استانداردهای درک ویدیو را تغییر دادند. این مدلها با استفاده از همراستاسازی متنی، دقت خیرهکنندهای در شناسایی…

پژوهشگران مدل talkie را معرفی کردند؛ یک مدل ۱۳ میلیارد پارامتری که تنها با متون پیش از سال ۱۹۳۱ آموزش دیده است. این مدل با وجود عدم شناخت کامپیوترهای دیجیتال، تواناییهای…

توسعهدهندگان در Claude Code از یک سیستم تأیید سهلایه برای جلوگیری از ادعاهای نادرست عاملها درباره تکمیل وظایف استفاده میکنند. این معماری با ترکیب بررسی نحو، قصد و رگرسیون،…

پژوهشگران مدل Talkie-1930-13b را معرفی کردند؛ سیستمی که تنها با متون پیش از سال ۱۹۳۱ آموزش دیده اما قادر است کدنویسی پایتون را بیاموزد. این دستاورد ثابت میکند که مقیاس مدل…

پلتفرم OpenMOSS با معرفی MOSS-Audio، مرزهای تحلیل صوتی را جابهجا کرد. این مدل بنیادی با معماری نوآورانه، توانسته است در نسخهی ۸ میلیاردی خود، مدلهای ۳۰ میلیاردی را در دقت تحلیل…

پروژه متنباز Dirac با بهینهسازی هوشمند بافتار، هزینههای API عاملهای کدنویسی را بهطور میانگین ۶۴.۸٪ کاهش داده است. این ابزار با کسب رتبه اول در بنچمارک Terminal-Bench-2، حتی…