موضوع

استدلال

Chain-of-thought, reasoning models (o-series, R-series), test-time compute

۶۰۳ مقاله منتشر شده

گزارش IBM: مدل ۸ میلیاردی Granite 4.1 مدل‌های ۳۲ میلیاردی MoE را شکست داد

شرکت IBM با معرفی خانواده مدل‌های Granite 4.1 ثابت کرد که مهندسی دقیق داده می‌تواند جایگزین حجم عظیم پارامترها شود. مدل ۸ میلیارد پارامتری این مجموعه، با تکیه بر کیفیت داده،…

۳ دقیقه خواندن

تحلیل و بررسی تخصصی۲ ماه پیش

راز ۱۵ درصدی Poolside برای شکستن سد هزینه‌های محاسباتی هوش مصنوعی

شرکت Poolside AI با معرفی خانواده مدل‌های Laguna، ثابت کرد که بهره‌وری معماری می‌تواند جایگزین مقیاس خام شود. استفاده از بهینه‌ساز Muon و چارچوب AutoMixer، عملکرد مدل‌های کدنویسی…

۳ دقیقه خواندن

آموزش کاربردی۲ ماه پیش

چرا شفافیت در مدل‌های بازمتن، از قدرت خام مهم‌تر است؟

مدل‌های Qwen و DeepSeek با معرفی ابزارهای تفسیرپذیری و چارچوب‌های جدید استدلالی، قدرت مدل‌های محلی را به سطح جدیدی رساندند. این تحول به معنای گذار از مدل‌های «جعبه سیاه» به…

۲ دقیقه خواندن

تحلیل و بررسی تخصصی۲ ماه پیش

پایان عصر ابزارهای صلب؛ چگونه Laguna کدنویسی را خودکار می‌کند

شرکت Poolside AI با معرفی خانواده مدل‌های Laguna، استانداردهای کدنویسی عامل‌محور را تغییر داد. مدل بازمتن Laguna XS.2 اکنون می‌تواند پیچیده‌ترین وظایف مهندسی نرم‌افزار را با دقتی…

۲ دقیقه خواندن

تحلیل و بررسی تخصصی۲ ماه پیش

دگرگونی در تحلیل چندوجهی: Nemotron 3 و رکورد ۹ برابری سرعت در پردازش ویدئو

انویدیا با معرفی Nemotron 3 Nano Omni، استانداردهای تحلیل اسناد و ویدئو را جابه‌جا کرد. این مدل با معماری ترکیبی، کارایی را در پردازش‌های پیچیده تا ۹ برابر افزایش داده است.

۳ دقیقه خواندن

آموزش کاربردی۲ ماه پیش

پایان توقف‌های شهودی: انویدیا مهندسی زیرزمینی را به یک حلقه بی‌وقفه تبدیل کرد

انویدیا با معرفی یک چارچوب **عامل‌محور** (Agentic)، توقف‌های تحلیل دستی در مهندسی زیرزمینی را حذف کرد. این سیستم با جایگزینی «جوخه‌های خودکار» به جای تحلیلگران انسانی، سرعت…

۳ دقیقه خواندن

تحلیل و بررسی تخصصی۲ ماه پیش

Qwen3-VL: عبور از توصیف ساده به استدلال بصری عمیق

سری مدل‌های جدید Qwen3-VL با معرفی معماری‌های DeepStack و MRope، استانداردهای درک ویدیو را تغییر دادند. این مدل‌ها با استفاده از همراستاسازی متنی، دقت خیره‌کننده‌ای در شناسایی…

۲ دقیقه خواندن

تحلیل و بررسی تخصصی۲ ماه پیش

آیا هوش مصنوعی می‌تواند بدون شناخت قرن بیستم، کدنویسی کند؟

پژوهشگران مدل talkie را معرفی کردند؛ یک مدل ۱۳ میلیارد پارامتری که تنها با متون پیش از سال ۱۹۳۱ آموزش دیده است. این مدل با وجود عدم شناخت کامپیوترهای دیجیتال، توانایی‌های…

۳ دقیقه خواندن

آموزش کاربردی۲ ماه پیش

چرا نباید به ادعای «تکمیل پروژه» توسط عامل‌های هوش مصنوعی اعتماد کنید؟

توسعه‌دهندگان در Claude Code از یک سیستم تأیید سه‌لایه برای جلوگیری از ادعاهای نادرست عامل‌ها درباره تکمیل وظایف استفاده می‌کنند. این معماری با ترکیب بررسی نحو، قصد و رگرسیون،…

۳ دقیقه خواندن

تحلیل و بررسی تخصصی۲ ماه پیش

مدلی که هرگز کامپیوتر ندیده اما پایتون می‌نویسد

پژوهشگران مدل Talkie-1930-13b را معرفی کردند؛ سیستمی که تنها با متون پیش از سال ۱۹۳۱ آموزش دیده اما قادر است کدنویسی پایتون را بیاموزد. این دستاورد ثابت می‌کند که مقیاس مدل…

۳ دقیقه خواندن

تحلیل و بررسی تخصصی۲ ماه پیش

تزریق ویژگی‌های لایه‌ای: رمز پیروزی MOSS-Audio بر مدل‌های حجیم

پلتفرم OpenMOSS با معرفی MOSS-Audio، مرزهای تحلیل صوتی را جابه‌جا کرد. این مدل بنیادی با معماری نوآورانه، توانسته است در نسخه‌ی ۸ میلیاردی خود، مدل‌های ۳۰ میلیاردی را در دقت تحلیل…

۳ دقیقه خواندن

آموزش کاربردی۲ ماه پیش

پایان عصر پنجره‌های حجیم: Dirac چگونه هزینه‌های API را ۶۵٪ کاهش داد؟

پروژه متن‌باز Dirac با بهینه‌سازی هوشمند بافتار، هزینه‌های API عامل‌های کدنویسی را به‌طور میانگین ۶۴.۸٪ کاهش داده است. این ابزار با کسب رتبه اول در بنچمارک Terminal-Bench-2، حتی…

۲ دقیقه خواندن