پرش به محتوای اصلی

موضوع

استدلال

Chain-of-thought, reasoning models (o-series, R-series), test-time compute

۶۰۳ مقاله منتشر شده

گزارش IBM: مدل ۸ میلیاردی Granite 4.1 مدل‌های ۳۲ میلیاردی MoE را شکست داد

گزارش IBM: مدل ۸ میلیاردی Granite 4.1 مدل‌های ۳۲ میلیاردی MoE را شکست داد

شرکت IBM با معرفی خانواده مدل‌های Granite 4.1 ثابت کرد که مهندسی دقیق داده می‌تواند جایگزین حجم عظیم پارامترها شود. مدل ۸ میلیارد پارامتری این مجموعه، با تکیه بر کیفیت داده،…

۳ دقیقه خواندن
دگرگونی در تحلیل چندوجهی: Nemotron 3 و رکورد ۹ برابری سرعت در پردازش ویدئو

دگرگونی در تحلیل چندوجهی: Nemotron 3 و رکورد ۹ برابری سرعت در پردازش ویدئو

انویدیا با معرفی Nemotron 3 Nano Omni، استانداردهای تحلیل اسناد و ویدئو را جابه‌جا کرد. این مدل با معماری ترکیبی، کارایی را در پردازش‌های پیچیده تا ۹ برابر افزایش داده است.

۳ دقیقه خواندن
پایان توقف‌های شهودی: انویدیا مهندسی زیرزمینی را به یک حلقه بی‌وقفه تبدیل کرد
آموزش کاربردی

پایان توقف‌های شهودی: انویدیا مهندسی زیرزمینی را به یک حلقه بی‌وقفه تبدیل کرد

انویدیا با معرفی یک چارچوب **عامل‌محور** (Agentic)، توقف‌های تحلیل دستی در مهندسی زیرزمینی را حذف کرد. این سیستم با جایگزینی «جوخه‌های خودکار» به جای تحلیلگران انسانی، سرعت…

۳ دقیقه خواندن
چرا نباید به ادعای «تکمیل پروژه» توسط عامل‌های هوش مصنوعی اعتماد کنید؟
آموزش کاربردی

چرا نباید به ادعای «تکمیل پروژه» توسط عامل‌های هوش مصنوعی اعتماد کنید؟

توسعه‌دهندگان در Claude Code از یک سیستم تأیید سه‌لایه برای جلوگیری از ادعاهای نادرست عامل‌ها درباره تکمیل وظایف استفاده می‌کنند. این معماری با ترکیب بررسی نحو، قصد و رگرسیون،…

۳ دقیقه خواندن
تزریق ویژگی‌های لایه‌ای: رمز پیروزی MOSS-Audio بر مدل‌های حجیم

تزریق ویژگی‌های لایه‌ای: رمز پیروزی MOSS-Audio بر مدل‌های حجیم

پلتفرم OpenMOSS با معرفی MOSS-Audio، مرزهای تحلیل صوتی را جابه‌جا کرد. این مدل بنیادی با معماری نوآورانه، توانسته است در نسخه‌ی ۸ میلیاردی خود، مدل‌های ۳۰ میلیاردی را در دقت تحلیل…

۳ دقیقه خواندن