GPT-4o LATENCY240msCLAUDE OPUS 4.7ONLINENVDA+1.2%MISTRAL LARGE 2STREAMINGOPENAI API99.97% UPTIMEGROQ MIXTRAL580 tok/sGEMINI 2.5 PROCTX 2MANTHROPIC STATUSOKTSMC+0.4%PERPLEXITYINDEXINGGPT-4o LATENCY240msCLAUDE OPUS 4.7ONLINENVDA+1.2%MISTRAL LARGE 2STREAMINGOPENAI API99.97% UPTIMEGROQ MIXTRAL580 tok/sGEMINI 2.5 PROCTX 2MANTHROPIC STATUSOKTSMC+0.4%PERPLEXITYINDEXING
پرش به محتوای مقاله

نمره ۴۸ در برابر ۳۹: Nemotron 3 Ultra جایگاه برترین مدل باز آمریکا را گرفت

·۱۳ خرداد ۱۴۰۵۱ دقیقه مطالعه
انویدیا در ۲۰۲۶ بیش از ۴۰ میلیارد دلار در شرکای هوش مصنوعی سرمایه‌گذاری کرد
انویدیا در ۲۰۲۶ بیش از ۴۰ میلیارد دلار در شرکای هوش مصنوعی سرمایه‌گذاری کرد
اشتراک‌گذاری
واقعاً چه چیز جدید است؟

رکوردشکنی در سرعت استنتاج (به جای بهبود صرفِ هوش)؛ رسیدن به ۳۰۰ توکن در ثانیه در حالی که رقبای اصلی در محدوده ۱۰۰ توکن هستند.

اگر امروز برای طراحی یک خط لوله سازمانی با سرعت بالا به دنبال مدل‌های وزن‌باز هستید، انتخاب اول شما تغییر کرده است. انویدیا (Nvidia) با معرفی Nemotron 3 Ultra، حالا صاحب هوشمندترین مدل باز آمریکاست.

این اتفاق در حالی می‌افتد که فاصله میان مدل‌های باز آمریکا و چین در حال کم شدن است. در این میدان، مدل زبانی بزرگ (LLM) — مثل کتابخانه‌داری که میلیاردها صفحه را خوانده و حالا با همان لحن جواب می‌دهد — باید هم سرعت داشته باشد و هم دقت. همان‌طور که در تحلیل قبلی ما درباره‌ی رقابت مدل‌های بازمتن اشاره کردیم، میدان نبرد اصلی اکنون روی زیرساخت‌هاست. در این فضای رقابتی، وزن‌های باز (Open Weights) — یعنی «دستور پخت» مدل علناً منتشر شده، نه فقط غذای آماده — به ابزاری برای تسریع نوآوری تبدیل شده‌اند.

طبق گزارش Artificial Analysis، این مدل از معماری مجموعه‌ای از متخصصان (Mixture-of-Experts یا MoE) — شبیه تیمی از متخصصان که فقط فرد مورد نیاز برای هر سؤال فراخوانده می‌شود — بهره می‌برد. این مدل ۵۵۰ میلیارد پارامتر کلی و ۵۵ میلیارد پارامتر فعال دارد. نقاط قوت این مدل در بنچمارک‌ها کاملاً مشخص است:

  • نمره هوش: Nemotron 3 Ultra با ۴۸ امتیاز، مدل‌های Gemma 4 31B (۳۹ امتیاز) و Nemotron 3 Super (۳۶ امتیاز) را شکست داد.
  • سرعت استنتاج (Inference) — لحظه‌ای که مدل واقعاً جواب تولید می‌کند — در پلتفرم DeepInfra به بیش از ۳۰۰ توکن در ثانیه می‌رسد. این عدد بسیار بیشتر از ۵۰ تا ۱۰۰ توکن در ثانیه‌ی مدل‌های DeepSeek یا Moonshot است.
  • سقف جهانی: با این حال، مدل چینی Kimi K2.6 با ۵۴ امتیاز همچنان پیشتاز است و مدل بسته Opus 4.8 با ۶۱ امتیاز در صدر قرار دارد.

نماترون ۳ اولترای انویدیا باهوش‌ترین مدل باز آمریکایی شد، اما چین همچنان پیشتاز است

برای مدیران کسب‌وکار، این یعنی دیگر لازم نیست بین سرعت و هوش یکی را انتخاب کنند. انویدیا فقط تراشه نمی‌سازد؛ بلکه وزن‌های مدل را طوری تنظیم می‌کند که روی سخت‌افزار خودش با حداکثر سرعت اجرا شوند. این موضوع فشار را روی سایر آزمایشگاه‌های آمریکایی می‌اندازد تا مدل‌های بزرگ‌تر را بدون افزایش تأخیر منتشر کنند.

این مدل از ۴ ژوئن ۲۰۲۶ از طریق Hugging Face، OpenRouter و سایر پلتفرم‌ها در دسترس خواهد بود.

گام بعدی شما

  • بررسی خروجی‌های مدل در Hugging Face یا OpenRouter از ۴ ژوئن ۲۰۲۶.
  • تحلیل اثر سرعت ۳۰۰ توکنی بر عملکرد عامل‌های خودمختار در محیط عملیاتی.
  • مقایسه هزینه استنتاج این مدل با مدل‌های رقیب در مقیاس تجاری.

اما داستان سخت‌افزاری این تحول شگفت‌انگیزتر است؛ به تحلیل ما درباره‌ی تراشه‌های Blackwell مراجعه کنید.

چرا این موضوع مهم است؟

این مدل اعتبار فنی انویدیا را به‌عنوان لیدر مدل‌های باز در آمریکا تثبیت می‌کند. تسلط بر هر دو لایه سخت‌افزار و نرم‌افزار، معیار موفقیت جدیدی را در رقابت با شرکت‌های Pure-AI تعریف می‌کند.

تأثیر برای ایران

برنامه‌نویسان ایرانی می‌توانند از طریق Hugging Face و OpenRouter به این مدل دسترسی داشته باشند. این سرعت بالا، فرصت توسعه عامل‌های سریع‌تر را برای استارتاپ‌های داخلی فراهم می‌کند.

·نگاه ما
تحریریه دات‌هوش

تحلیل ما نشان می‌دهد انویدیا در حال تبدیل شدن به یک شرکت کاملاً «عمودی» است. آن‌ها با بهینه‌سازی مستقیم رابطه میان سخت‌افزار و وزن‌های مدل، استانداردی جدید برای بهره‌وری تعریف می‌کنند که احتمالاً مدل‌های عمومی را به سمت نسخه‌های تخصصی‌تر و بهینه‌تر سوق می‌دهد.

منابع

گفتگو

شماره ۰۵۳پنج‌شنبه‌های هوش‌محور

بسته‌ی هفتگی دات‌هوش

۵ خبر، ۲ ابزار، ۱ پرامپت — به‌علاوه ۳ بخش جدید. بدون هیاهو، هر پنج‌شنبه صبح.

خبر کلیدی
ابزار کاربردی
پرامپت حرفه‌ای
تحلیل پژوهش
به‌زودی
زاویه‌ی ایرانی
به‌زودی
تمرین این هفته
به‌زودی
۰۰:۰۰تا شماره بعدیهفته‌ی ۵۳ بدون وقفه