GPT-4o LATENCY240msCLAUDE OPUS 4.7ONLINENVDA+1.2%MISTRAL LARGE 2STREAMINGOPENAI API99.97% UPTIMEGROQ MIXTRAL580 tok/sGEMINI 2.5 PROCTX 2MANTHROPIC STATUSOKTSMC+0.4%PERPLEXITYINDEXINGGPT-4o LATENCY240msCLAUDE OPUS 4.7ONLINENVDA+1.2%MISTRAL LARGE 2STREAMINGOPENAI API99.97% UPTIMEGROQ MIXTRAL580 tok/sGEMINI 2.5 PROCTX 2MANTHROPIC STATUSOKTSMC+0.4%PERPLEXITYINDEXING
پرش به محتوای مقاله

MiniMax M3: شکستن انحصار حافظه یک میلیون توکنی در مدل‌های بازمتن

·۱۳ خرداد ۱۴۰۵۴ دقیقه مطالعه
مینی‌مکس ام۳: مدل متن‌باز با کانتکست یک‌میلیون‌توکنی در چالش با رهبران انحصاری
مینی‌مکس ام۳: مدل متن‌باز با کانتکست یک‌میلیون‌توکنی در چالش با رهبران انحصاری
اشتراک‌گذاری
واقعاً چه چیز جدید است؟

نخستین مدل بازمتنی که هر سه ویژگی «حافظه یک میلیون توکنی»، «قابلیت‌های چندوجهی بومی» و «برتری در بنچمارک‌های کدنویسی نسبت به GPT-5.5» را هم‌زمان در یک پکیج ارائه می‌دهد.

اگر در حال توسعه‌ی عامل‌های سازمانی هستید که با مستندات حجیم دست‌وپنجه نرم می‌کنند، سد بزرگی همین امروز فرو ریخت. مدل جدید MiniMax M3 پنجره متنی یک میلیون توکنی را در قالب یک مدل بازمتنی ارائه می‌دهد؛ قابلیتی که تا پیش از این تنها در مدل‌های تجاری و بسته وجود داشت.

مدل زبانی بزرگ (LLM) — مثل کتابخانه‌داری که میلیاردها صفحه را خوانده و حالا با همان لحن کتاب‌ها جواب می‌دهد — برای پردازش حجم زیاد داده به حافظه‌ای نیاز دارد که به آن پنجره متنی (Context Window) می‌گویند؛ شبیه به میز کاری که هرچه بزرگ‌تر باشد، ورق‌های بیشتری را هم‌زمان پیش روی خود دارد. تا پیش از این، چنین حافظه‌ای تنها در انحصار غول‌هایی مثل Gemini 3.1 Pro یا GPT-5.5 بود. اما شرکت چینی MiniMax در ۱ ژوئن ۲۰۲۶ با انتشار این مدل، توازن قدرت را تغییر داد و وزن‌های باز (Open Weights) — یعنی همان «دستور پخت» مدل که حالا علناً منتشر شده — را در دسترس همگان قرار داد.

همان‌طور که در تحلیل‌های قبلی ما درباره‌ی مدل‌های استدلالی اشاره کردیم، دسترسی به حافظه بلندمدت، کلید تبدیل یک چت‌بات ساده به یک عامل هوشمند است. طبق گزارش the-decoder.com، مدل M3 در بنچمارک توسعه نرم‌افزار SWE-Bench Pro امتیاز ۵۹٪ را کسب کرد. این عدد آن را بالاتر از GPT-5.5 و Gemini 3.1 Pro قرار می‌دهد و تنها مدل Opus 4.7 است که همچنان پیشتازی می‌کند.

این مدل برای رسیدن به این سطح از کارایی از مکانیزمی به نام MiniMax Sparse Attention (MSA) استفاده می‌کند. این فناوری با تقسیم حافظه به بلوک‌های کوچک و فیلتر کردن داده‌های نامرتبط، سرعت استنتاج (Inference) — لحظه‌ای که مدل واقعاً جواب تولید می‌کند، شبیه به خودِ آشپزی و نه دوره‌ی آموزش آن — را ۹ برابر سریع‌تر از نسخه‌های قبلی کرده است.

مینی‌مکس ام۳: مدل با وزن‌های باز و زمینه یک میلیون توکن، رهبران انحصاری را به چالش می‌کشد

بر اساس مستندات منتشر شده، استقلال عملکرد M3 در سه آزمون سخت‌گیرانه ثابت شده است:

  • بازتولید مستقل یک مقاله علمی از ICLR 2025 در مدت ۱۲ ساعت.

مدل باز MiniMax M3 با کانتکست یک میلیون توکن در رقابت با پیشگامان

  • افزایش بهره‌وری GPUهای Nvidia Hopper از ۷.۶٪ به ۷۱.۳٪ تنها در ۲۴ ساعت.

نمودار مقایسه‌ای عملکرد MiniMax M3 با مدل‌های اختصاصی پیشرو

  • کسب امتیاز ۸۳.۵ در آزمون جستجوی وب BrowseComp و پیشی گرفتن از Opus 4.7.

MiniMax M3: مدل متن‌باز با پنجره یک میلیون توکن، رهبران انحصاری را به چالش می‌کشد

برای مدیران کسب‌وکار، این اتفاق به معنای حذف «مالیات انحصار» روی مدل‌های حافظه‌بلند است. دیگر لازم نیست برای پردازش میلیون‌ها توکن از داده‌های حساس شرکتی، صرفاً به یک ارائه‌دهنده آمریکایی اعتماد کنید. این چرخش، جنگ قیمت‌ها را در APIهای حافظه‌بلند آغاز می‌کند و انتقال به سمت عامل‌های محلی و با کارایی بالا را سرعت می‌بخشد. این مدل همچنین چندوجهی (Multimodal) است؛ یعنی مثل ما که با چند حس دنیا را می‌خوانیم، هم‌زمان متن، عکس و صدا را می‌فهمد.

گام بعدی شما

  • در ۱۰ روز آینده، انتشار رسمی وزن‌های مدل را در Hugging Face دنبال کنید.
  • اگر از سخت‌افزارهای اختصاصی استفاده می‌کنید، بهینه‌سازی هسته (Kernel) مدل M3 را برای سخت‌افزار خود تست کنید.
  • در صورت استفاده از مدل‌های بسته برای کدنویسی، هزینه استنتاج خود را با مدل‌های بازمتن مقایسه کنید.

اما داستان سخت‌افزاری این تحول حتی شگفت‌انگیزتر است؛ اثر این مدل بر مصرف انرژی مراکز داده را در گزارش بعدی بررسی خواهیم کرد.

چرا این موضوع مهم است؟

این مدل با ارائه حافظه یک میلیون توکنی در قالب بازمتن، اعتماد سازمان‌ها را از سرویس‌های ابری به زیرساخت‌های محلی منتقل می‌کند. اعتبار این تغییر با نتایج بنچمارک SWE-Bench تأیید شده و عملاً هزینه ورود به دنیای عامل‌های پیچیده را برای شرکت‌ها کاهش می‌دهد.

تأثیر برای ایران

دسترسی به مدل‌های بازمتن با حافظه بالا، به توسعه‌دهندگان ایرانی اجازه می‌دهد بدون وابستگی به APIهای گران‌قیمت و محدود، عامل‌های کدنویسی بومی و محلی بسازند.

·نگاه ما
تحریریه دات‌هوش

تحلیل ما نشان می‌دهد که MiniMax با این اقدام، نقطه تمرکز رقابت مدل‌های بازمتن را از «تعداد پارامترها» به «مدیریت بهینه حافظه» تغییر داد. آنچه از این خبر می‌توان آموخت این است که برتری در کدنویسی دیگر نیازی به مدل‌های عظیم ندارد، بلکه به مکانیزم‌های بازیابی هوشمندانه مثل MSA بستگی دارد که اجازه می‌دهد مدل بدون کند شدن، حجم عظیمی از اطلاعات را پردازش کند.

منابع

گفتگو

شماره ۰۵۳پنج‌شنبه‌های هوش‌محور

بسته‌ی هفتگی دات‌هوش

۵ خبر، ۲ ابزار، ۱ پرامپت — به‌علاوه ۳ بخش جدید. بدون هیاهو، هر پنج‌شنبه صبح.

خبر کلیدی
ابزار کاربردی
پرامپت حرفه‌ای
تحلیل پژوهش
به‌زودی
زاویه‌ی ایرانی
به‌زودی
تمرین این هفته
به‌زودی
۰۰:۰۰تا شماره بعدیهفته‌ی ۵۳ بدون وقفه