تصور کنید هزاران پردازنده گرافیکی به جای آنکه مجموعهای از قطعات مجزا باشند، دقیقاً مانند یک تکپردازنده غولآسا عمل کنند. اگر فکر میکنید سرعت تکتک GPUها تعیینکننده برنده جنگ AI است، سخت در اشتباهید؛ نبرد واقعی اکنون بر سر «سیمهایی» است که این تراشهها را به هم وصل میکنند.
انویدیا (Nvidia) در ۲۷ آوریل ۲۰۲۶ اعلام کرد که با سرمایهگذاری ۲ میلیارد دلاری در شرکت Marvell Technology، توسعه معماری NVLink Fusion را آغاز میکند. به نقل از گزارش gentic.news، هدف این همکاری ساخت زیرساختی است که اجازه میدهد هزاران شتابدهنده در یک دامنه منسجم (Coherent Domain) قرار گیرند و به عنوان یک دستگاه واحد با حافظه مشترک عمل کنند.

این معماری جدید قصد دارد محدودیتهای فعلی گرههای تکواحدی (Single-node) را بشکند. در حالی که نسلهای فعلی NVLink تنها ۸ یا ۱۶ پردازنده را به هم متصل میکنند، NVLink Fusion این شبکه با تأخیر کم (Low-latency) را به کل مرکز داده (Data Center) گسترش میدهد.
بر اساس مستندات این همکاری، نقش Marvell بر طراحی ASICهای (مدارهای مجتمع با کاربرد خاص) سوئیچ و لایههای PHY (لایه فیزیکی) متمرکز است. این تراشهها نرخهای سیگنالدهی ۸۰۰ گیگابیت و ۱.۶ ترابیت را بدون سربار پروتکلهای سنتی مانند Ethernet یا InfiniBand مدیریت میکنند.
همانطور که در تحلیلهای پیشین ما دربارهی رقابت سختافزاری در مراکز داده اشاره کردیم، انویدیا همواره به دنبال حذف هرگونه گلوگاه در مسیر انتقال داده است تا قدرت محاسباتی مدلها را به حداکثر برساند.

این عجله انویدیا ریشه در فشار رقبا دارد. AMD با معماری Infinity خود و اینتل (Intel) با حمایت از کنسرسیوم باز UALink، سعی دارند سلطه انویدیا را بشکنند. همچنین غولهایی مثل گوگل و آمازون در حال ساخت اتصالات اختصاصی برای تراشههای TPU و Trainium خود هستند.
برای مهندسان AI، این یعنی سادهتر شدن محاسبات توزیعشده. یک شبکه یکپارچه NVLink میتواند پیچیدگیهای مدیریت MPI و NCCL را حذف کرده و موازات تانسوری (Tensor Parallelism) را برای بزرگترین مدلهای آموزشی به شدت بهینه کند. اگر این فناوری به ثمر برسد، برنامهنویسی برای یک کلاستر هزارتایی GPU شبیه به برنامهنویسی برای یک ماشین واحد خواهد بود.
اما این نبرد سختافزاری تنها بخشی از داستان است؛ تأثیر این یکپارچگی بر هزینههای استنتاج را در گزارش بعدی بررسی خواهیم کرد.
گام بعدی شما
- بررسی نقشه راه Marvell برای زمان Tape-out (تولید آزمایشی) تراشههای جدید.
- مقایسه عملکرد NVLink Fusion در برابر استانداردهای باز UALink.
- تحلیل اثر این یکپارچگی بر کاهش هزینههای مدیریت کلاسترها.




گفتگو