Mellanox (NVIDIA) MQM9790-NS2F InfiniBand Switch dalam Aksi. Optimasi Interkoneksi Low-Latency untuk RDMA/HPC/AI.

May 28, 2026

Karena cluster pelatihan AI skala besar dan pusat komputasi berkinerja tinggi (HPC) mendorong persyaratan bandwidth dan latensi jaringan ke tingkat yang belum pernah terjadi sebelumnya,Solusi Ethernet tradisional semakin berjuang dengan kontrol kemacetan dan latensi ekor yang tidak dapat diprediksi di bawah beban kerja RDMASebuah pusat supercomputing nasional terkemuka baru-baru ini menghadapi tantangan ini saat meningkatkan kluster GPU generasi berikutnya.Mellanox (NVIDIA) MQM9790-NS2Fsebagai pergantian struktur inti, sebuah keputusan yang secara fundamental mengubah profil kinerja cluster mereka.

Latar Belakang & Tantangan: Tembok Skalabilitas

Dengan lebih dari 2.000 GPU yang menjalankan tugas pelatihan AI secara paralel,Operasi komunikasi kolektif seperti semua-mengurangi dan semua-ke-semua mengalami lonjakan latensi ekor yang signifikan. Jaringan telah menjadi hambatan utama, menyebabkan GPU waktu kosong yang membuang-buang sumber daya komputasi dan energi.Insinyur memperkirakan bahwa hampir 30% dari siklus komputasi hilang untuk overhead komunikasi selama latihan terdistribusi skala besar.

Apa yang dibutuhkan tim adalah saklar yang mampu memberikan400Gb/s per port, dukungan RDMA asli, dan akselerasi komputasi dalam jaringan, semua sambil mempertahankan kompatibilitas ke belakang dengan infrastruktur HDR yang ada.Lembar data MQM9790-NS2FdanSpesifikasi MQM9790-NS2F, mereka menentukan bahwaMQM9790-NS2F InfiniBand switchmenawarkan keseimbangan ideal kepadatan, kinerja, dan fitur yang ditetapkan.

Solusi & Pengerahan: 64-Port NDR Fabric Upgrade

Pusat mengerahkan empatMQM9790-NS2F 400Gb/s NDR 64-port OSFPswitch dalam topologi spine-leaf, menghubungkan 2.048 GPU di 64 node komputasi. Setiap node terhubung melalui kabel splitter OSFP-to-4x100Gb/s,menyediakan bandwidth agregat 400Gb/s per server sambil mengoptimalkan kepadatan manajemen kabel.

Parameter penyebaran	Konfigurasi
Switch Model	NVIDIA Mellanox MQM9790-NS2F(4 unit)
Konfigurasi Pelabuhan	64x OSFP, 400Gb/s NDR per port
Total GPU	2,048 (NVIDIA H100)
Fitur di Jaringan	SHARPv3, Adaptive Routing, Kontrol kemacetan

Kunci dari penyebaran adalah memastikanMQM9790-NS2F kompatibeloperasi dengan adaptor endpoint HDR yang ada. The switch’s automatic speed negotiation and link-layer translation allowed a phased migration strategy — legacy nodes operate at HDR speeds while new NDR-capable servers leverage full 400Gb/s bandwidthPusat ini juga memanfaatkan agregasi SHARPv3 di dalam jaringan, mengurangi lalu lintas total hingga lebih dari 65% untuk ukuran pesan besar yang umum ditemukan dalam pelatihan LLM.

Bagi mereka yang mengevaluasi upgrade serupa,Harga MQM9790-NS2Fpertanyaan danMQM9790-NS2F untuk dijualketersediaan telah meningkat secara signifikan di kalangan pelanggan perusahaan dan penelitian.Switch ini ¥ adalah biaya kepemilikan total yang kompetitif ¥ faktoring dalam jumlah switch yang lebih rendah karena kepadatan 64 port ¥ membuatnya menjadi pilihan yang menarik baik untuk proyek baru maupun refresh.

Hasil & Manfaat: Peningkatan Kinerja yang Dapat Diukur

Semua-mengurangi latensi (1GB pesan):Dikurangi dari 48μs menjadi 19μs (peningkatan 60%)
Penggunaan GPU yang efektif:Meningkat dari 71% menjadi 93% selama pelatihan skala besar
Waktu penyelesaian pekerjaan (setara dengan GPT-3 175B):Dipotong 41%
Latensi ekor yang diinduksi jaringan (persentil ke-99):Potong dari 210μs hingga kurang dari 35μs

SebagaiSolusi switch MQM9790-NS2F InfiniBand, penyebaran menunjukkan bahwa kain NDR 400Gb/s dapat memberikan janji teoritis mereka.Kombinasi dari algoritma kontrol kemacetan dan routing adaptif menghilangkan pola "incast" runtuh yang mengganggu kain HDR sebelumnya selama semua-ke-semua fase komunikasi.

Ringkasan & Prospek: Yayasan untuk Exascale AI

Kesuksesan pusat superkomputer denganMQM9790-NS2FMereka sekarang merencanakan fase kedua yang akan menggandakan jumlah GPU menjadi 4,096 menggunakan tambahanMQM9790-NS2F 400Gb/s NDR 64-port OSFPswitch dalam topologi pohon lemak tiga tingkat. fitur telemetri dan manajemen out-of-band switch juga memungkinkan penghindaran kemacetan prediktif,mengurangi overhead operasional untuk tim jaringan.

Untuk arsitek jaringan dan manajer TI yang mengevaluasi kain generasi berikutnya,NVIDIA Mellanox MQM9790-NS2Fmerupakan solusi yang matang, terbukti produksi. Apakah Anda membangun kelompok penelitian AI baru atau meningkatkan fasilitas HPC yang ada, switch ini memberikan low-latency,fondasi dengan bandwidth tinggi yang dibutuhkan untuk beban kerja paralel modern.