NVIDIA Mellanox MQM9790-NS2F InfiniBand Switch dalam Aksi: Optimasi Interkoneksi Latensi Rendah

April 13, 2026

berita perusahaan terbaru tentang NVIDIA Mellanox MQM9790-NS2F InfiniBand Switch dalam Aksi: Optimasi Interkoneksi Latensi Rendah

NVIDIA Mellanox MQM9790-NS2F InfiniBand Switch dalam Aksi: Optimasi Interkoneksi Latensi Rendah untuk RDMA / HPC / AI Cluster

Dalam pelatihan AI, simulasi komputasi berkinerja tinggi (HPC), dan penyimpanan terdistribusi skala besar, latensi jaringan dan bandwidth sering menentukan batas atas efisiensi cluster.Untuk membantu organisasi memecahkan hambatan ini, yangMQM9790-NS2FInfiniBand switch dari NVIDIA Mellanox menjadi komponen interkoneksi inti dalam banyak penyebaran AI dan HPC.mengilustrasikan bagaimana switch ini memberikan pada jaringan RDMA latensi rendah dan keuntungan kinerja terukur.

Latar Belakang & Tantangan: Dari Seribu-GPU ke Sepuluh Ribu-GPU Tekanan Jaringan

Sebuah lembaga penelitian terkemuka sebelumnya mengoperasikan kluster seribu GPU untuk pelatihan model bahasa besar dan simulasi cuaca.Saat parameter model tumbuh dari puluhan miliar menjadi ratusan miliar, jaringan HDR InfiniBand 200Gb/s yang ada mulai mengalami kemacetan dan peningkatan biaya komunikasi.dan GPU sering tidak aktif saat menunggu transfer jaringanArsitek sangat membutuhkan solusi yang menawarkan kepadatan pelabuhan yang lebih tinggi, keseimbangan beban yang lebih halus, dan kompatibilitas penuh dengan infrastruktur RDMA yang ada.

Setelah evaluasi menyeluruh, tim memilih kain InfiniBand kelas NDR berdasarkanNVIDIA Mellanox MQM9790-NS2F. Dengan 64 port OSFP, masing-masing beroperasi pada kecepatan baris 400Gb / s, switch sangat cocok dengan permintaan throughput dari server GPU generasi berikutnya.

Solusi & Pengerahan: NDR Fabric + Lossless RDMA Network

Dalam desain baru, setiap server GPU dilengkapi dengan adaptor ConnectX-7 dual-port, yang terhubung ke dua switch daun.MQM9790-NS2F 400Gb/s NDR 64-port OSFPswitch membentuk topologi Fat-Tree dua lapisan menggunakan arsitektur Clos yang tidak memblokir. Routing adaptif dan kontrol kemacetan diaktifkan,memanfaatkan RDMA InfiniBand asli untuk mentransfer data langsung dari memori GPU ke memori GPU jarak jauh, melewati CPU dan perangkat lunak tumpukan overhead.

  • Penggunaan port & kompatibilitas:Adaptor HDR yang ada dapat beroperasi pada kecepatan yang berkurang, melindungi investasi sebelumnya.MQM9790-NS2F kompatibelDaftar ini mencakup server GPU dan sistem penyimpanan arus utama, yang tidak memerlukan modifikasi driver selama penyebaran.
  • Operasi cerdas:Monitor telemetri terintegrasi menghubungkan kesalahan dan kemacetan secara real time, membantu tim dengan cepat mengisolasi masalah modul optik atau kabel dan secara drastis mengurangi waktu rata-rata untuk perbaikan.

Hasil & Manfaat: Waktu Iterasi Pelatihan Dikurangi 38%, Overhead Jaringan Turun ke 8%

Setelah peningkatan, lembaga ini menjalankan tes perbandingan terhadap beban kerja produksi.MQM9790-NS2F InfiniBand switchwaktu iterasi yang berkurang dari 2,8 detik menjadi 1,73 detik, peningkatan 38%. pangsa komunikasi jaringan dari total latensi turun dari 22% menjadi 8%,Artinya GPU menghabiskan lebih banyak waktu pada perhitungan yang berguna. Berkat SHARPv3 dalam-jaringan komputasi di dalam switch NDR, All-Reduce penggunaan bandwidth hampir dua kali lipat.

Di sisi penyimpanan, NVMe latensi rendah melalui InfiniBand meningkatkan bandwidth baca / tulis agregat dari sistem file paralel sebesar 2,3 kali.Waktu menyimpan dan mengembalikan titik pemeriksaan berkurang dari 12 menit menjadi kurang dari 5 menitAngka-angka ini tercatat dalam laporan uji internal dan selaras denganSpesifikasi MQM9790-NS2Fgaris awal.

Ringkasan & Prospek: Interkoneksi NDR sebagai Pilihan Default untuk Infrastruktur AI Generasi Berikutnya

Kasus ini dengan jelas menunjukkan bahwa untuk cluster RDMA/HPC/AI skala besar, mengadopsiSolusi switch MQM9790-NS2F InfiniBandUntuk arsitek yang merencanakan sepuluh ribu-GPU cluster,Lembar data MQM9790-NS2Fadalah referensi penting untuk mengevaluasi daya, kepadatan port, dan set fitur.Harga MQM9790-NS2FatauMQM9790-NS2F untuk dijualJika ada pertanyaan, silakan hubungi mitra resmi NVIDIA.platform switching NDR akan terus memainkan peran penting dalam membuka potensi komputasi.