NVIDIA Mellanox MCX653106A-HDAT Server Adapter dalam Aksi: RDMA / RoCE Low-Latency Transport & Server
April 30, 2026
Dalam lingkungan pusat data modern, mulai dari penyimpanan terdistribusi dan perdagangan frekuensi tinggi hingga kelompok pelatihan AI skala besar, tumpukan protokol TCP/IP tradisional telah menjadi hambatan utama.Overhead jaringan kernel, menyalin data, dan beralih konteks mengkonsumsi sumber daya CPU yang signifikan sambil memperkenalkan latensi yang tidak dapat diprediksi.Studi kasus ini meneliti bagaimana penyedia infrastruktur cloud terkemuka mengatasi tantangan ini dengan menerapkanNVIDIA Mellanox MCX653106A-HDATserver NIC, mencapai peningkatan dramatis dalam latensi dan throughput.
Infrastruktur 25GbE penyedia yang ada, yang menjalankan TCP standar, berjuang untuk mengikuti lalu lintas penyimpanan NVMe-oF dan beban kerja analisis real-time.Penggunaan CPU pada node penyimpanan sering melebihi 70% hanya untuk pemrosesan jaringan, meninggalkan ruang kepala yang tidak cukup untuk logika aplikasi. latensi end-to-end antara node komputasi dan penyimpanan berfluktuasi antara 50 ~ 150 mikrodetik,menyebabkan lonjakan latensi ekor yang berdampak pada perjanjian tingkat layananTim insinyur menyadari bahwa perubahan mendasar dalam arsitektur jaringan diperlukan, yang melewati kernel dan memungkinkan akses memori langsung antara titik akhir.
Setelah mengevaluasi beberapa pilihan, tim memilihKartu adaptor Ethernet MCX653106A-HDATdibangun di atas arsitektur ConnectX-6, iniMCX653106A-HDAT ConnectX adaptor kartu jaringan PCIemenyediakan konektivitas 100GbE dual-port dengan dukungan hardware asli untuk RoCE (RDMA over Converged Ethernet).
- Tahap 1:Ganti NIC lama di node penyimpanan (10 node yang menjalankan Ceph) dengan adaptor baru.
- Tahap 2:Mengkonfigurasi Ethernet lossless menggunakan DCB (Priority Flow Control dan ETS) pada kedua NIC dan switch top-of-rack.
- Tahap 3:Migrasi lalu lintas aplikasi dari socket TCP ke kata kerja berbasis RDMA dan NVMe-oF melalui RoCE.
- Fase 4:Memperluas penyebaran ke node komputasi menangani analisis real-time.
Insinyur konsultasiLembar data MCX653106A-HDATdanSpesifikasi MCX653106A-HDATdikonfirmasi kompatibilitas penuh dengan kain switch Mellanox yang ada dan distribusi Linux yang digunakan (Ubuntu 22.04 dengan driver MLNX_OFED).MCX653106A-HDAT kompatibelekosistem terbukti komprehensif, tidak memerlukan perubahan perangkat keras selain penggantian NIC itu sendiri.
Pengujian pasca-penerapan menunjukkan peningkatan yang substansial di semua metrik utama.
| Metrik | Sebelumnya (25GbE TCP) | Setelah (MCX653106A-HDAT RoCE) | Peningkatan |
|---|---|---|---|
| Rata-rata Latensi (P99) | 120 μs | 8 μs | Pengurangan 93% |
| Storage Node CPU (jalur jaringan) | ~65% | ~12% | 5.4x pengurangan |
| NVMe-oF Read Throughput (per node) | 18 Gb/s | 96 Gb/s | 5.3x peningkatan |
| Tingkat Pesan (64B paket) | 15 Mpps | 215 Mpps | 14.3x peningkatan |
Selain keuntungan kuantitatif ini, tim mengamati beberapa manfaat kualitatif.Solusi kartu adaptor MCX653106A-HDAT Ethernetmemungkinkan pergerakan data nol salinan sejati antara memori aplikasi dan penyimpanan jarak jauh, menghilangkan masalah kelelahan buffer yang sebelumnya menyebabkan kegagalan intermiten selama ledakan lalu lintas.Untuk beban kerja analitik, migrasi ke RDMA mengurangi waktu penyelesaian pekerjaan sebesar 62%, secara langsung meningkatkan hasil bisnis.Harga MCX653106A-HDATterhadap total biaya kepemilikan, pengurangan 30% dalam jumlah node penyimpanan (karena efisiensi per node yang lebih tinggi) menghasilkan laba dalam waktu sembilan bulan.MCX653106A-HDAT untuk dijualmelalui mitra NVIDIA juga termasuk akses ke kerangka kerja DOCA, membuka kemampuan pemrograman masa depan untuk fungsi jaringan kustom.
PengerahanNVIDIA Mellanox MCX653106A-HDATTransformasi infrastruktur penyedia dari lingkungan TCP terbatas menjadi kinerja tinggi, low-latency kain mampu mendukung beban kerja modern.,Antarmuka PCIe 4.0 dan ekosistem perangkat lunak yang komprehensif memenuhi tiga tuntutan kritis pusat data saat ini: mengurangi latensi, meningkatkan throughput, dan meningkatkan efisiensi CPU.
Untuk arsitek yang mengevaluasi peningkatan yang sama, perjalanan dimulai dengan memverifikasiMCX653106A-HDAT kompatibelKomponen-komponen termasuk switch, kabel, dan sistem operasi.Lembar data MCX653106A-HDATmenyediakan spesifikasi daya, termal, dan mekanik untuk perencanaan integrasi.Kartu adaptor Ethernet MCX653106A-HDATpenyedia sekarang memperluas penyebaran untuk mencakup GPU langsung RDMA untuk beban kerja inferensi AI,Lebih lanjut memvalidasi adaptor ini sebagai landasan arsitektur pusat data modern.

