NVIDIA Mellanox MCX653106A-HDAT Beraksi: Mencapai Transport RDMA/RoCE Latensi Rendah dan Terobosan Throughput Server

June 16, 2026

berita perusahaan terbaru tentang NVIDIA Mellanox MCX653106A-HDAT Beraksi: Mencapai Transport RDMA/RoCE Latensi Rendah dan Terobosan Throughput Server

Dalam lingkungan pusat data modern, yang mencakup penyimpanan terdistribusi, perdagangan frekuensi tinggi, dan kelompok pelatihan AI, dua tantangan berkelanjutan tetap ada:mengurangi latensi yang disebabkan oleh jaringan dan memaksimalkan throughput server tanpa membebani CPUAplikasi ini menyelam mendalam memeriksa bagaimana penyedia infrastruktur cloud terkemuka mengatasi masalah-masalah yang tepat dengan menyebarkanNVIDIA Mellanox MCX653106A-HDATAdaptor server di seluruh node komputasi dan penyimpanan mereka.

Latar Belakang & Tantangan

Infrastruktur 25GbE penyedia yang ada, berdasarkan adaptor Ethernet standar dengan tumpukan TCP/IP berbasis perangkat lunak, menunjukkan keterbatasan yang jelas.Beban kerja penyimpanan menggunakan NVMe over Fabrics mengalami lonjakan latensi yang tidak dapat diprediksi (sering melebihi 50μs), sementara cluster database menderita dari pemanfaatan CPU yang tinggi hingga 35% dari inti yang dikonsumsi oleh pemrosesan jaringan saja.Tim rekayasa membutuhkan solusi yang dapat memberikan latensi sub-10μs untuk transaksi RDMA dan mendukung 200GbE throughput tanpa memerlukan perbaikan arsitektur yang lengkap.

Setelah mengevaluasi berbagai pilihan, mereka beralih keKartu adaptor Ethernet MCX653106A-HDAT, yang menjanjikan hardware offloaded RoCE (RDMA over Converged Ethernet) dan integrasi mulus dengan topologi leaf-spine berbasis Cumulus Linux mereka yang ada.

Solusi & pendekatan penyebaran

Penyebaran berpusat di sekitarMCX653106A-HDAT ConnectX adaptor kartu jaringan PCIeSetiap node komputasi menerima satu adaptor, sementara node penyimpanan dilengkapi dengan dua untuk redundansi.Langkah-langkah utama pelaksanaan termasuk:

  • Memungkinkan RoCEv2 dengan PFC (Priority Flow Control) dan ECN (Explicit Congestion Notification) untuk memastikan transportasi tanpa kerugian
  • Mengkonfigurasi SR-IOV untuk mendedikasikan fungsi virtual ke beban kerja database dan penyimpanan prioritas tinggi
  • Menggunakan yang terbaruMCX653106A-HDAT kompatibeldriver stack (NVIDIA DOCA 2.5) di seluruh node LTS Ubuntu 22.04
  • Menerapkan akselerasi DPDK berbasis perangkat keras untuk jalur pemrosesan paket

BerdasarkanLembar data MCX653106A-HDATdan validasi pra-penerapan, tim memproyeksikan latensi perangkat keras sub-1μs dan hingga 215 juta paket per detik (MPPS) untuk transaksi paket kecil √ metrik yang membimbing perencanaan kapasitas mereka.

Hasil & Manfaat yang Dapat Diukur

Setelah percobaan empat minggu di 50 simpul produksi, tim infrastruktur mendokumentasikan perbaikan berikut ketika membandingkanNVIDIA Mellanox MCX653106A-HDATmelawan adaptor lama mereka:

Metrik Adaptor Legacy 25GbE MCX653106A-HDAT (RoCE) Peningkatan
NVMe-oF Baca Latensi (P99) 52 μs 60,8 μs Pengurangan 87%
CPU Overhead (Network Stack) 34% 7% 27 poin persentase dibebaskan
Total throughput (per server) 92 Gbps (diikat) 198 Gbps Peningkatan 115%
Tingkat Paket Kecil (64B) 48 Mpps 187 Mpps ~290% keuntungan

Selain angka mentah, tim insinyur mencatat bahwaSolusi kartu adaptor MCX653106A-HDAT Ethernetmenghapuskan penghindaran tuning yang sebelumnya diperlukan seperti pengganggu coalescing hacks dan buffer penerima yang terlalu besar.Adaptor hardware offloads untuk VXLAN dan Geneve juga menyederhanakan mereka kontainer jaringan tumpukan, mengurangi latensi pod-to-pod sebesar 40% di lingkungan Kubernetes.

Untuk manajer TI yang menilai biaya,Harga MCX653106A-HDATPerbandingan terhadap solusi 200GbE yang sebanding menunjukkan biaya kepemilikan total 15-20% lebih rendah ketika memperhitungkan penghematan inti CPU dan pengurangan penggunaan port switch.MCX653106A-HDAT untuk dijualpertanyaan dari tim yang berdekatan, termasuk HPC dan real-time analytics, telah diserahkan untuk siklus pengadaan berikutnya.

Ringkasan & Prospek

Penempatan ini mengkonfirmasi bahwaNVIDIA Mellanox MCX653106A-HDATSR-IOV tidak hanya peningkatan spesifikasi tetapi lompatan fungsional untuk lingkungan yang sensitif terhadap latensi dan terikat dengan throughput.,dan GPUDirect-siap arsitektur organisasi dapat mencapai deterministik latensi skala mikrodetik sambil merebut kembali siklus CPU untuk logika aplikasi.

Karena tim infrastruktur memperluas peluncuran mereka ke 500+ node,Mereka juga mengeksplorasi enkripsi inline built-in adaptor (IPsec / TLS) untuk keamanan multi-penyewa dan PTP (IEEE 1588v2) untuk beban kerja layanan keuanganUntuk insinyur yang mencari konfigurasi yang tervalidasi,Spesifikasi MCX653106A-HDATdan desain referensi tersedia melalui NVIDIA DOCA portal pengembang.MCX653106A-HDAT ConnectX adaptor kartu jaringan PCIememberikan janji low-latency, high-throughput Ethernet untuk pusat data generasi berikutnya.

Untuk tinjauan teknis yang lebih mendalam, konsultasikan dengan pejabatLembar data MCX653106A-HDATatau hubungi arsitek solusi NVIDIA regional Anda.