Mellanox (NVIDIA Mellanox) 920-9B210-00FN-0D0 Praktik Aplikasi Sakelar InfiniBand

January 6, 2026

berita perusahaan terbaru tentang Mellanox (NVIDIA Mellanox) 920-9B210-00FN-0D0 Praktik Aplikasi Sakelar InfiniBand

Latar Belakang dan Tantangan: Kemacetan Jaringan dalam Komputasi Modern

Dalam perlombaan untuk penemuan ilmiah dan terobosan AI, kemampuan komputasi sebuah lembaga penelitian terkemuka terhambat bukan karena kurangnya daya pemrosesan mentah, tetapi oleh jaringan mereka. Infrastruktur HDR InfiniBand mereka yang ada, meskipun mampu, berjuang untuk mengimbangi tuntutan komunikasi yang masif dan tersinkronisasi dari kluster NVIDIA DGX mereka yang baru digunakan dan beban kerja HPC tradisional. Para peneliti menghadapi penundaan yang signifikan dalam waktu penyelesaian pekerjaan, dengan latensi jaringan dan kemacetan selama pola komunikasi all-to-all menjadi hambatan utama.

Tantangannya ada dua: pertama, untuk secara drastis mengurangi latensi untuk operasi Remote Direct Memory Access (RDMA) yang penting untuk simulasi HPC berbasis MPI. Kedua, untuk menyediakan jaringan tanpa hambatan dan non-blocking untuk pekerjaan pelatihan AI yang membutuhkan sinkronisasi parameter konstan di ratusan GPU. Lembaga tersebut membutuhkan solusi yang tahan masa depan yang dapat menangani kecepatan NDR 400Gb/s sambil sepenuhnya kompatibel dengan ekosistem mereka yang ada, memastikan jalur peningkatan yang hemat biaya tanpa perombakan total.

Solusi dan Penerapan: Menerapkan Fabric 920-9B210-00FN-0D0

Setelah evaluasi menyeluruh, lembaga tersebut memilih NVIDIA Mellanox 920-9B210-00FN-0D0 sebagai landasan dari jaringan berkinerja tinggi baru mereka. Solusi berpusat pada penerapan beberapa sakelar 920-9B210-00FN-0D0 MQM9790-NS2F 400Gb/s NDR untuk membentuk lapisan tulang punggung berbandwidth tinggi dan latensi rendah, yang menghubungkan semua node komputasi dan penyimpanan.

Penerapan tersebut disusun sebagai topologi fat-tree dua tingkat hibrida untuk memaksimalkan bandwidth bisectional dan meminimalkan jumlah hop. Aspek utama dari implementasi meliputi:

  • Inti Fabric: Lapisan tulang punggung yang dibangun seluruhnya dengan sakelar 920-9B210-00FN-0D0, menyediakan tulang punggung NDR 400Gb/s.
  • Integrasi Mulus: Memanfaatkan kompatibilitas mundur sakelar, sakelar leaf HDR dan NIC yang ada dihubungkan, melindungi investasi sebelumnya sambil memungkinkan peningkatan node secara bertahap ke NDR.
  • Manajemen Lanjutan: Seluruh fabric, termasuk unit sakelar InfiniBand 920-9B210-00FN-0D0 OPN baru, dikelola di bawah satu panel kaca menggunakan NVIDIA UFM®, memungkinkan telemetri kinerja yang tepat, penyediaan fabric otomatis, dan isolasi kesalahan yang cepat.
  • Validasi: Tim TI secara ketat berkonsultasi dengan lembar data 920-9B210-00FN-0D0 dan spesifikasi resmi untuk memvalidasi jangkauan kabel, persyaratan daya, dan pendinginan di pusat data mereka, memastikan kinerja yang optimal.

Arsitektur ini membangun solusi sakelar InfiniBand 920-9B210-00FN-0D0 OPN yang terpadu, melayani beban kerja HPC klasik dan AI yang muncul dari lembaga tersebut pada satu jaringan yang kuat.

Efek dan Manfaat: Keuntungan Terukur dalam Kinerja dan Efisiensi

Dampak dari penerapan 920-9B210-00FN-0D0 langsung terukur dan transformatif di berbagai dimensi operasi mereka.

Metrik Sebelum Penerapan Setelah Penerapan 920-9B210-00FN-0D0
Latensi MPI Rata-Rata (Round-Trip) ~0,7 mikrodetik ~0,5 mikrodetik
Waktu Penyelesaian Pekerjaan Pelatihan AI (Model Besar) 5,2 hari 3,8 hari(pengurangan 27%)
Pemanfaatan Fabric Selama All-to-All Puncak Sering melebihi 85%, menyebabkan kemacetan Stabil di bawah 60% pada kecepatan NDR
Tugas Administratif (Konfigurasi Ulang Fabric) Proses manual, memakan waktu Otomatis melalui integrasi UFM®

Manfaat yang paling signifikan adalah pengurangan dramatis dalam waktu proses aplikasi. Simulasi HPC, khususnya yang melibatkan dinamika fluida yang kompleks, melihat peningkatan 20-30% karena latensi MPI yang lebih rendah dan lebih konsisten. Untuk tim AI, kinerja RDMA yang mendekati teoretis melalui fabric baru berarti sumber daya GPU sepenuhnya jenuh dengan komputasi, tidak terhenti menunggu transfer jaringan. Sementara mengevaluasi total harga 920-9B210-00FN-0D0 adalah bagian dari pengadaan, percepatan hasil penelitian yang dihasilkan memberikan ROI yang menarik, jauh melebihi pengeluaran modal awal.

Kesimpulan dan Pandangan: Cetak Biru untuk Infrastruktur Tahan Masa Depan

Penerapan NVIDIA Mellanox 920-9B210-00FN-0D0 yang berhasil di lingkungan penelitian ini berfungsi sebagai cetak biru yang kuat untuk organisasi mana pun yang menghadapi tantangan interkoneksi serupa. Ini menunjukkan bahwa berinvestasi dalam fabric jaringan terdepan bukanlah biaya tambahan tetapi pengganda strategis untuk investasi komputasi.

Penerapan lembaga tersebut membuktikan bahwa 920-9B210-00FN-0D0 lebih dari sekadar sakelar; itu adalah platform yang memungkinkan untuk konvergensi. Ini secara mulus menyatukan beban kerja HPC dan AI yang digerakkan oleh RDMA pada satu jaringan yang sangat responsif, menyederhanakan operasi dan mempercepat penemuan. Karena teknologi ini menjadi lebih luas tersedia untuk dijual, ia menetapkan standar baru untuk apa yang mungkin dalam pengelompokan berkinerja tinggi.

Ke depan, skalabilitas inheren dan headroom kinerja dari fabric NDR 400Gb/s berarti lembaga tersebut berada pada posisi yang baik untuk mengintegrasikan sumber daya komputasi yang lebih kuat di masa mendatang. 920-9B210-00FN-0D0 telah secara efektif menghilangkan jaringan sebagai hambatan, memungkinkan para peneliti untuk hanya fokus pada batas algoritma dan imajinasi mereka.