NVIDIA
® Quantum-X800 InfiniBandスイッチは、800ギガビット/秒(Gb/s)のスループットを超低レイテンシと高度なNVIDIA In-Network Computingで実現します。これらのスイッチには、リモート・ダイレクト・メモリ・アクセス(RDMA)、第4世代のNVIDIA® Scalable Hierarchical Aggregation and Reduction Protocol (SHARP)
™、アダプティブルーティング、テレメトリーベースの輻輳制御、セルフヒーリング技術などの高度な機能が組み込まれています。このような機能強化により、ハイパフォーマンス・コンピューティング(HPC)やAIデータセンター内のアプリケーション全体のパフォーマンスが向上します。
主な利点- AI 向けの最高の拡張性:NVIDIA Quantum-X800 スイッチは、AI コンピュートファブリック向けに 2 倍の高速化と 5 倍のスケーラビリティを実現します。2階層のQuantum-X800 Fat Treeトポロジーは、10,000を超える800Gb/秒のホスト接続をサポートできます。
- 次世代の In-Network Computing: Quantum-X800スイッチはSHARPをサポートし、計算処理をネットワークに効率的にオフロードすることで、パフォーマンスを最大9倍向上させます。第4世代のSHARPでは、FP8精度のサポートや、ReduceScatterやScatterGatherなどの新しい集団通信のサポートが追加されています。
- より高い有効帯域幅と性能分離: Quantum-X800スイッチは、強化されたアダプティブルーティングとテレメトリーベースの輻輳制御をサポートしています。これにより、マルチテナント環境やマルチジョブ環境において、ほぼ完全な実効帯域幅とパフォーマンスの分離が可能になります。
- ソフトウェア運用の強化: Quantum-X800スイッチには、包括的なシャーシ管理とシステム設定のためのNVIDIAネットワークOSソフトウェア(NVOS)が搭載されています。NVOSは、コマンドラインインターフェイス(CLI)、REST API、Simple Network Management Protocol (SNMP)、gRPC Network Management Interface (gNMI)テレメトリを含む様々なインターフェイスをサポートしています。
NVIDIA Quantum-X800 InfiniBandスイッチは、1兆パラメータ規模の生成AIを実現するために極めて重要です。NVIDIA Quantum-X800スイッチNVIDIA Quantum-X800 Q3400-RA 4Uスイッチは、レーンあたり200Gb/秒のシリアライザ/デシリアライザ(SerDes)技術を初めて採用し、ネットワーク性能と帯域幅を大幅に強化しました。800Gb/秒で144ポートを搭載し、72個のOctal Small Form-factor Pluggable (OSFP)ケージに分かれて配置されています。スイッチの高密度のポート構成は、最小のレイテンシーと最適なジョブローカリティで最大10,368枚のネットワーク・インターフェイス・カード(NIC)を接続できる2階層ファットツリー・トポロジーをサポートし、数万台のGPUへの接続を提供する他のトポロジーもサポートします。Q3400-RAは、標準的な19インチ・ラック・キャビネット用に設計された空冷システムです。
Q3400 スイッチには、NVIDIA Unified Fabric Manager(UFM)®管理専用のInfiniBandインバンド管理ポートがあり、フロントパネルで他のポートから分離されています。この分離により、標準ポート一式をデータネットワーク接続に使用することができ、ポートの割り当てを簡素化し、トポロジー設計を合理化します。さらに、NVIDIA Quantum-X800スイッチはオプションのルーター機能を備えており、InfiniBandクラスタの拡張を容易にし、複数のサイトにまたがる大規模なノードをサポートします。
NVIDIA Quantum-X800 InfiniBandプラットフォームQuantum-X800 InfiniBandプラットフォームには、Q3400、NVIDIA ConnectX®-8 SuperNIC、トランシーバとケーブルのNVIDIA LinkX®相互接続ポートフォリオが含まれます。このプラットフォームは、スイッチからホストまで、エンドツーエンドで800Gb/秒のスループットを達成します。ファブリックスケールのプラットフォーム管理とモニタリングのために、Quantum-X800はUFMを搭載し、ネットワークのパフォーマンスと健全性に関する強力な可視性と洞察力を備えた真のソフトウェア定義ネットワーキングを実現します。このエンドツーエンドのネットワークプラットフォームは、スケールアウト型コンピュートファブリックに最高のパフォーマンスを提供し、大規模AIを実現することを目的として構築されています。