GPUクラスタネットワークトポロジ設計:ファットツリー、ドラゴンフライ、レール最適化アーキテクチャ
DGX SuperPODはQuantum-2 InfiniBand(400Gb/s)による3層ファットツリーを規定。Metaの調査では、ネットワーク構成エラーがGPUジョブの重大な障害の10.7%を引き起こしていることが判明。通信パターンが動的に変化する分散トレーニングでは、フルビセクション帯域幅が重要...
None
DGX SuperPODはQuantum-2 InfiniBand(400Gb/s)による3層ファットツリーを規定。Metaの調査では、ネットワーク構成エラーがGPUジョブの重大な障害の10.7%を引き起こしていることが判明。通信パターンが動的に変化する分散トレーニングでは、フルビセクション帯域幅が重要...
Tell us about your project and we'll respond within 72 hours.
Thank you for your inquiry. Our team will review your request and respond within 72 hours.