Diseño de Topología de Red para Clústeres GPU: Arquitecturas Fat-Tree, Dragonfly y Optimizadas por Rail
DGX SuperPOD especifica fat-tree de tres niveles con Quantum-2 InfiniBand (400Gb/s). Estudio de Meta encuentra que errores de configuración de red causan 10.7% de fallos significativos en trabajos GPU. Ancho de banda de bisección completo...
None