Проєктування мережевої топології GPU-кластерів: архітектури Fat-Tree, Dragonfly та Rail-Optimized
DGX SuperPOD визначає трирівневу fat-tree топологію з Quantum-2 InfiniBand (400 Гб/с). Дослідження Meta виявило, що помилки конфігурації мережі спричиняють 10,7% серйозних збоїв GPU-завдань. Повна бісекційна пропускна здатність...
None