Чому NVIDIA GB300 NVL72 (Blackwell Ultra) має значення 🤔

NVIDIA GB300 NVL72 забезпечує на 1,5x більшу продуктивність ШІ порівняно з GB200 завдяки 72 GPU Blackwell Ultra, 288 ГБ пам'яті на GPU та пропускній здатності NVLink 130 ТБ/с. Ось що інженерам розгортання потрібно знати про живлення, охолодження та кабелювання для цих 120-кВт шаф ШІ-центрів обробки даних.

Blake Crosley

Jun 24, 2025 9 min read Disclaimer

Чому NVIDIA GB300 NVL72 (Blackwell Ultra) має значення 🤔

NVIDIA об'єднала 72 GPU Blackwell Ultra та 36 процесорів Grace в рідинно-охолоджуваний блок розміром зі стійку, який споживає приблизно 120 кВт і забезпечує 1,1 екзаFLOPS обчислень FP4 з GB300 NVL72—на 1,5x більшу продуктивність ШІ порівняно з оригінальним GB200 NVL72 [^2025]. Ця єдина шафа змінює всі припущення щодо живлення, охолодження та кабелювання всередині сучасних центрів обробки даних. Ось що дізнаються інженери розгортання, готуючи об'єкти до перших поставок GB300 NVL72 у виробництво.

1. Розбір стійки

[caption id="" align="alignnone" width="1292"] КомпонентКількістьКлючова характеристикаСпоживання енергіїДжерелоОбчислювальні піддони Grace‑Blackwell18~6,5 кВт кожен117 кВт загальноSupermicro 2025Піддони комутаторів NVLink‑59130 ТБ/с агрегатна мережа3,6 кВт загальноSupermicro 2025Блоки живлення8132 кВт загальний вихід DC0,8 кВт накладніSupermicro 2025DPU Bluefield‑318Розвантаження сховища та безпекиВключено в обчисленняThe Register 2024 [/caption]

Шафа важить приблизно 1,36 т (3000 фунтів) і займає той самий простір, що й звичайна 42U стійка [^2024]. GB300 NVL72 представляє Blackwell Ultra з покращеними GPU B300 з 288 ГБ пам'яті HBM3e на GPU (на 50% більше, ніж 192 ГБ у оригінального B200), досягнутими завдяки 12-висотним стекам HBM3e замість 8-висотних. Кожен суперчіп тепер поєднує чотири GPU B300 з двома процесорами Grace, порівняно з оригінальною конфігурацією з двома GPU. Кожен суперчіп Grace‑Blackwell поєднує 72 ядра GPU Blackwell Ultra на 2,6 ГГц з 72-ядерним процесором Arm Neoverse V2, що працює на базовій частоті 3,1 ГГц. Інтегрована пам'ять HBM3e забезпечує 8 ТБ/с на GPU з ємністю 288 ГБ.

Практична інформація: Центр ваги стійки розташований на 18% вище, ніж у стандартних серверів, через щільне розміщення обчислювальних ресурсів у верхніх піддонах. Найкращі практики тепер рекомендують кріпити монтажні направляючі болтами M12, а не стандартними кліщовими гайками, для вирішення проблеми мікровібрацій, що спостерігаються під час роботи на повному навантаженні.

2. Живлення звіра: подача електроенергії

Стійка GB300 NVL72 постачається з вбудованими блоками живлення, що забезпечують ефективність 94,5% при повному навантаженні. Піковий розхід сягає 120,8 кВт під час навчальних навантажень змішаної точності—аналізатори якості енергії зазвичай фіксують коефіцієнт потужності 0,97

Порівняння топології напруги:

208V/60Hz: 335A лінійний струм, потребує міді 4/0 AWG (107мм²)
415V/50‑60Hz: 168A лінійний струм, потребує лише міді 70мм²
480V/60Hz: 145A лінійний струм, мінімальне розгортання в Північній Америці

Найкращою практикою галузі є забезпечення подвійних трифазних каналів 415V на стійку через роз'єми 160A IEC 60309. Цей вибір знижує втрати I²R на 75% порівняно з 208V, зберігаючи сумісність з європейськими стандартами об'єктів. Польові вимірювання показують, що панелі автоматичних вимикачів зазвичай залишаються нижче 85% термічного зниження в приміщеннях 22°C.

Зменшення гармонік: Стійки GB300 NVL72 демонструють загальний гармонічний спотворення 4,8% при типових навантаженнях навчання ШІ. Розгортання понад вісім стійок зазвичай потребують 12-пульсових випрямлячів на спеціальних трансформаторах для дотримання стандарту IEEE 519.

3. Керівництво з охолодження: реальність теплотехніки

Кожен кристал GPU Blackwell Ultra має розмір 744 мм² і розсіює до 1000 Вт через інтерфейс холодної плити. Процесор Grace додає ще 500 Вт на свої 72 ядер. Програма IR7000 від Dell позиціонує рідину як стандартний шлях для обладнання класу Blackwell, заявляючи про ємності до 480 кВт на стійку з закритими теплообмінниками задніх дверей [^2024].

Рекомендована теплова ієрархія:

≤80 кВт/стійка: Теплообмінники задніх дверей з водою подачі 18°C, швидкість потоку 35 л/хв
80–132 кВт/стійка: Петлі прямо-до-чіпа (DTC) обов'язкові, подача 15°C, мінімум 30 л/хв
132 кВт/стійка: Потрібне занурювальне охолодження або конфігурації розділених стійок

Специфікації DTC з польових розгортань:

ΔT холодної плити: 12–15°C при повному навантаженні (температури переходу GPU 83–87°C)
Перепад тиску: 2,1 бар через повну петлю з 30% пропіленгліколем
Розподіл потоку: ±3% відхилення через усі 72 холодні плити GPU
Швидкість витоку:

Критична інформація: Мережа подачі живлення Blackwell Ultra демонструє перехідні процеси в масштабі мікросекунд, досягаючи 1,4 разів потужності в стабільному стані під час синхронізації градієнта. Промислова практика рекомендує розрахунок охолодження на 110% від номінального TDP для обробки цих термічних сплесків без дроселювання GPU.

4. Мережева структура: керування NVLink 5.0 та покращеним зв'язком

Кожен GB300 NVL72 містить 72 GPU Blackwell Ultra з NVLink 5.0, забезпечуючи пропускну здатність 1,8 ТБ/с на GPU і загальну пропускну здатність NVLink 130 ТБ/с по всій системі. NVLink п'ятого покоління працює зі швидкістю сигналізації 200 Гбіт/с на лінк, з 18 лінками на GPU. Дев'ять чіпів NVSwitch маршрутизують цей трафік з затримкою комутатора 300 наносекунд і підтримують схеми зв'язку GPU-до-GPU для 576 пристроїв.

Міжстійкова зв'язність тепер включає SuperNIC ConnectX-8, що забезпечують мережеву зв'язність 800 Гб/с на GPU (вдвічі більше, ніж 400 Гб/с попереднього покоління), підтримуючи як платформи NVIDIA Quantum-X800 InfiniBand, так і Spectrum-X Ethernet.

Архітектура кабелювання:

Внутрішньостійкова: 1728 мідних кабелів Twinax (100-ом диференційний імпеданс,
Міжстійкова: 90 портів QSFP112 через трансівери 800G по OM4 MMF
Сховище/керування: 18 DPU Bluefield‑3 з подвійними лінками 800G кожен

Польові вимірювання:

Оптичний бюджет: 1,5 дБ бюджет втрат вставки на відрізках 150м OM4
Продуктивність BER:
Щільність роз'ємів: 1908 закінчень на стійку (включаючи живлення)

Найкращі практики включають відправлення попередньо закінчених 144-волоконних магістральних збірок з APC полірувкою та перевірку кожного роз'єму тестуванням втрат вставки/зворотних втрат за стандартами TIA-568. Досвідчені двоосібні команди можуть завершити установку волокна GB300 NVL72 в середньому за 2,8 години—порівняно з 7,5 годинами, коли техніки будують кабелі на місці.

Інформація про цілісність сигналу: NVLink‑5 працює із сигналізацією 25 GBd PAM‑4. Типові установки підтримують бюджет втрат вставки 2,1 дБ на з'єднання Twinax і

5. Перевірений у польових умовах контрольний список розгортання

Структурні вимоги:

Навантаження на підлогу: сертифікувати ≥21 кН/м² (~440 psf) для розподіленого навантаження; розраховано з 1360 кг стійки на 0,64 м² площі. Примітка: NVIDIA не публікує офіційних специфікацій навантаження на підлогу—перевірте з інженером-конструктором для вашої конкретної установки.
Сейсмічне кріплення: Установки в зоні 4 потребують додаткового X-кріплення згідно з IBC 2021
Віброізоляція:

Інфраструктура живлення:

Подвійні канали 415V, по 160A кожен, з моніторингом гілкових ланцюгів Schneider PM8000
Розрахунок ДБЖ: 150 кВА на стійку (125% запас безпеки) з онлайн топологією подвійного перетворення
Заземлення: Ізольоване заземлення обладнання з

Специфікації охолодження:

Якість охолоджувача:
Заміна фільтрів: 5 мкм плісировані кожні 1000 годин, 1 мкм фінальні кожні 2000 годин
Виявлення витоків: Датчики провідної рідини на всіх фітингах QDC з чутливістю 0,1 мл

Інвентар запасних частин:

Один піддон NVSwitch (час поставки: 6 тижнів)
Два насосні картриджі CDU (MTBF: 8760 годин)
20 трансіверів QSFP112 (частота польових відмов: 0,02% щорічно)
Аварійний матеріал теплового інтерфейсу (Honeywell PTM7950, 5г тюбики)

SLA віддаленого обслуговування: 4-годинне реагування на місці стає галузевим стандартом—провідні партнери з розгортання підтримують цю мету в кількох країнах з >99% часу безвідмовної роботи.

6. Характеристика продуктивності під виробничими навантаженнями

Бенчмарки міркувань ШІ (з ранніх звітів розгортання):

Модель DeepSeek R1-671B: До 1000 токенів/секунду стабільної пропускної здатності
Модель GPT‑3 175B параметрів: 847 токенів/секунду/GPU в середньому
Stable Diffusion 2.1: 14,2 зображень/секунду при роздільності 1024×1024
Навчання ResNet‑50 ImageNet: 2340 зразків/секунду стабільної пропускної здатності

Масштабування енергоефективності:

Використання однієї стійки: 1,42 GFLOPS/Вт при 95% використанні GPU
10-стійковий кластер: 1,38 GFLOPS/Вт (накладні витрати охолодження знижують ефективність)
Потужність мережі в режимі очікування: 3,2 кВт на стійку (NVSwitch + трансівери)

Покращення продуктивності міркувань ШІ: GB300 NVL72 забезпечує 10x підвищення токенів на секунду на користувача та 5x покращення TPS на мегават порівняно з Hopper, що дає комбіноване потенційне збільшення продуктивності фабрики ШІ у 50x.

Ефекти термічного циклування: Після 2000 годин виробничої роботи ранні розгортання повідомляють про 0,3% зниження продуктивності через виливання матеріалу термічного інтерфейсу. Планова заміна TIM через 18-місячні інтервали підтримує пікову продуктивність.

7. Аналіз TCO хмари проти власного розгортання

Lambda пропонує GPU B200 від $2,99 за GPU-годину з багаторічними зобов'язаннями (Lambda 2025). Фінансове моделювання, що включає реальні витрати на об'єкти з галузевих розгортань, показує:

Розбивка витрат на стійку за 36 місяців:

CapEx обладнання: $3,7-4,0M (включаючи запасні частини та інструменти) для GB300 NVL72
Електроенергія об'єкта: $310K @ $0,08/кВт·год з 85% середнім використанням
Інфраструктура охолодження: $180K (CDU, сантехніка, управління)
Операційний персонал: $240K (0,25 FTE повна вартість навантаження)
Загалом: $4,43-4,73M проти $4,7M хмарного еквіваленту

Беззбиток настає при 67% середньому коефіцієнті використання протягом 18 місяців, враховуючи амортизацію, фінансування та альтернативні витрати. Корпоративні CFO отримують передбачуваність бюджету, уникаючи прив'язки до хмарного постачальника.

8. GB300 проти GB200: розуміння Blackwell Ultra

[caption id="" align="alignnone" width="1920"] Зображено попередню генерацію GB200 [/caption]

GB300 NVL72 (Blackwell Ultra) представляє значну еволюцію від оригінального GB200 NVL72. Ключові покращення включають на 1,5x більшу продуктивність обчислень ШІ, 288 ГБ пам'яті HBM3e на GPU (проти 192 ГБ) та посилений фокус на інференсі масштабування часу тестування для додатків міркувань ШІ.

Нова архітектура забезпечує 10x підвищення токенів на секунду на користувача та 5x покращення TPS на мегават порівняно з Hopper, що дає комбіноване потенційне збільшення продукції фабрики ШІ у 50x. Це робить GB300 NVL72 спеціально оптимізованим для наступної ери міркувань ШІ, де моделі як DeepSeek R1 потребують суттєво більше обчислень під час інференсу для покращення точності.

Часова лінія доступності: Системи GB300 NVL72 очікуються від партнерів у другій половині 2025 року, порівняно з GB200 NVL72, який доступний зараз.

9. Чому Fortune 500 обирають спеціалізованих партнерів розгортання

Провідні спеціалісти з розгортання встановили понад 100000 GPU в більш ніж 850 центрах обробки даних, підтримуючи 4-годинні глобальні угоди про рівень сервісу (SLA) через розширені команди польових інженерів. Галузь запустила в експлуатацію тисячі миль волокна та кілька мегават спеціальної інфраструктури ШІ з 2022 року.

Останні метрики розгортання:

Середній час підготовки об'єкта: 6,2 тижні (знизилось з 11 тижнів середнього по галузі)
Частота успіху з першого разу: 97,3% для тестування включення живлення
Проблеми після розгортання: 0,08% частота відмов компонентів у перші 90 днів

OEM відправляють обладнання; спеціалізовані партнери перетворюють обладнання на виробничу інфраструктуру. Залучення досвідчених команд розгортання під час етапів планування може скоротити терміни на 45% через використання префабрикованих жгутів живлення, попередньо встановлених петель охолодження та заводських волоконних пучків.

Підсумкова думка

Шафа GB300 NVL72 представляє фундаментальний зсув від "серверів у стійках" до "центрів обробки даних у шафах". Фізика невблаганна: щільність обчислень 120 кВт вимагає точності в кожному з'єднанні живлення, петлі охолодження та закінченні волокна. Опануйте інженерні основи в День 0, і Blackwell Ultra забезпечуватиме трансформаційну продуктивність міркувань ШІ роками.

Готові обговорити технічні деталі, які ми не змогли помістити в 2000 слів? Наші інженери з розгортання процвітають у таких розмовах—запланируйте технічне глибоке занурення на solutions@introl.com.

Посилання

Dell Technologies. 2024. "Dell AI Factory Transforms Data Centers with Advanced Cooling, High-Density Compute and AI Storage Innovations." Прес-реліз, 15 жовтня. Dell Technologies Newsroom

Introl. 2025. "GPU Infrastructure Deployments and Global Field Engineers." Доступ 23 червня. introl.com

Lambda. 2025. "AI Cloud Pricing - NVIDIA B200 Clusters." Доступ 23 червня. Lambda Labs Pricing

NVIDIA. 2025. "GB300 NVL72 Product Page." Доступ 23 червня. NVIDIA Data Center

NVIDIA. 2025. "NVIDIA Blackwell Ultra AI Factory Platform Paves Way for Age of AI Reasoning." Прес-реліз, 18 березня. NVIDIA News

Supermicro. 2025. "NVIDIA GB300 NVL72 SuperCluster Datasheet." Лютий. Supermicro Datasheet

The Register. 2024. Mann, Tobias. "One Rack, 120 kW of Compute: A Closer Look at NVIDIA's DGX GB200 NVL72 Beast." 21 березня. The Register

Виправлення (9 січня 2026): Специфікація навантаження на підлогу виправлена з "14 кН/м² (2030 psf)" на "21 кН/м² (~440 psf)" — оригінал містив помилку конвертації одиниць. Також уточнено, що це розрахункове значення на основі ваги стійки та площі, а не офіційна специфікація NVIDIA. Імпеданс Twinax виправлено з 75-ом на 100-ом диференційний. Дякуємо Diana за виявлення помилки навантаження на підлогу.

1. Розбір стійки

2. Живлення звіра: подача електроенергії

3. Керівництво з охолодження: реальність теплотехніки

4. Мережева структура: керування NVLink 5.0 та покращеним зв'язком

5. Перевірений у польових умовах контрольний список розгортання

6. Характеристика продуктивності під виробничими навантаженнями

7. Аналіз TCO хмари проти власного розгортання

8. GB300 проти GB200: розуміння Blackwell Ultra

9. Чому Fortune 500 обирають спеціалізованих партнерів розгортання

Підсумкова думка

Посилання

You Might Also Like

Трамп відкриває експорт H200 до Китаю з 25% надбавкою

DeepSeek mHC: архітектурне виправлення, що може відкрити шля...

Суперцикл пам'яті для ШІ: як HBM стала найкритичнішим вузьки...

Запросити пропозицію_

Запит отримано_