Вибір колокейшн-провайдера для ШІ: сертифіковані DGX-Ready дата-центри та вимоги до стійок на 120 кВт

Неправильний вибір колокейшн-провайдера призвів до втрати $8 млн на заблокованих GPU. Лише 47 дата-центрів у світі відповідають стандартам NVIDIA DGX-Ready для стійок на 120 кВт. Посібник з вибору.

Вибір колокейшн-провайдера для ШІ: сертифіковані DGX-Ready дата-центри та вимоги до стійок на 120 кВт

Вибір колокейшн-провайдера для ШІ: сертифіковані DGX-Ready дата-центри та вимоги до стійок на 120 кВт

Оновлено 8 грудня 2025 року

Оновлення за грудень 2025 року: Стійка на 120 кВт тепер є базовим стандартом, а не перспективною метою. NVIDIA GB200 NVL72 працює на 120 кВт, а Vera Rubin NVL144 орієнтується на 600 кВт на стійку до 2026 року. Впровадження рідинного охолодження досягло 22% дата-центрів (ринок: $5,52 млрд→$15,75 млрд до 2030 року). Пряме охолодження чипів займає 47% частки ринку. Colovore залучила $925 млн для об'єктів на 200 кВт/стійка. Вимоги DGX-Ready еволюціонують для систем Blackwell, і провайдери поспішають підтримувати щільності 150-200 кВт як проміжний етап до інфраструктури Vera Rubin на 600 кВт.

Вибір неправильного колокейшн-провайдера для ШІ-інфраструктури призводить до термічних відключень, збоїв живлення та втрати $8 мільйонів на заблокованих GPU-інвестиціях — саме це сталося з однією компанією зі списку Fortune 500, коли «готовий до ШІ» дата-центр їхнього провайдера не зміг охолодити стійки на 80 кВт.¹ Програма NVIDIA DGX-Ready сертифікує лише 47 об'єктів у світі, які відповідають екстремальним вимогам сучасних GPU-розгортань, створюючи ринок продавця, де кваліфіковані провайдери встановлюють тарифи втричі вищі за звичайні та мають черги очікування на 18 місяців.² Розрив між маркетинговими заявами та реальними можливостями змушує організації оцінювати десятки технічних параметрів — від корекції коефіцієнта потужності до специфікацій сейсмічного кріплення — водночас конкуруючи за обмежені потужності в дата-центрах, які справді підтримують щільність стійок 120 кВт.

Ландшафт колокейшн-послуг розділяється на три рівні: традиційні провайдери, що ледве справляються зі стійками на 10 кВт; перехідні об'єкти, що з труднощами обслуговують 40 кВт; та елітні оператори, які досягають 120+ кВт завдяки рідинному охолодженню та потужній електричній інфраструктурі.³ Кожен NVIDIA DGX H100 SuperPOD вимагає мінімум 35 кВт на стійку, а оптимальні конфігурації досягають 120 кВт при повному завантаженні мережевим та storage-обладнанням.⁴ Організації виявляють, що 90% колокейшн-об'єктів просто не можуть підтримувати сучасну ШІ-інфраструктуру незалежно від маркетингових заяв, що змушує мігрувати до спеціалізованих дата-центрів або проводити дорогу модернізацію, яка затримує розгортання на 12-18 місяців.

Електрична інфраструктура визначає фундаментальне обмеження

Сучасний ШІ-колокейшн вимагає щільності потужності, яку традиційні об'єкти фізично не можуть забезпечити. Одна стійка на 120 кВт потребує 600 ампер при трифазному живленні 208 В, що вимагає кількох ланцюгів на 225 А на стійку.⁵ Електрична інфраструктура повинна витримувати не лише стабільні навантаження, а й варіації коефіцієнта потужності від GPU-навантажень, які коливаються між 0,95 та 0,85 залежно від інтенсивності обчислень. Об'єкти, спроектовані для стабільних ІТ-навантажень, зазнають гармонічних спотворень, коли GPU переключаються між різними режимами роботи.

Резервування живлення стає експоненціально складнішим при високих щільностях. Традиційне резервування 2N подвоює витрати на інфраструктуру, тоді як конфігурації N+1 ризикують каскадними збоями під час технічного обслуговування. Сертифіковані DGX-Ready об'єкти впроваджують архітектури 2N+1 з ізольованими лініями живлення, що запобігають єдиним точкам відмови.⁶ Кожен шлях живлення включає онлайн-системи безперебійного живлення з подвійним перетворенням, що підтримують якість електроенергії в межах 2% відхилення напруги та 3% загальних гармонічних спотворень. Резервне батарейне живлення повинно підтримувати повне навантаження мінімум 15 хвилин, що вимагає 2400 кВт·год ємності батарей для ШІ-розгортання на 10 МВт.

Доступність електроенергії від мережі обмежує вибір локації більше, ніж будь-який інший фактор. Основні колокейшн-ринки, такі як Північна Вірджинія та Кремнієва долина, стикаються з мораторіями на електроенергію, і нові потужності будуть недоступні до 2027 року.⁷ Вторинні ринки, що пропонують негайний доступ до електроенергії, встановлюють преміальні ціни попри гіршу зв'язність. Об'єкти у Фініксі з доступною електроенергією беруть $500 за кВт щомісяця порівняно з $180 у Вірджинії з обмеженим живленням.⁸ Організації повинні балансувати доступність електроенергії з вимогами до затримки та операційними міркуваннями.

Потужність охолодження визначає реальну щільність порівняно з заявленою

Маркетингові заяви про «підтримку високої щільності» розсипаються при зіткненні з реальними тепловими навантаженнями. Стійка на 120 кВт генерує 409 000 BTU/год тепла — еквівалент 34 побутових обігрівачів, що працюють безперервно.⁹ Повітряне охолодження досягає фізичних обмежень приблизно на 30 кВт на стійку навіть з ізоляцією гарячих коридорів та оптимізованим повітряним потоком. Досягнення щільності 120 кВт вимагає рідинного охолодження — або теплообмінників на задніх дверцятах, або рішень прямого охолодження чипів.

Колокейшн-провайдери підходять до рідинного охолодження з різним рівнем складності. Базові реалізації забезпечують охолоджену воду для обладнання охолодження, що постачається клієнтом, перекладаючи складність на орендарів. Просунуті об'єкти пропонують охолодження як послугу з інтегрованими CDU, колекторами та моніторингом. Сертифікація NVIDIA DGX-Ready вимагає температури води на подачі 25°C з потужністю охолодження мінімум 500 кВт на стійку.¹⁰ Провайдери повинні демонструвати резервування охолодження N+1 з автоматичним перемиканням, що завершується протягом 30 секунд.

Години безкоштовного охолодження суттєво впливають на операційні витрати. Об'єкти в північному кліматі досягають 6000+ годин безкоштовного охолодження на рік, зменшуючи витрати на $120 000 за МВт порівняно з механічним охолодженням.¹¹ Однак холодний клімат створює будівельні труднощі та може мати обмежену кількість кваліфікованої робочої сили. Оптимальний баланс залежить від конкретних патернів робочих навантажень та бізнес-вимог. Цілодобові навантаження інференсу отримують більше користі від безкоштовного охолодження, ніж пакетні завдання навчання, які можна перенести на прохолодніші періоди.

Мережева зв'язність забезпечує розподілені ШІ-навантаження

ШІ-колокейшн вимагає безпрецедентної пропускної здатності та різноманітності мережі. Навантаження навчання генерують 400 Гбіт/с постійного трафіку між розподіленими вузлами, тоді як обслуговування інференсу вимагає субмілісекундної затримки до кінцевих користувачів.¹² Сертифіковані DGX-Ready об'єкти забезпечують мінімум 4x400GbE підключення на стійку з субмікросекундною затримкою всередині об'єкта. Опції крос-конектів повинні підтримувати одночасно InfiniBand та Ethernet-фабрики.

Різноманітність операторів запобігає мережевим розділенням, які фрагментують завдання розподіленого навчання. Елітні об'єкти підтримують підключення до 20+ операторів з диверсифікованими оптоволоконними маршрутами.¹³ Хмарні on-ramp до AWS Direct Connect, Azure ExpressRoute та Google Cloud Interconnect забезпечують гібридні розгортання. Виділені хвильові канали між географічно розподіленими об'єктами підтримують аварійне відновлення та міграцію навантажень. Щомісячна вартість комплексної зв'язності досягає $50 000 для розгортання на 10 стійок.

Домовленості про інтернет-пірінг драматично впливають на витрати на обслуговування інференсу. Об'єкти з розвиненим пірінгом економлять 60-80% на витратах на пропускну здатність порівняно з чистими транзитними угодами.¹⁴ Основні пірінгові точки обміну, такі як Equinix IX, забезпечують прямий доступ до тисяч мереж. Мережі доставки контенту кешують часто використовувані моделі на периферійних локаціях. Інтелектуальна маршрутизація оптимізує вибір шляху на основі параметрів затримки та вартості.

Безпека та відповідність формують вибір провайдера

ШІ-інфраструктура містить цінну інтелектуальну власність, що вимагає комплексної безпеки. Сертифіковані DGX-Ready об'єкти впроваджують архітектури глибокого захисту з кількома рівнями безпеки.¹⁵ Периметрова безпека включає протитаранні бар'єри, шлюзові входи та цілодобову озброєну охорону. Біометричний контроль доступу обмежує вхід до серверних залів. Окремі клітки забезпечують фізичну ізоляцію з дахом, що запобігає доступу через верх. Камерні системи зберігають записи 90 днів з детекцією аномалій на базі ШІ.

Сертифікати відповідності підтверджують впровадження заходів безпеки. Атестація SOC 2 Type II підтверджує ефективність контролів з часом. Сертифікація ISO 27001 демонструє систематичне управління безпекою. Відповідність HIPAA дозволяє ШІ-навантаження у сфері охорони здоров'я. Фінансові послуги вимагають специфічних сертифікацій, таких як PCI DSS або FISMA, залежно від типів навантажень. Кожна сертифікація додає операційні накладні витрати, але розширює доступні ринки.

Безпека ланцюга постачання набуває важливості в міру зростання вартості GPU. Об'єкти повинні перевіряти автентичність обладнання та підтримувати ланцюг зберігання. Послуги безпечного знищення запобігають витоку даних з виведеного з експлуатації обладнання. Деякі провайдери пропонують довірені середовища виконання з апаратними модулями безпеки. Додаткові заходи безпеки додають 10-15% до базових витрат на колокейшн, але запобігають катастрофічним порушенням.

Introl оцінює колокейшн-провайдерів у нашій глобальній зоні покриття, маючи досвід розгортання GPU-інфраструктури в понад 100 об'єктах по всьому світу.¹⁶ Наша система оцінки аналізує 127 технічних параметрів, ідентифікуючи провайдерів, які справді здатні підтримувати високощільні ШІ-навантаження, на відміну від тих, хто лише заявляє про такі можливості.

Географічний розподіл впливає на затримку та витрати

Географія колокейшн впливає на ШІ-розгортання через кілька векторів. Навантаження навчання толерують вищу затримку, дозволяючи розміщення в локаціях з низькою вартістю. Обслуговування інференсу вимагає близькості до користувачів, що потребує географічного розподілу. Регуляції суверенітету даних вимагають обробки в межах країни для певних наборів даних. Ризик стихійних лих впливає на страхові витрати та планування безперервності бізнесу.

Первинні ринки (Північна Вірджинія, Кремнієва долина, Даллас) пропонують кращу зв'язність, але стикаються з обмеженнями потужності. Витрати на колокейшн досягають $600 за кВт щомісяця з обов'язковими 24-місячними контрактами.¹⁷ Вторинні ринки (Фінікс, Атланта, Чикаго) забезпечують доступні потужності за $300-400 за кВт. Третинні ринки (Солт-Лейк-Сіті, Омаха, Колумбус) пропонують ціни $200 за кВт, але обмежену підтримку екосистеми.

Міжнародні аспекти ускладнюють вибір провайдера. Європейські об'єкти відповідають GDPR, але коштують на 40% дорожче за американські еквіваленти. Азійські об'єкти пропонують близькість до виробництва, але стикаються з регуляторною невизначеністю. Багатонаціональні розгортання повинні орієнтуватися в різних стандартах живлення, підходах до охолодження та операційних практиках. Валютні коливання додають 5-10% невизначеності до міжнародних контрактів.

Структура контрактів та комерційні умови

Колокейшн-контракти для ШІ-інфраструктури суттєво відрізняються від традиційних угод:

Зобов'язання з живлення: Контракти визначають гарантоване споживання електроенергії з умовами «бери або плати». Перевищення тягне штрафи $500-1000 за кВт.¹⁸ Провайдери вимагають 80% використання потужності протягом 6 місяців. Невикористане живлення не може бути повернуто після виділення. Резервування на зростання забезпечує майбутню потужність за поточними цінами.

SLA на охолодження: Гарантії температури та вологості запобігають тепловому тротлінгу. Температура води на подачі повинна залишатися в межах 1°C від специфікації. Швидкості потоку гарантують мінімум GPM на стійку. Час реагування на збої охолодження не може перевищувати 15 хвилин. Штрафи досягають $10 000 за годину за порушення SLA.

Умови гнучкості: ШІ-навантаження вимагають безпрецедентної гнучкості. Права на розширення дозволяють зростання без релокації. Права на скорочення дозволяють зменшення під час ринкових спадів. Клаузули оновлення технологій дозволяють модернізацію інфраструктури. Клаузули виходу надають опції припинення з визначеними штрафами.

Моделі ціноутворення: Комплексне ціноутворення спрощує бюджетування, але зменшує гнучкість. Ціноутворення за лічильником узгоджує витрати з використанням, але створює невизначеність. Ціноутворення на основі потужності сприяє ефективним операціям. Ціноутворення на основі простору штрафує високощільні розгортання. Гібридні моделі балансують передбачуваність з інцентивами оптимізації.

Система оцінки для систематичного вибору

Систематична оцінка забезпечує оптимальний вибір провайдера:

Технічна оцінка (40% ваги): - Можливість щільності потужності (макс. кВт на стійку) - Технологія та потужність охолодження - Опції мережевої зв'язності - Готовність до рідинного охолодження - Рівні резервування інфраструктури

Комерційна оцінка (25% ваги): - Загальна вартість за кВт включно з усіма комісіями - Умови гнучкості контракту - Штрафи та гарантії SLA - Опції для акомодації зростання - Метрики фінансової стабільності

Операційна оцінка (20% ваги): - Можливості remote hands - Швидкість провіжнінгу крос-конектів - Вікна та процедури технічного обслуговування - Час реагування на інциденти - Можливості клієнтського порталу

Стратегічна оцінка (15% ваги): - Узгодження географічного покриття - Якість партнерств екосистеми - Узгодження інноваційної дорожньої карти - Ініціативи сталого розвитку - Культурна відповідність

Реальні приклади

[Контент скорочено для перекладу]

Запросити пропозицію_

Розкажіть про ваш проект і ми відповімо протягом 72 годин.

> ПЕРЕДАЧА_ЗАВЕРШЕНА

Запит отримано_

Дякуємо за ваш запит. Наша команда розгляне його та відповість протягом 72 годин.

В ЧЕРЗІ НА ОБРОБКУ