AI向けColocation事業者選定:DGX-Ready認定施設と120kWラック要件
2025年12月8日更新
2025年12月更新: 120kWラックは今や基準であり、目標ではありません。NVIDIA GB200 NVL72は120kWで動作し、Vera Rubin NVL144は2026年までにラックあたり600kWを目標としています。液冷の採用率はデータセンターの22%に達し(市場:55.2億ドル→2030年までに157.5億ドル)、Direct-to-chipは47%の市場シェアを占めています。Colovoreは200kW/ラック施設のために9.25億ドルを確保しました。DGX-Readyの要件はBlackwellシステムに合わせて進化しており、事業者は600kW Vera Rubinインフラへの足掛かりとして150-200kW密度のサポートを急いでいます。
AIインフラに間違ったcolocation事業者を選択すると、熱シャットダウン、電力障害、そして800万ドルのGPU投資の座礁につながります。これは、事業者の「AI対応」施設が実際には80kWラックを冷却できなかったとき、Fortune 500企業が発見したことです。¹ NVIDIAのDGX-Readyプログラムは、現代のGPUデプロイメントの極端な要件を満たすグローバルで47施設のみを認定しており、これにより有資格事業者が3倍のプレミアム料金を要求し、18か月の待機リストを維持する売り手市場が形成されています。² マーケティングの主張と実際の能力のギャップにより、組織は電力力率補正から耐震ブレーシング仕様まで、数十の技術パラメータを評価せざるを得ず、同時に真に120kWラック密度をサポートする施設の希少なキャパシティを競い合っています。
Colocation市場は3つの層に分化しています:10kWラックで苦戦する従来の事業者、40kWを困難ながら管理する移行期施設、そして液冷と大規模電力インフラを通じて120kW+を達成するエリート事業者です。³ 各NVIDIA DGX H100 SuperPODはラックあたり最低35kWを要求し、ネットワーキングとストレージを完全に搭載した最適構成では120kWに到達します。⁴ 組織は、colocation施設の90%がマーケティングの主張にかかわらず現代のAIインフラを単純にサポートできないことを発見し、専用施設への移行または12-18か月デプロイメントを遅延させる高額な改修を強いられています。
電力インフラが根本的な制約を定義
現代のAI colocationは、従来の施設が物理的に提供できない電力密度を要求します。単一の120kWラックは208V三相電力で600アンペアを必要とし、ラックあたり複数の225A回路を必要とします。⁵ 電気インフラは定常負荷だけでなく、計算集約度が変化するにつれて0.95と0.85の間で変動するGPUワークロードからの力率変動も処理しなければなりません。定常IT負荷向けに設計された施設は、GPUが異なる動作モードを循環するときに高調波歪を経験します。
電力冗長性は高密度で指数的に複雑になります。従来の2N冗長性はインフラコストを倍にし、N+1構成はメンテナンス中のカスケード障害のリスクがあります。DGX-Ready施設は、単一障害点を防ぐ分離電力系統を持つ2N+1アーキテクチャを実装します。⁶ 各電力経路には、2%の電圧変動と3%の全高調波歪内で電力品質を維持するオンライン二重変換UPSシステムが含まれます。バッテリーバックアップは最低15分間のフル負荷を持続させる必要があり、10MW AIデプロイメントには2,400kWhのバッテリー容量が必要です。
ユーティリティ電力の可用性は、他のどの要因よりもサイト選択を制約します。北バージニアとシリコンバレーなどの主要colocation市場は電力モラトリアムに直面し、2027年まで新しい容量が利用できません。⁷ 即座の電力アクセスを提供する二次市場は、劣った接続性にもかかわらずプレミアム価格を要求します。利用可能な電力を持つフェニックス施設は、電力制約のあるバージニアの180ドルに対して月額kWあたり500ドルを請求します。⁸ 組織は電力可用性とレイテンシ要件および運用上の考慮事項のバランスを取る必要があります。
冷却能力が実際の対宣伝された密度を決定
「高密度サポート」のマーケティング主張は、実際の熱負荷に直面すると崩壊します。120kWラックは時間あたり409,000 BTUの熱を生成し、これは34台の住宅用炉が連続稼働することに相当します。⁹ 空冷は、ホットアイル封じ込めと最適化された気流でさえ、ラックあたり約30kWで物理的限界に達します。120kW密度の達成には、リアドア熱交換器またはdirect-to-chipソリューションのいずれかの液冷が必要です。
Colocation事業者は様々な洗練度で液冷にアプローチします。基本的な実装は、顧客提供の冷却装置に冷水を提供し、複雑さをテナントに移します。高度な施設は統合されたCDU、マニホールド、監視を持つcooling-as-a-serviceを提供します。NVIDIA DGX-Ready認定には、ラックあたり最低500kWの冷却能力を持つ25°C供給水温が必要です。¹⁰ 事業者は30秒以内に完了する自動フェイルオーバーを持つN+1冷却冗長性を実証する必要があります。
フリークーリング時間は運用コストに大きく影響します。北方気候の施設は年間6,000時間以上のフリークーリングを達成し、機械冷却と比較してMWあたり120,000ドルのコストを削減します。¹¹ しかし、寒冷地は建設上の課題を提示し、熟練労働力に欠ける可能性があります。最適なバランスは特定のワークロードパターンとビジネス要件に依存します。24/7推論ワークロードは、より涼しい期間にシフトできるバッチトレーニングジョブよりもフリークーリングの恩恵を受けます。
ネットワーク接続が分散AIワークロードを可能にする
AI colocationは前例のないネットワーク容量と多様性を必要とします。トレーニングワークロードは分散ノード間で400Gbpsの持続トラフィックを生成し、推論サービングはエンドユーザーへのサブミリ秒レイテンシを要求します。¹² DGX-Ready施設は施設内でサブマイクロ秒レイテンシを持つラックあたり最低4x400GbE接続を提供します。クロスコネクトオプションはInfiniBandとEthernetファブリックを同時にサポートする必要があります。
キャリア多様性は分散トレーニングジョブを断片化するネットワーク分割を防ぎます。エリート施設は多様なファイバーパスを持つ20以上のキャリアへの接続を維持します。¹³ AWS Direct Connect、Azure ExpressRoute、Google Cloud Interconnectへのクラウドオンランプはハイブリッドデプロイメントを可能にします。地理的に分散した施設間の専用波長は災害復旧とワークロード移行をサポートします。10ラックデプロイメントの包括的接続の月額コストは50,000ドルに達します。
インターネットピアリング協定は推論サービングコストに劇的に影響します。堅実なピアリングを持つ施設は純粋なトランジット協定と比較して帯域幅コストを60-80%節約します。¹⁴ Equinix IXのような主要ピアリングエクスチェンジは数千のネットワークへの直接アクセスを提供します。コンテンツ配信ネットワークは頻繁にアクセスされるモデルをエッジ位置にキャッシュします。スマートルーティングはレイテンシとコストパラメータに基づいてパス選択を最適化します。
セキュリティとコンプライアンスが事業者選択を形成
AIインフラには包括的セキュリティを必要とする貴重な知的財産が含まれます。DGX-Ready施設は複数のセキュリティ層を持つ多層防御アーキテクチャを実装します。¹⁵ 境界セキュリティには耐衝撃バリア、マントラップエントリー、24/7武装警備が含まれます。バイオメトリクスアクセス制御はデータホール入場を制限します。個別ケージは壁越えアクセスを防ぐ屋根カバーで物理的分離を提供します。カメラシステムはAI駆動異常検出で90日間の記録を維持します。
コンプライアンス認定はセキュリティ実装を検証します。SOC 2 Type II証明は時間をかけた制御効果を確認します。ISO 27001認定は体系的セキュリティ管理を実証します。HIPAAコンプライアンスはヘルスケアAIワークロードを可能にします。金融サービスはワークロードタイプに応じてPCI DSSまたはFISMAなどの特定認定を必要とします。各認定は運用オーバーヘッドを追加しますが、アドレス可能市場を拡大します。
サプライチェーンセキュリティはGPU価値が増加するにつれて重要性を増します。施設はハードウェア真正性を検証し、管理の連鎖を維持する必要があります。安全な破棄サービスは廃止装置からのデータ漏洩を防ぎます。一部の事業者はハードウェアセキュリティモジュール付き信頼実行環境を提供します。追加セキュリティ措置は基本colocationコストに10-15%を追加しますが、破滅的違反を防ぎます。
Introlはグローバルカバレッジエリア全体でcolocation事業者を評価し、世界中の100以上の施設にGPUインフラをデプロイしてきました。¹⁶ 当社の評価フレームワークは127の技術パラメータを評価し、高密度AIワークロードを真にサポートできる事業者と単に能力を主張する事業者を識別します。
地理的分散がレイテンシとコストに影響
Colocation地理は複数のベクトルを通じてAIデプロイメントに影響します。トレーニングワークロードはより高いレイテンシを許容し、低コスト場所での配置を可能にします。推論サービングはユーザーへの近接を要求し、地理的分散を必要とします。データ主権規制は特定のデータセットの国内処理を義務付けます。自然災害リスクは保険コストと事業継続計画に影響します。
主要市場(北バージニア、シリコンバレー、ダラス)は優れた接続性を提供しますが、容量制約に直面します。Colocationコストは24か月コミットメントが必要で月額kWあたり600ドルに達します。¹⁷ 二次市場(フェニックス、アトランタ、シカゴ)はkWあたり300-400ドルで利用可能容量を提供します。三次市場(ソルトレイクシティ、オマハ、コロンバス)はkWあたり200ドルの価格を提供しますが、限定されたエコシステムサポートです。
国際的考慮事項は事業者選択を複雑にします。ヨーロッパ施設はGDPRに準拠しますが、米国同等品より40%高コストです。アジア施設は製造への近接を提供しますが、規制不確実性に直面します。多国籍デプロイメントは様々な電力標準、冷却アプローチ、運用慣行をナビゲートする必要があります。通貨変動は国際契約に5-10%の不確実性を追加します。
契約構造と商業条件
AIインフラのcolocation契約は従来の取り決めと大幅に異なります:
電力コミットメント:契約は取るか支払うかの条項で約束電力消費を指定します。超過使用はkWあたり500-1,000ドルの罰金を招きます。¹⁸ 事業者は6か月以内に80%の電力使用率を要求します。未使用電力は一度割り当てられると回収できません。成長予約は現在価格で将来容量を確保します。
冷却SLA:温度と湿度保証は熱スロットリングを防ぎます。供給水温は仕様の1°C以内に留まる必要があります。流量はラックあたり最低GPMを保証します。冷却障害の応答時間は15分を超えてはなりません。SLA違反の罰金は1時間あたり10,000ドルに達します。
柔軟性条項:AIワークロードは前例のない柔軟性を必要とします。拡張権は再配置なしの成長を可能にします。縮小権は市場下降期のダウンサイジングを許可します。技術リフレッシュ条項はインフラ更新を許可します。退場条項は定義された罰金で終了オプションを提供します。
価格モデル:オールインクルーシブ価格は予算作成を簡素化しますが、柔軟性を減らします。従量制価格はコストと使用量を整合させますが、不確実性を生み出します。電力ベース価格は効率的運用を優遇します。スペースベース価格は高密度デプロイメントにペナルティを課します。ハイブリッドモデルは予測可能性と最適化インセンティブのバランスを取ります。
体系的選択のための評価フレームワーク
体系的評価は最適な事業者選択を保証します:
技術スコアリング(40%重み): - 電力密度能力(ラックあたり最大kW) - 冷却技術と容量 - ネットワーク接続オプション - 液冷準備状況 - インフラ冗長レベル
商業スコアリング(25%重み): - すべての手数料を含むkWあたり総コスト - 契約柔軟性条項 - SLA罰金と保証 - 成長対応オプション - 財務安定性指標
運用スコアリング(20%重み): - リモートハンド能力 - クロスコネクトプロビジョニング速度 - メンテナンスウィンドウと手順 - インシデント応答時間 - 顧客ポータル能力
戦略スコアリング(15%重み): - 地理的カバレッジ整合 - エコシステムパートナーシップ品質 - イノベーションロードマップ整合 - 持続可能性イニシアチブ - 文化的適合評価