AI向けUPSと配電:レジリエントな2N+1インフラストラクチャの設計

AI向けUPSと配電:レジリエントな2N+1インフラストラクチャの設計

AI向けUPSと配電:レジリエントな2N+1インフラストラクチャの設計

2025年12月8日更新

2025年12月アップデート: AIラックの電力密度は、GB200 NVL72により100〜130kWが標準となった。PDU要件はラックあたり100kWを超え、415V配電が必要。UPS効率はTCOの大部分を占める電力コストにおいて極めて重要。リチウムイオンUPSの採用が加速(設置面積40%削減)。高電流配電ではケーブルからバスバーへの移行が進む。GPU電力消費特性に対応した力率改善が必須に。

Metaのデータセンターで発生した47秒間の電源障害は、分散トレーニングを実行していた10,000台のGPUが同期を失い、3週間分のモデル進捗が破損したことで、6,500万ドルの損失をもたらした。現代のAIインフラストラクチャは、99.9999%を超える稼働率、つまり年間わずか31秒の停止時間しか許容されない電源信頼性を要求する。各H100 GPUが700Wを消費し、クラスタ全体で10MW以上を必要とする中、電源配電アーキテクチャは、組織が画期的なAI能力を達成するか、壊滅的な障害に見舞われるかを決定づける。この包括的ガイドでは、効率性とコストを最適化しながら、大規模なGPU投資を保護するUPSおよび配電システムの設計方法を解説する。

電源アーキテクチャの基礎

2N+1冗長アーキテクチャは、完全な冗長性にメンテナンス用の追加容量を組み合わせた、重要なAIインフラストラクチャのゴールドスタンダードを提供する。「2N」コンポーネントは、電力会社の引込口からGPUまで、2つの完全に独立した電源経路を提供し、どちらかの経路が完全に故障しても運用を継続できる。「+1」はメンテナンス時の同時作業用容量を追加し、冗長性を低下させることなく修理を可能にする。このアーキテクチャは99.9999%の可用性を達成し、ダウンタイムコストが1分あたり10万ドルを超えるワークロードには不可欠である。GoogleのTPUクラスタは2N+1アーキテクチャを実装し、100MWのインフラストラクチャ全体で年間わずか8秒の電源関連ダウンタイムしか経験していない。

AIインフラストラクチャにおける電力密度の課題は、従来のデータセンター要件をはるかに超えている。現代のGPUラックは40〜100kWを消費するのに対し、従来のIT機器は5〜10kWである。NVIDIAのDGX H100システムは、ノードあたり10.2kWを必要とし、ラックあたり8ノードでネットワーキングオーバーヘッドを加えると82kWを要求する。配電は、定常負荷とGPUブーストサイクル中の過渡的なスパイクの両方を処理する必要がある。MicrosoftのAzure AIインフラストラクチャは、415/240V三相電源に対応した専用PDU(配電ユニット)を展開し、電力変動に対する十分なヘッドルームを持ちながら、ラックあたり96kWを供給している。

ティア分類は、対応するインフラストラクチャ要件に基づいて信頼性レベルを定義する。Tier III施設はN+1冗長性を提供し、99.982%の可用性を達成する。Tier IV施設は2N冗長性を実装し、99.995%の可用性に到達する。しかし、AIワークロードは従来の定義を超える「Tier IV+」標準を要求することが多い。これらの強化された標準には、より高速な切替時間、より厳密な電圧調整、および優れた高調波フィルタリングが含まれる。OpenAIのトレーニングインフラストラクチャは、GPU固有の要件に対応したカスタム修正を加えたTier IV+標準を実装している。

負荷計算は、定格値を超えるGPU固有の特性を考慮する必要がある。GPU負荷は0.95〜0.98の力率を示すため、力率改善が重要になる。コールドスタート時の突入電流は、100〜200ミリ秒の間、動作電流の150%に達することがある。動的周波数スケーリングは、数秒以内に20%の電力変動を引き起こす。トレーニング中は通常すべてのGPUが同時に動作するため、需要率は1.0に近づく。正確な負荷モデリングにより、Anthropicでは適切なサイジングを通じて23件の電源インフラストラクチャ障害を防止した。

配電トポロジーは、信頼性と効率性の両方に影響する。放射状システムは、シンプルで費用対効果の高い配電を提供するが、単一障害点を作り出す。一次選択システムは、電源間の手動切替を可能にする。二次選択システムは切替を自動化するが、複雑さが増す。ネットワークシステムは、複数の経路を通じて最大の信頼性を提供する。Metaのインフラストラクチャは、自動切替を備えた二次選択システムを使用し、電力会社の障害時にサブサイクル切替を達成している。

UPSシステムの設計と選定

バッテリー技術の選定は、UPSの性能とライフサイクルコストに根本的な影響を与える。VRLA(制御弁式鉛蓄電池)バッテリーは、25°Cで3〜5年の寿命を持つ実績のある信頼性を提供する。リチウムイオンバッテリーは、10年の寿命、70%小さい設置面積、より高速な再充電を提供するが、初期コストは3倍である。ニッケル亜鉛バッテリーは、7年の寿命で性能とコストのバランスを取る。フライホイールは、短時間バックアップ用に最小限のメンテナンスで20年の寿命を提供する。Amazonのデータセンターはリチウムイオンの採用を増やしており、交換頻度の削減と効率向上により、VRLAとのTCOパリティを達成している。

ランタイム計算は、重要な負荷サポート要件に基づいてバッテリーサイズを決定する。AIインフラストラクチャは通常10〜15分のランタイムを必要とし、発電機の起動と同期を可能にする。バッテリー容量は経年劣化を考慮し、80%の寿命末期容量が標準である。温度ディレーティングにより、40°Cでは25°C定格と比較して容量が50%減少する。負荷増加に対する20%の予備容量が拡張に対応する。これらの要因により、初期バッテリー要件が2倍になることが多い。LinkedInのUPSシステムは、100%負荷で12分、75%負荷で18分のランタイムを提供し、発電機への切替に十分な時間を確保している。

モジュラーUPSアーキテクチャは、スケーラビリティとメンテナンスの柔軟性を可能にする。ホットスワップ可能な電源モジュールにより、ダウンタイムなしで容量を追加できる。各UPS内のN+1モジュール冗長性により、モジュール障害時も可用性が維持される。モジュラリティによる適正サイジングは、部分負荷での効率を向上させる。分散モジュラーシステムは、より小型のUPSユニットを負荷の近くに配置する。Schneider ElectricのGalaxy VXは、モジュラーアーキテクチャにより97%の効率を達成し、冷却要件を40%削減している。

ダブルコンバージョンオンライントポロジーは、敏感なGPU負荷に対して優れた電力調整を提供する。入力整流器はACをDCに変換し、バッテリーを充電してインバーターに給電する。インバーターは、電力会社の外乱から隔離されたクリーンなAC出力を生成する。スタティックバイパスは、中断なしにメンテナンスを可能にする。出力トランスは必要に応じてガルバニック絶縁を提供する。このトポロジーは高調波をフィルタリングし、力率を補正し、電圧を±1%以内に調整する。NVIDIA認定UPSシステムは、GPU安定性に不可欠なTHDを3%未満に維持する。

効率最適化は、運用コストと冷却要件を大幅に削減する。ECOモードはバイパスで動作し、イベント発生時のみダブルコンバージョンに切り替え、99%の効率を達成する。しかし、切替時間とフィルタリングの低下により、ECOモードはGPU負荷には適さない。可変モジュール管理システムは、不要なモジュールを非アクティブ化し、部分負荷効率を向上させる。最適化されたバッテリーフロート充電により損失が削減される。高効率UPSシステムは、1MWあたり年間5万ドルの電気代を節約する。Googleのカスタム設計UPSは、一般的な負荷で97.5%の効率を達成している。

PDU構成と管理

インテリジェントPDUは、ラックレベルできめ細かな電力監視と制御を提供する。分岐回路監視は、過負荷を防止するために個々の回路負荷を追跡する。コンセントレベルのスイッチングにより、特定のデバイスのリモート電源サイクルが可能になる。環境監視は、温度と湿度センサーを統合する。ネットワーク接続により、集中管理とアラートが可能になる。これらの機能により、CoreWeaveでは電力異常の早期検出を通じて47件の熱イベントを防止した。

三相配電は、標準コンポーネントを使用して銅の使用量を最小限に抑えながら容量を最大化する。415/240V Wye構成は、標準コンポーネントを使用してラックあたり100kW以上を供給する。Delta構成はより高い線間電圧を提供するが、接地が複雑になる。不平衡負荷は容量を減少させ、中性線電流を生じさせるため、位相バランスが重要になる。自動位相選択PDUは、負荷を動的にバランスさせる。適切な位相管理により、既存のFacebook施設で電力容量が15%向上した。

回路保護協調は、カスケードなしに障害を分離する選択的トリップを保証する。上流のブレーカーは、下流のデバイスが最初に障害をクリアできるようにする必要がある。時間-電流協調調査により、配電階層全体での選択性が検証される。アークフラッシュ緩和により、電流制限を通じてインシデントエネルギーが削減される。地絡保護により、機器の損傷と人員の危険が防止される。包括的な協調により、Microsoftでは89%の電気障害時にカスケード障害が防止された。

計測精度により、正確な容量計画とコスト配分が可能になる。収益グレードのメーターは、課金目的で0.5%の精度を達成する。電力品質アナライザーは、高調波、過渡現象、および電圧低下をキャプチャする。波形キャプチャにより、電力イベントの法的分析が可能になる。DCIMシステムとの統合により、包括的なエネルギー管理が可能になる。正確な計測により、Uberでは利用率向上を通じて300万ドルの未使用電力容量が特定された。

冗長PDU構成により、ラックレベルで単一障害点が排除される。デュアルコード機器は、異なる電源からの個別のPDUフィードに接続する。自動切替スイッチは、シングルコードデバイスに冗長性を提供する。PDU間の負荷バランシングにより、障害時の過負荷が防止される。同期切替により、切替中の位相競合が防止される。この冗長性により、Scale AIでは2年間にわたり電源関連のGPU障害がゼロとなった。

発電機の統合と同期

発電機のサイジングは、GPUインフラストラクチャのブロック負荷特性に対応する必要がある。ステップ負荷受入れは、通常、発電機定格の50〜70%に達する。N+1構成の複数の発電機により、冗長性と負荷分散が提供される。並列構成の2MW発電機は、10MW以上の要件に対応できるようにスケールする。25%のオーバーサイジングにより、将来の成長と劣化に対応する。ロードバンクテストにより、コミッショニング前に性能が検証される。TeslaのDojo施設は、N+2冗長性を備えた12台の2.5MW発電機を運用し、25MWを提供している。

同期システムは、電力会社と発電機電源間のシームレスな切替を保証する。クローズドトランジション切替により、GPU動作を維持しながら瞬時の中断が防止される。同期チェックリレーにより、並列化前に位相、周波数、および電圧の一致が確認される。負荷分担制御により、過負荷を防止しながら複数の発電機のバランスが取られる。ソフトローディングにより、過渡現象を防止しながら負荷が徐々に転送される。高度な同期により、OracleのGPUクラスタでの切替障害が95%削減された。

燃料システムは、災害時の長時間ランタイムを確保するために慎重な設計が必要である。バルクストレージは、全負荷で48〜72時間のランタイムを提供する。発電機近くのデイタンクが即時のニーズに対応する。冗長燃料ポンプとフィルタリングにより、単一障害点が防止される。自動化された燃料管理により、消費量が監視され、配送がスケジュールされる。クラウドプロバイダーは、緊急時の優先配送を保証する燃料契約を維持している。Amazonの燃料システムは、24時間ごとの契約補給で96時間のランタイムをサポートする。

パラレルスイッチギアは、複数の電源間の複雑な相互作用を調整する。プログラマブルロジックコントローラは、切替シーケンスと保護を管理する。負荷優先スキームにより、GPU動作を維持しながら非重要負荷がシェッドされる。自動同期により、シームレスな電源遷移が可能になる。障害分離により、単一の障害がシステム全体に影響することが防止される。この複雑さには、高度なコミッショニングとメンテナンスが必要である。適切に構成されたパラレルギアにより、Metaでは昨年31件の潜在的な停電が防止された。

排出規制は、都市部での発電機の展開をますます制約している。Tier 4 Finalエンジンは、NOx排出量を90%削減するが、コストは40%増加する。選択触媒還元システムには、尿素の貯蔵と注入が必要である。ディーゼル微粒子フィルターには、定期的な再生サイクルが必要である。非達成地域では、連続排出監視が必要な場合がある。天然ガスなどの代替燃料は排出を削減するが、応答時間が犠牲になる。カリフォルニアのデータセンターは、排出制限を完全に回避するために、ますます燃料電池を使用している。

高調波緩和と電力品質

GPU負荷は

[翻訳のためコンテンツを省略]

お見積り依頼_

プロジェクトについてお聞かせください。72時間以内にご回答いたします。

> TRANSMISSION_COMPLETE

リクエストを受信しました_

お問い合わせありがとうございます。弊社チームがリクエストを確認し、72時間以内に回答いたします。

QUEUED FOR PROCESSING