AI向けバックアップ電源戦略:UPS、発電機、バッテリー持続時間
2025年12月11日更新
2025年12月アップデート: Blackwell UltraおよびRubin AIサーバーは、2026年から2027年にかけてラックあたり250〜900 kWを必要とする見込みで、現在の132 kWから大幅に増加します。AIデータセンターは99.99999%の稼働率(セブンナイン)を目標としており、メガワット規模のBESS展開が必要です。バージニア州では系統連系までのタイムラインが7年にまで延びています。10〜15 kWラック向けに設計された従来のUPSは、AIの電力密度に対応できません。
NVIDIAのBlackwell GPUおよびGB200NVL72ラック設計は、ピークラック電力密度を132 kWに押し上げており、将来のBlackwell UltraおよびRubin AIサーバーは2026年から2027年にかけてラックあたり250〜900 kWを必要とします。[^1] 業界の専門家が17年前にデータセンターで働いていた頃、最大のラックレベル電源ユニットは6キロワットでした。現在、NVIDIAは単一ラックで120 kWや300 kWを必要とするAIサーバーをリリースしています。[^2] この電力密度の急激な上昇により、バックアップ電源は標準的なデータセンターの設備から、専用ソリューションを必要とする重要なエンジニアリング課題へと変貌しています。
AIデータセンターは99.99999%の稼働率(セブンナイン)を目標としており、これは従来のファイブナインやシックスナインよりもはるかに高い水準です。[^3] この厳格な可用性要件は、発電機がオンラインになるまでのギャップを埋めることができるバッテリーシステムに支えられた、通常1〜2メガワット/発電機のフルスケール発電機ベースのバックアップを必要とします。10〜15 kWラック向けに設計された従来のUPS構成は、高電力密度のAIワークロードに対応できません。今後は、数十〜数百メガワットの電力レベルにスケールできるBattery Energy Storage Systems(BESS)のようなソリューションが、AIインフラに必要な能力を提供します。
電力アーキテクチャの基礎
AIデータセンターの電力アーキテクチャは、高密度GPUインフラの固有の要求に対応します。
ユーティリティ電力の課題
バージニア州のようなホットスポットでは、系統連系までのタイムラインが数年から最長7年にまで延びています。[^4] 4つの要因がこの遅延を複合的に引き起こしています:高容量で復元力のある給電の技術的複雑さ、上流系統容量の不足、重要な電気機器の長いリードタイム、そして遅く一貫性のない許認可プロセスです。AIインフラを計画する組織は、展開の数年前から電力調達を開始する必要があります。
系統容量の制約により、AIデータセンターは他の要素にとって必ずしも最適ではなく、利用可能な電力がある場所を選ばざるを得ません。電力の利用可能性という制約が、ネットワーク接続性や労働市場といった従来の要素よりも、ますますサイト選定を左右するようになっています。
独立した変電所からのデュアルユーティリティフィードは、単一フィードの障害に対する冗長性を提供します。この冗長性により可用性は向上しますが、複数のフィードが実現可能な地理的場所が必要です。すべての場所がAIデータセンターに必要な冗長ユーティリティインフラを提供できるわけではありません。
中圧・高圧配電
Meta、Google、Microsoftなどのハイパースケーラーは、13.8kVまでの中圧(MV)配電と、400VDCおよび800VDCの高電圧DCアーキテクチャを展開すると予想されています。[^5] 高電圧により電流要件が削減され、以前失われていた大量のエネルギーを回収しながら、ケーブルに必要な銅を大幅に節約できます。
データセンター内の中圧配電により、ユーティリティからラックまでの変換段階が削減されます。各変換段階は損失と障害点を追加します。簡素化された電力経路は、効率と信頼性の両方を向上させます。
ACとDCの議論は、AIインフラにおいて再び活発化しています。[^5] ACは系統インターフェースと施設レベルの配電において依然として主流ですが、特にメガワット/ラックのGPU重視アーキテクチャにおいて、内部運用に電力を供給する高電圧DCシステムへの勢いが高まっています。
AI向けUPSシステム
無停電電源装置は、ユーティリティ障害から発電機起動までのギャップを埋め、移行中も電力を維持します。
技術の選択
AI用途向けの最新UPSシステムは、従来の鉛蓄電池と比較して、より高速な充電、より長い寿命、より高いエネルギー密度を提供するリチウムイオンバッテリーを使用しています。[^6] これらの先進的なシステムは、発電機起動に十分なランタイムを維持しながら、80kWを超えるAIラック負荷をサポートします。
リチウムイオンバッテリーは鉛蓄電池の3〜5年に対して10〜15年の寿命を提供し、交換頻度とメンテナンス負担を軽減します。高いエネルギー密度により、同等容量でもより小さなフットプリントが可能になり、スペースが制約されたデータセンターで価値があります。
フライホイールUPSシステムは、非常に短い期間のブリッジングに代替手段を提供します。フライホイールは、バッテリーの劣化を心配することなく、短時間の電力障害を処理するのに優れています。一部のアーキテクチャでは、異なる障害タイプに対する最適化された応答のために、フライホイールとバッテリーシステムを組み合わせています。
ランタイム要件
発電機の起動と同期には、発電機のタイプと負荷移行の複雑さに応じて、1分から数分かかります。[^3] UPSのランタイムは、発電機の故障や複数回の起動試行に対する安全マージンを含めて、予想される最大発電機起動時間を超える必要があります。
AIワークロードは、従来のコンピューティングワークロードほど graceful にチェックポイントと再開ができません。長時間実行されるトレーニングジョブは、短時間の電力中断で数時間の進捗を失う可能性があります。ランタイム要件は、ハードウェアのライドスルーだけでなく、ワークロードの graceful シャットダウン時間も考慮する必要があります。
時間の経過に伴うバッテリーの劣化により、利用可能なランタイムが減少します。システムは、初期容量だけでなく、寿命末期の容量が要件を満たすように設計する必要があります。バッテリーの監視と交換スケジュールにより、システム寿命全体を通じて可用性が維持されます。
スケーラビリティの課題
従来のUPS構成は、高電力密度のAIワークロードにはもはや実現可能ではありません。[^3] 過去のラック密度に合わせてサイジングされたUPSシステムは、ラックあたり数百キロワットに経済的にスケールできません。モジュラーUPSアーキテクチャは容量の追加を可能にしますが、物理的なフットプリントの制約に直面します。
分散UPSアーキテクチャは、大規模システムを集中させるのではなく、より小さなユニットを負荷の近くに配置します。この分散により、インフラ経路の要件は削減されますが、コンポーネント数と監視の複雑さが増加します。
Battery Energy Storage Systems
BESS技術は、AIデータセンターにおいてバックアップ付属品からコアインフラへとシフトしています。[^7]
BESSアーキテクチャ
大規模BESSは、約34,000ボルトの中圧システムとして屋外に設置でき、10 MWから100 MWの構成要素にスケールできます。[^7] 屋外展開により、貴重な屋内データホールスペースをコンピューティング機器に解放できます。
バッテリーシステムは、中圧ラインインタラクティブUPSとバックアップ発電機の代替の両方として、単一ユニットで機能するように構成できます。[^7] この統合アプローチにより、別々のUPSと発電機システムと比較して、コンポーネントが大幅に削減され、資本支出が低下します。
BESSは、従来のUPSでは経済的に達成できない4〜8時間の延長バックアップ期間を提供します。[^3] この延長ランタイムは、発電機起動を超えたシナリオ、つまり長期の系統停電や発電機メンテナンス期間に対応します。
グリッドサービス統合
BESSシステムは、バックアップに必要でないときにグリッドサービス市場に参加し、インフラコストを相殺する収益を生み出すことができます。周波数調整、デマンドレスポンス、ピークシェービングサービスは、アイドル容量から経済的価値を提供します。
グリッド統合には、収益創出とバックアップ用の可用性のトレードオフを管理する高度な制御が必要です。システムは、グリッドサービスへの参加を最大化しながら、バックアップ能力を確保する最低充電レベルを維持する必要があります。
再生可能エネルギー統合では、BESSを使用して余剰の太陽光または風力発電を蓄積し、後で使用します。この統合は、自家発電による電力コストの削減の可能性とともに、持続可能性の目標をサポートします。
発電機システム
発電機は、長期停電時にバッテリーが経済的に対応できない延長ランタイム能力を提供します。
サイジングと構成
メガワットクラスのディーゼル発電機は、燃料なしで約5,000キログラムの重量があり、5×1.5メートルのフットプリントと2.5メートルの高さを占め、標準の1,000リットル燃料タンクで起動し、輸送と設置を含まないで約100万〜200万ドルのコストがかかります。[^3] 数十メガワットを必要とするAIデータセンターには、相当な不動産要件を持つ発電機ファームが必要です。
N+1または2Nの冗長構成により、単一の発電機障害を通じて発電機の可用性が確保されます。冗長レベルの選択は、コストと可用性要件のバランスを取ります。重要なAIインフラは通常、少なくともN+1の冗長性を必要とします。
発電機の並列運転により、複数の発電機で負荷を共有でき、冗長性とスケーリングの両方を提供します。並列運転用スイッチギアが発電機の運転を調整し、複雑さは増しますが、効率的な発電機負荷を可能にします。
燃料と排出
ディーゼルは、実績のある信頼性とエネルギー密度で、バックアップ電源の主要な発電機燃料として依然として主流です。燃料貯蔵要件は希望するランタイムに応じてスケールし、典型的な構成では24〜72時間の運転を提供します。
排出規制により、特に大気質が懸念される地域では、ディーゼル発電機の運転がますます制限されています。排出制御システムはコストと複雑さを追加します。一部の管轄区域では年間運転時間を制限しており、テストとメンテナンスの慣行に影響を与えています。
天然ガス発電機は、パイプラインガスが利用可能な場所で燃料貯蔵要件を排除します。継続的な燃料供給により、機械的メンテナンス要件のみに制限された延長運転が可能になります。ただし、天然ガスはガス配給に影響を与える広範な緊急事態時には利用できない場合があります。
代替燃料
水素燃料電池は、複数のハイパースケーラーがパイロット運用しているゼロエミッションバックアップ電源を提供します。[^8] Microsoftは、48時間のバックアップ電源を提供する3MWの水素燃料電池を実証しました。この技術はディーゼルよりも高価ですが、排出と持続可能性の両方の懸念に対処します。
Sustainable aviation fuel(SAF)と再生可能ディーゼルは、ライフサイクル排出を削減したディーゼルの直接代替品を提供します。これらのバイオ燃料は、改造なしで既存の発電機機器で動作します。可用性とコストが広範な採用の制約として残っています。
統合電源戦略
最新のAIデータセンター電源アーキテクチャは、複数の技術を耐障害性のあるシステムに統合します。
ティア・トポロジーの考慮事項
Uptime Instituteのティア分類は、基本(Tier I)からフォールトトレラント(Tier IV)までの冗長レベルを定義しています。[^9] AIインフラは通常、Tier III(同時メンテナンス可能)またはTier IV(フォールトトレラント)トポロジーを必要とします。ティアレベルは、資本コスト、運用の複雑さ、可用性保証に影響します。
各ティアレベル内のコンポーネント冗長性は異なります。ユーティリティからUPSを経て負荷に至る複数の経路により、単一コンポーネントの障害を通じて継続運転が保証されます。トポロジー設計により、どの障害の組み合わせが停止を引き起こすかが決まります。
監視と自動化
電力インフラ監視は、ユーティリティフィード、スイッチギア、UPS、バッテリー、発電機全体のステータスを追跡します。包括的な監視により、予防的メンテナンスと迅速な障害対応が可能になります。監視のギャップは、障害検出を遅らせるブラインドスポットを作成します。
自動切替スイッチは、手動介入なしで電源間で負荷を移動します。切替のタイミングと調整により、負荷中断を引き起こすギャップを防ぎます。切替シーケンスのテストにより、実際の動作が設計意図と一致することを検証します。
予測メンテナンスは、運用データを使用して、障害が発生する前にコンポーネントの故障を予測します。バッテリーの健全性監視、発電機のパフォーマンストレンド、UPSコンポーネント監視により、故障前の計画的な交換が可能になります。
専門的な実装
AIデータセンターの電力インフラの複雑さには、電気工学、制御統合、運用手順にまたがる専門知識が必要です。
Introlの550人のフィールドエンジニアネットワークは、AIデプロイメント向けのバックアップ電源インフラを実装する組織をサポートしています。[^10] 同社は2025 Inc.で14位にランクされました。
[翻訳のためコンテンツ省略]