AI를 위한 UPS 및 전력 분배: 복원력 있는 2N+1 인프라 설계
2025년 12월 8일 업데이트
2025년 12월 업데이트: AI 랙 전력 밀도가 GB200 NVL72 기준 100-130kW가 표준이 되었습니다. PDU 요구 사항이 415V 배전으로 랙당 100kW를 초과합니다. 전력 비용이 TCO를 지배함에 따라 UPS 효율이 매우 중요해졌습니다. 리튬이온 UPS 채택이 가속화되고 있습니다(40% 더 작은 설치 면적). 고전류 배전에서 케이블을 부스바가 대체하고 있습니다. GPU 전력 소비 특성에 맞는 역률 보정이 필수입니다.
Meta 데이터 센터에서 47초간의 전력 중단으로 6,500만 달러의 손실이 발생했습니다. 분산 학습을 수행하던 10,000개의 GPU가 동기화를 잃어 3주간의 모델 학습 진행이 손상되었습니다. 현대 AI 인프라는 99.9999% 이상의 가동률을 요구하며, 이는 연간 31초의 중단만 허용하는 수준입니다. 각 H100 GPU가 700W를 소비하고 완전한 클러스터가 10MW 이상을 소비하는 상황에서, 전력 분배 아키텍처가 조직이 획기적인 AI 역량을 달성할지 또는 치명적인 장애를 겪을지를 결정합니다. 이 종합 가이드는 효율성과 비용을 최적화하면서 대규모 GPU 투자를 보호하는 UPS 및 전력 분배 시스템 설계 방법을 살펴봅니다.
전력 아키텍처 기본 원칙
2N+1 이중화 아키텍처는 중요한 AI 인프라를 위한 최고 수준의 표준을 제공하며, 완전한 이중화와 유지보수를 위한 추가 용량을 결합합니다. "2N" 구성 요소는 전력 인입구부터 GPU까지 두 개의 완전히 독립된 전력 경로를 제공하여 어느 한 경로가 완전히 장애가 나더라도 지속적인 운영을 보장합니다. "+1"은 동시 유지보수를 위한 용량을 추가하여 이중화를 줄이지 않고도 수리가 가능합니다. 이 아키텍처는 99.9999%의 가용성을 달성하며, 다운타임 비용이 분당 10만 달러를 초과하는 워크로드에 필수적입니다. Google의 TPU 클러스터는 2N+1 아키텍처를 구현하여 100MW 인프라 전체에서 연간 8초의 전력 관련 다운타임만 경험합니다.
AI 인프라의 전력 밀도 과제는 기존 데이터 센터 요구 사항을 훨씬 초과합니다. 최신 GPU 랙은 40-100kW를 소비하는 반면, 기존 IT 장비는 5-10kW를 소비합니다. NVIDIA의 DGX H100 시스템은 노드당 10.2kW가 필요하며, 랙당 8개 노드는 네트워킹 오버헤드를 포함하여 82kW를 요구합니다. 전력 분배는 정상 상태 부하와 GPU 부스트 사이클 동안의 과도 스파이크를 모두 처리해야 합니다. Microsoft의 Azure AI 인프라는 415/240V 3상 전력용으로 설계된 특수 PDU(전력 분배 장치)를 배포하여 전력 변동에 대한 충분한 여유와 함께 랙당 96kW를 공급합니다.
Tier 분류는 해당 인프라 요구 사항과 함께 신뢰성 수준을 정의합니다. Tier III 시설은 N+1 이중화를 제공하여 99.982%의 가용성을 달성합니다. Tier IV 시설은 2N 이중화를 구현하여 99.995%의 가용성에 도달합니다. 그러나 AI 워크로드는 종종 기존 정의를 초과하는 "Tier IV+" 표준을 요구합니다. 이러한 향상된 표준에는 더 빠른 전환 시간, 더 엄격한 전압 조정, 우수한 고조파 필터링이 포함됩니다. OpenAI의 학습 인프라는 GPU 특정 요구 사항에 맞게 사용자 정의 수정된 Tier IV+ 표준을 구현합니다.
부하 계산은 명판 정격을 넘어 GPU 특정 특성을 고려해야 합니다. GPU 부하가 0.95-0.98의 역률을 나타내므로 역률 보정이 중요해집니다. 콜드 스타트 시 돌입 전류는 100-200밀리초 동안 동작 전류의 150%에 도달할 수 있습니다. 동적 주파수 스케일링은 몇 초 내에 20%의 전력 변동을 일으킵니다. 학습 중 모든 GPU가 일반적으로 동시에 작동하므로 다양성 계수는 1.0에 가깝습니다. 정확한 부하 모델링은 적절한 크기 조정을 통해 Anthropic에서 23건의 전력 인프라 장애를 방지했습니다.
전기 배전 토폴로지는 신뢰성과 효율성 모두에 영향을 미칩니다. 방사형 시스템은 간단하고 비용 효과적인 배전을 제공하지만 단일 장애점을 만듭니다. 1차 선택 시스템은 소스 간 수동 전환이 가능합니다. 2차 선택 시스템은 전환을 자동화하지만 복잡성을 추가합니다. 네트워크 시스템은 다중 경로를 통해 최대 신뢰성을 제공합니다. Meta의 인프라는 자동 전환이 포함된 2차 선택 시스템을 사용하여 유틸리티 장애 시 서브사이클 스위칭을 달성합니다.
UPS 시스템 설계 및 선택
배터리 기술 선택은 UPS 성능과 수명 주기 비용에 근본적인 영향을 미칩니다. VRLA(밀폐형 납축전지) 배터리는 25°C에서 3-5년의 수명으로 검증된 신뢰성을 제공합니다. 리튬이온 배터리는 10년 수명, 70% 더 작은 설치 면적, 더 빠른 재충전을 제공하지만 초기 비용이 3배 더 높습니다. 니켈-아연 배터리는 7년 수명으로 성능과 비용의 균형을 맞춥니다. 플라이휠은 20년 수명과 최소한의 유지보수로 단기 백업을 제공합니다. Amazon의 데이터 센터는 점점 더 리튬이온을 배포하여 교체 빈도 감소와 효율성 향상을 통해 VRLA와 TCO 균형을 달성하고 있습니다.
런타임 계산은 중요 부하 지원 요구 사항에 따라 배터리 크기를 결정합니다. AI 인프라는 일반적으로 10-15분의 런타임을 요구하여 발전기 시작 및 동기화를 허용합니다. 배터리 용량은 노화를 고려해야 하며, 80% 수명 종료 용량이 표준입니다. 온도 디레이팅은 25°C 정격과 비교하여 40°C에서 용량을 50% 감소시킵니다. 20%의 부하 증가 예비는 확장을 수용합니다. 이러한 요인들로 인해 초기 배터리 요구 사항이 종종 두 배가 됩니다. LinkedIn의 UPS 시스템은 100% 부하에서 12분, 75% 부하에서 18분을 제공하여 적절한 발전기 전환 시간을 보장합니다.
모듈형 UPS 아키텍처는 확장성과 유지보수 유연성을 가능하게 합니다. 핫스왑 가능한 전원 모듈은 다운타임 없이 용량 추가가 가능합니다. 각 UPS 내 N+1 모듈 이중화는 모듈 장애 시 가용성을 유지합니다. 모듈화를 통한 적정 크기 조정은 부분 부하에서 효율성을 향상시킵니다. 분산 모듈형 시스템은 더 작은 UPS 장치를 부하에 더 가깝게 배치합니다. Schneider Electric의 Galaxy VX는 모듈형 아키텍처를 통해 97%의 효율을 달성하여 냉각 요구 사항을 40% 줄입니다.
이중 변환 온라인 토폴로지는 민감한 GPU 부하에 우수한 전력 컨디셔닝을 제공합니다. 입력 정류기는 AC를 DC로 변환하여 배터리를 충전하고 인버터에 공급합니다. 인버터는 유틸리티 교란으로부터 격리된 깨끗한 AC 출력을 생성합니다. 정적 바이패스는 중단 없이 유지보수가 가능합니다. 출력 변압기는 필요시 갈바닉 절연을 제공합니다. 이 토폴로지는 고조파를 필터링하고 역률을 보정하며 전압을 ±1% 내로 조정합니다. NVIDIA 인증 UPS 시스템은 GPU 안정성에 중요한 3% 미만의 THD를 유지합니다.
효율성 최적화는 운영 비용과 냉각 요구 사항을 크게 줄입니다. ECO 모드는 바이패스에서 작동하며 이벤트 발생 시에만 이중 변환을 활성화하여 99%의 효율을 달성합니다. 그러나 전환 시간과 감소된 필터링으로 인해 ECO 모드는 GPU 부하에 적합하지 않습니다. 가변 모듈 관리 시스템은 불필요한 모듈을 비활성화하여 부분 부하 효율을 향상시킵니다. 최적화된 배터리 플로트 충전은 손실을 줄입니다. 고효율 UPS 시스템은 전기 비용에서 MW당 연간 5만 달러를 절약합니다. Google의 맞춤형 UPS 설계는 일반적인 부하에서 97.5%의 효율을 달성합니다.
PDU 구성 및 관리
지능형 PDU는 랙 수준에서 세분화된 전력 모니터링 및 제어를 제공합니다. 분기 회로 모니터링은 과부하를 방지하기 위해 개별 회로 부하를 추적합니다. 콘센트 수준 스위칭은 특정 장치의 원격 전원 사이클링이 가능합니다. 환경 모니터링은 온도 및 습도 센서를 통합합니다. 네트워크 연결은 중앙 집중식 관리 및 알림이 가능합니다. 이러한 기능은 CoreWeave에서 전력 이상의 조기 감지를 통해 47건의 열 관련 이벤트를 방지했습니다.
3상 전력 분배는 구리 요구 사항을 최소화하면서 용량을 극대화합니다. 415/240V Wye 구성은 표준 구성 요소를 사용하여 랙당 100kW 이상을 공급합니다. Delta 구성은 더 높은 선간 전압을 제공하지만 접지를 복잡하게 합니다. 불균형 부하가 용량을 줄이고 중성선 전류를 생성하므로 위상 균형이 중요해집니다. 자동 위상 선택 PDU는 부하를 동적으로 균형 맞춥니다. 적절한 위상 관리는 기존 Facebook 시설에서 전력 용량을 15% 향상시켰습니다.
회로 보호 협조는 캐스케이드 없이 결함을 격리하는 선택적 트리핑을 보장합니다. 상류 차단기는 하류 장치가 먼저 결함을 제거할 수 있도록 해야 합니다. 시간-전류 협조 연구는 배전 계층 전체의 선택성을 검증합니다. 아크 플래시 완화는 전류 제한을 통해 사고 에너지를 줄입니다. 접지 결함 보호는 장비 손상과 인명 위험을 방지합니다. 포괄적인 협조는 Microsoft에서 전기 결함의 89% 동안 캐스케이드 장애를 방지했습니다.
계량 정확도는 정밀한 용량 계획과 비용 할당이 가능합니다. 수익 등급 계량기는 청구 목적으로 0.5%의 정확도를 달성합니다. 전력 품질 분석기는 고조파, 과도 현상, 전압 강하를 캡처합니다. 파형 캡처는 전력 이벤트의 포렌식 분석을 제공합니다. DCIM 시스템과의 통합은 종합적인 에너지 관리가 가능합니다. 정확한 계량은 더 나은 활용을 통해 Uber에서 300만 달러의 미사용 전력 용량을 식별했습니다.
이중화 PDU 구성은 랙 수준에서 단일 장애점을 제거합니다. 이중 코드 장비는 서로 다른 소스의 별도 PDU 피드에 연결됩니다. 자동 전환 스위치는 단일 코드 장치에 이중화를 제공합니다. PDU 간 부하 균형은 장애 시 과부하를 방지합니다. 동기화된 스위칭은 전환 중 위상 충돌을 방지합니다. 이 이중화는 Scale AI에서 2년 동안 전력 관련 GPU 장애가 전혀 없었습니다.
발전기 통합 및 동기화
발전기 크기 조정은 GPU 인프라의 블록 부하 특성을 수용해야 합니다. 단계 부하 수용은 일반적으로 발전기 정격의 50-70%에 도달합니다. N+1 구성의 다중 발전기는 이중화와 부하 분담을 제공합니다. 병렬 구성의 2MW 발전기는 10MW 이상의 요구 사항을 충족하도록 확장됩니다. 25% 과잉 크기 조정은 향후 성장과 성능 저하를 수용합니다. 부하 뱅크 테스트는 시운전 전에 성능을 검증합니다. Tesla의 Dojo 시설은 N+2 이중화와 함께 25MW를 제공하는 12대의 2.5MW 발전기를 운영합니다.
동기화 시스템은 유틸리티와 발전기 전력 간의 원활한 전환을 보장합니다. 폐회로 전환 전환은 GPU 작동을 유지하면서 순간적인 중단을 방지합니다. 동기 체크 릴레이는 병렬 연결 전에 위상, 주파수, 전압 일치를 확인합니다. 부하 분담 제어는 과부하를 방지하기 위해 여러 발전기의 균형을 맞춥니다. 소프트 로딩은 과도 현상을 방지하기 위해 부하를 점진적으로 전환합니다. 고급 동기화는 Oracle의 GPU 클러스터에서 전환 중단을 95% 줄였습니다.
연료 시스템은 재해 시 장시간 런타임을 보장하기 위해 신중한 설계가 필요합니다. 대용량 저장소는 전부하에서 48-72시간 런타임을 제공합니다. 발전기 근처의 일일 탱크는 즉각적인 요구를 충족합니다. 이중화 연료 펌프와 필터링은 단일 장애점을 방지합니다. 자동화된 연료 관리는 소비를 모니터링하고 배송을 예약합니다. 클라우드 제공업체는 비상 시 우선 배송을 보장하는 연료 계약을 유지합니다. Amazon의 연료 시스템은 24시간마다 계약된 재급유와 함께 96시간 런타임을 지원합니다.
병렬 배전반은 여러 소스 간의 복잡한 상호 작용을 조율합니다. 프로그래머블 로직 컨트롤러가 전환 시퀀스와 보호를 관리합니다. 부하 우선 순위 체계는 GPU 작동을 유지하면서 비중요 부하를 차단합니다. 자동 동기화는 원활한 소스 전환이 가능합니다. 결함 격리는 단일 장애가 전체 시스템에 영향을 미치는 것을 방지합니다. 이러한 복잡성은 정교한 시운전과 유지보수가 필요합니다. 적절히 구성된 병렬 연결 장치는 지난해 Meta에서 31건의 잠재적 정전을 방지했습니다.
배출 규정 준수는 도시 지역에서 발전기 배포를 점점 더 제약합니다. Tier 4 Final 엔진은 NOx 배출을 90% 줄이지만 비용이 40% 더 높습니다. 선택적 촉매 환원 시스템은 요소 저장 및 주입이 필요합니다. 디젤 미립자 필터는 주기적인 재생 사이클이 필요합니다. 비달성 지역에서는 연속 배출 모니터링이 필요할 수 있습니다. 천연 가스와 같은 대체 연료는 배출을 줄이지만 응답 시간에 영향을 줍니다. 캘리포니아 데이터 센터는 배출 제한을 완전히 피하기 위해 점점 더 연료 전지를 사용하고 있습니다.
고조파 완화 및 전력 품질
GPU 부하는
[번역을 위해 콘텐츠가 잘림]