냉각수 분배 장치: AI 데이터센터를 위한 액체 냉각 인프라

냉각수 분배 장치: AI 데이터센터를 위한 액체 냉각 인프라

냉각수 분배 장치: AI 데이터센터를 위한 액체 냉각 인프라

2025년 12월 11일 업데이트

2025년 12월 업데이트: 액체 냉각 시장이 2025년 55억 달러에 도달했으며, 2030년까지 158억 달러(연평균 성장률 23%)로 성장할 것으로 전망됩니다. 700W TDP의 H200 GPU는 대규모 환경에서 액체 냉각이 필수입니다. NVIDIA Kyber 랙(2027년)은 랙당 600kW~1MW가 필요할 예정입니다. Supermicro는 기존 용량의 두 배인 250kW CDU를 출시했습니다. CDU는 삼중 이중화 아키텍처와 100ms 장애 조치로 99.999% 가용성을 달성하고 있습니다.

2025년은 액체 냉각이 최첨단 기술에서 기본 사양으로 전환되는 해입니다. 더 이상 실험적 배포에 국한되지 않고, 액체 냉각은 이제 AI 인프라의 핵심 구현 요소로 운영되고 있습니다.¹ NVIDIA H200 GPU를 배포하는 데이터센터 운영자들은 공랭식으로는 대규모 환경에서 비용 효율적으로 제거할 수 없는 장치당 700W의 열부하에 직면합니다.² 2027년 출시 예정인 NVIDIA Kyber 랙은 초기 600kW에서 랙당 1MW까지 확장되어, 전례 없는 열부하를 제거할 수 있는 액체 냉각 인프라가 필요하게 되면서 이러한 추세는 더욱 가속화됩니다.³

데이터센터 액체 냉각 시장은 2025년 55.2억 달러에 도달했으며, 연평균 성장률 23.31%로 2030년까지 157.5억 달러로 성장할 것으로 전망됩니다.⁴ 다른 분석에서는 2025년 28.4억 달러에서 연평균 성장률 33.2%로 2032년까지 211.5억 달러로 성장할 것으로 예측합니다.⁵ 냉각수 분배 장치(CDU)는 이러한 전환을 가능하게 하는 핵심 인프라로, 시설 수냉 시스템과 IT 장비 간의 냉각수 순환을 관리하면서 AI 하드웨어가 요구하는 정밀한 온도를 유지합니다.

CDU가 대규모 액체 냉각을 가능하게 하는 방법

냉각수 분배 장치는 시설 냉각 인프라와 랙 수준의 액체 냉각 시스템 간의 인터페이스 역할을 합니다. CDU는 IT 장비에 서비스를 제공하는 2차 루프에서 시설 칠러 또는 냉각탑에 연결된 1차 루프로의 열 전달을 관리합니다.

열교환 아키텍처는 다양한 냉각 유체와 호환되는 316 스테인리스 스틸 판형 열교환기를 사용합니다.⁶ 열교환기는 IT 냉각 루프를 시설 용수로부터 분리하여 오염을 방지하면서 효율적인 열 전달을 가능하게 합니다. 최대 유량은 빠른 열 흡수 및 전달을 위해 분당 3,600리터에 달합니다.⁷

온도 제어는 정밀한 조건을 유지합니다. CDU는 애플리케이션 요구 사항에 따라 -20°C에서 +70°C까지의 온도 범위를 달성합니다.⁸ 정밀한 온도 제어는 GPU의 열 스로틀링을 방지하고 일관된 컴퓨팅 성능을 유지합니다.

압력 관리는 설치의 유연성을 제공합니다. 50 psi 이상의 수두압은 CDU와 서버 랙 사이의 더 긴 배관을 가능하게 합니다.⁹ 이중 가변 속도 드라이브(VSD) 펌프는 냉각 수요에 대한 동적 응답을 제공하면서 에너지 효율성을 향상시킵니다.¹⁰

신뢰성 기능은 가용성을 보장합니다. 현대 CDU는 중요 구성 요소에 대해 1:1 핫 스탠바이를 갖춘 삼중 이중화 아키텍처를 활용합니다.¹¹ 주 모듈 장애 시 백업 시스템이 100밀리초 이내에 원활하게 전환되어 99.999%의 시스템 가용성을 달성합니다.¹²

에너지 효율성은 운영 비용 절감을 제공합니다. 공랭식 장치와 비교하여 CDU는 동등한 냉각 용량에 대해 20-30% 적은 전력을 소비합니다.¹³ 냉각이 총 전력 소비의 상당 부분을 차지하는 대규모 AI 배포에서 효율성 향상은 더욱 복합적으로 나타납니다.

AI 워크로드를 위한 CDU 용량

AI 서버의 전력 밀도가 CDU 크기 요구 사항을 결정합니다. 단일 NVIDIA GB200 GPU의 TDP는 1.2kW입니다. 8개의 GPU와 2개의 CPU가 장착된 일반적인 GB200 NVL72 서버는 총 TDP 10kW에 도달합니다.¹⁴ CDU 용량은 이러한 시스템의 전체 랙 구성에 맞게 확장되어야 합니다.

입문급 구성은 중간 밀도를 처리합니다. Boyd의 10U Liquid-to-Air CDU는 열부하 및 접근 온도 요구 사항에 따라 최대 15kW 용량을 제공합니다.¹⁵ 이러한 장치는 엣지 배포 또는 저밀도 코로케이션 환경에 적합합니다.

중급 시스템은 고밀도 랙을 지원합니다. Chilldyne의 CF-CDU300은 최대 300kW의 서버를 냉각합니다.¹⁶ 표준 42U 랙 내에서 50kW 서버 클러스터 냉각을 달성하는 시스템은 상당한 AI 워크로드 통합을 가능하게 합니다.¹⁷

고용량 플랫폼은 하이퍼스케일 배포를 지원합니다. Motivair의 CDU는 6개의 표준 모델과 최대 2.3MW IT 부하까지 확장되는 맞춤형 OEM 구성을 제공합니다.¹⁸ Supermicro는 2025년 6월에 기존 용량의 두 배인 250kW CDU와 함께 NVIDIA Blackwell 랙 규모 솔루션을 출시했습니다.¹⁹

엔터프라이즈급 시스템은 데이터센터 전체 요구 사항을 처리합니다. Trane의 차세대 CDU는 하이퍼스케일 및 코로케이션 환경에서 직접 칩 액체 냉각을 위해 최대 10MW 냉각 용량을 제공합니다.²⁰

설치 계획은 물리적 제약에 주의가 필요합니다. CDU와 랙 간의 이상적인 거리는 20미터를 초과해서는 안 됩니다.²¹ 충수된 CDU의 무게가 최대 3톤에 달할 수 있으므로 바닥 하중 용량은 800kg/m²에 도달해야 합니다.²² 유지보수 공간 요구 사항에는 전면 및 후면에 1.2미터, 배관 연결을 위해 상부에 0.6미터가 포함됩니다.²³

기존 시설 업그레이드를 위한 후면 도어 열교환기

후면 도어 열교환기(RDHx)는 서버 랙 후면에 장착되어 배기열이 데이터센터 환경으로 유입되기 전에 제거합니다.²⁴ 이 기술은 기존 공랭식 서버를 교체하지 않고도 액체 냉각의 이점을 제공합니다.

냉각 효율성은 공기 전용 방식을 크게 능가합니다. 기존 공랭식은 RDHx 구성보다 30-60% 낮은 효율로 운영됩니다.²⁵ 공랭식이 온도 유지에 어려움을 겪는 고밀도 환경에서 이러한 개선 효과는 더욱 증가합니다.

용량 진화는 증가하는 랙 밀도를 해결합니다. Motivair의 ChilledDoor는 랙당 최대 72kW를 냉각합니다.²⁶ OptiCool Technologies는 2025년 9월에 차세대 AI 및 HPC 워크로드를 위해 특별히 설계된 업계 최고 용량의 120kW RDHx를 출시했습니다.²⁷

독자적 냉각 접근 방식은 성능 한계를 넓힙니다. OptiCool의 이상(二相) 냉매 설계는 상변화 열역학을 사용하여 랙에서 열을 제거하고 실온 주변 온도로 공기를 반환합니다.²⁸ 이 접근 방식은 단상(單相) 액체 시스템보다 더 높은 열 전달 효율을 달성합니다.

능동형 대 수동형 설계는 서로 다른 트레이드오프를 제공합니다. 수동형 RDHx는 서버 팬 기류에만 의존하여 에너지 효율성과 단순성을 제공합니다.²⁹ 능동형 RDHx는 더 높은 열밀도를 위해 내장 팬을 통합하여 더 많은 전력을 소비하지만 고성능 컴퓨팅 환경에 더 큰 유연성을 제공합니다.³⁰

레거시 인프라 호환성은 기존 시설(브라운필드) 배포에 RDHx를 매력적으로 만듭니다. 기존 공랭식 서버 랙을 개조하는 것은 액체 냉각 서버로 전환하는 것보다 비용이 적게 들고 중단이 적습니다.³¹ 공랭식 하드웨어에서 실행되는 AI 추론 워크로드는 시설 전체 인프라 개편 없이 RDHx의 이점을 누릴 수 있습니다.³²

산업 표준화는 Open Compute Project를 통해 가속화됩니다. Door Heat Exchanger 하위 프로젝트는 ORV3(Open Rack Version 3) 프레임워크 내에서 RDHx 개발, 통합 및 표준화에 중점을 둡니다.³³ Schneider Electric은 2025년 2월에 액체 냉각 시장 지위를 강화하기 위해 Motivair의 지배 지분을 인수했습니다.³⁴

최대 밀도를 위한 침지 냉각

침지 냉각은 밀봉된 탱크 내에서 서버를 열전도성 유전체 액체에 담급니다.³⁵ 이 접근 방식은 냉각 에너지 소비를 획기적으로 줄이면서 최고 밀도 배포를 가능하게 합니다.

단상 침지는 액체를 전체적으로 액체 상태로 유지합니다. 열교환기를 통한 냉각수 순환이 흡수된 열을 제거합니다.³⁶ 이 접근 방식은 기존 공랭식에 비해 전력 수요를 거의 절반으로 줄이고, CO2 배출량을 최대 30%까지 절감하며, 물 소비량을 99% 줄일 수 있습니다.³⁷

이상 침지는 열원에서 액체를 증기로 끓입니다. 응축기 코일이 증기를 다시 액체 상태로 되돌립니다.³⁸ 이상 시스템은 대량의 열을 제거하는 데 더 높은 효율을 달성하여 HPC 및 AI 인프라에 더 적합합니다.³⁹

밀도 향상은 데이터센터 경제성을 변화시킵니다. 침지 냉각을 통해 운영자는 동일한 면적에 10-15배 더 많은 컴퓨팅을 집적할 수 있어, AI 서비스의 수익 창출 시간을 직접적으로 단축할 수 있습니다.⁴⁰ 이러한 통합은 부동산 요구 사항을 줄이면서 평방피트당 용량을 증가시킵니다.

에너지 효율성은 극적인 수준에 도달합니다. Submer에 따르면, 침지 냉각은 냉각 시스템 에너지 소비를 최대 95%까지 줄입니다.⁴¹ 이러한 절감액은 배포 수명 동안 더 높은 자본 비용을 상쇄합니다.

산업 검증은 신뢰를 구축합니다. Intel과 Shell은 Supermicro와 Submer의 하드웨어를 사용한 완전 침지 솔루션을 검증하여 냉각 효율성에 대한 산업 표준으로 "Intel Data Center Certified for Immersion Cooling"을 확립했습니다.⁴² Submer는 침지 탱크 유지보수를 위한 자율 로봇을 도입하여 서버 처리를 단순화했습니다.⁴³

비용 고려 사항은 신중한 분석이 필요합니다. 포괄적인 침지 배포에는 특수 탱크, 하중 지지대, 누출 감지 시스템 및 냉각수 처리 장비가 필요하여 랙당 설치 비용이 50,000달러를 넘어 동등한 공기 시스템의 약 3배에 달합니다.⁴⁴ 가동 중인 사이트를 개조하면 가동 시간을 유지하면서 바닥 플레넘, 케이블 트레이 및 전원 경로를 재배치해야 하므로 복잡성이 가중됩니다.⁴⁵

기술 성숙도는 계속 발전하고 있습니다. 침지는 장기 성능 및 신뢰성에 대한 역사적 데이터가 거의 없어 상대적으로 미성숙한 상태로 남아 있습니다.⁴⁶ 그러나 하이퍼스케일러와 AI 인프라 제공업체의 채택이 가속화되면서 운영 경험이 빠르게 축적되고 있습니다.

액체 냉각 기술 스택

다양한 냉각 기술이 서로 다른 배포 시나리오를 해결합니다. 최적의 접근 방식은 열밀도, 기존 인프라 및 운영 요구 사항에 따라 달라집니다.

콜드 플레이트 냉각(직접 칩 냉각 또는 D2C)은 가장 빠르게 성장하는 부문입니다.⁴⁷ 콜드 플레이트는 열을 발생시키는 구성 요소에 직접 부착되어 액체를 순환시켜 열부하를 제거합니다. 이 접근 방식은 침지 대안보다 기존 랙 인프라와 더 쉽게 통합됩니다.

하이브리드 아키텍처는 여러 접근 방식을 결합합니다. CDU는 최고 열 구성 요소를 위한 콜드 플레이트 시스템을 지원하고 RDHx는 공랭식 구성 요소의 나머지 열부하를 처리합니다. 이 조합은 전체 인프라 교체 없이 냉각 효율성을 극대화합니다.

OCP 규정 준수는 상호 운용성을 보장합니다. Nidec은 SC25에서 전시된 Google Open Compute Project 사양을 준수하는 Project Deschutes CDU 프로토타입을 개발했습니다.⁴⁸ 표준화된 인터페이스는 공급업체 간 구성 요소 상호 운용성을 가능하게 합니다.

랙 밀도 진화는 계속해서 요구 사항을 주도합니다. Omdia에 따르면, 10kW 미만 랙은 2024년 설치 용량의 47%를 차지했다가 2025년에는 38%로 감소했습니다.⁴⁹ 한편, 10-20kW 랙은 27%에서 30%로, 20-30kW 랙은 24%에서 28%로 상승했습니다.⁵⁰ 밀도 전환은 액체 냉각 채택을 가속화합니다.

주요 CDU 공급업체 및 최근 개발 동향

경쟁 환경은 기존 열관리 회사와 AI 인프라를 겨냥한 신규 진입자로 구성됩니다.

Vertiv는 액체 냉각 기본 사항을 설명하는 교육 자료와 함께 포괄적인 CDU 솔루션을 제공합니다. 회사의 AI Hub 이니셔티브는 CDU 기술을 차세대 인프라의 핵심으로 위치시킵니다.⁵¹

Schneider Electric은 2025년 2월 Motivair 인수를 통해 액체 냉각 포지션을 강화했습니다.⁵² 결합된 포트폴리오는 RDHx, CDU 및 통합 액체 냉각 솔루션을 다룹니다.

Supermicro는 2025년 6월에 250kW CDU와 함께 NVIDIA Blackwell 랙 규모 솔루션을 출시했습니다.⁵³ 이 시스템은 최대 밀도 배포를 위한 통합 컴퓨팅 및 냉각 설계를 보여줍니다.

Trane은 하이퍼스케일 환경을 위해 10MW 용량에 달하는 엔터프라이즈급 CDU를 제공합니다.⁵⁴ 회사는 에너지 효율성과 시설 수준의 열 인프라와의 통합을 강조합니다.

Motivair는 랙당 최대 72kW에 달하는 ChilledDoor RDHx와 2.3MW까지 확장되는 CDU 플랫폼을 개발했습니다.⁵⁵ Schneider 인수는 글로벌 배포 확대를 위한 기술 포지셔닝을 제공합니다.

Submer는 자율 유지보수 로봇을 포함한 혁신으로 침지 냉각을 전문으로 합니다.⁵⁶ Intel 파

[번역을 위해 내용 잘림]

견적 요청_

프로젝트에 대해 알려주시면 72시간 내에 답변드리겠습니다.

> 전송_완료

요청이 접수되었습니다_

문의해 주셔서 감사합니다. 저희 팀이 요청사항을 검토한 후 72시간 내에 답변드리겠습니다.

처리_대기_중