Refrigeración líquida para IA: de caso marginal a infraestructura esencial
Actualizado el 11 de diciembre de 2025
Actualización de diciembre de 2025: El mercado de refrigeración líquida se dispara de $2.8 mil millones (2025) a más de $21 mil millones para 2032 (CAGR >30%). Los racks actuales de NVIDIA a 132kW; la próxima generación requerirá 240kW. GB200 NVL72 permite ahorros de costos de 25x (>$4M anuales para instalaciones de 50MW). La refrigeración directa al chip ahora maneja hasta 1,600W por componente. Accelsius NeuCool enfría 4,500W por socket de GPU con agua de instalación a 40°C.
El mercado global de refrigeración líquida se disparará de $2.8 mil millones en 2025 a más de $21 mil millones para 2032, con un crecimiento anual compuesto superior al 30%.¹ A mitad de 2025, el cambio de refrigeración por aire a líquida pasó de experimental a operacional.² A plena carga, los últimos servidores GPU basados en NVIDIA requieren 132 kilovatios por rack. La próxima generación, esperada dentro de un año, requerirá 240 kilovatios.³ La refrigeración tradicional por aire no puede disipar el calor a estas densidades. La refrigeración líquida se transformó de un lujo de hyperscalers a un requisito para cualquier organización que implemente infraestructura de IA de generación actual.
La economía refuerza el cambio. Los centros de datos gastan entre $1.9 y $2.8 millones por megavatio anualmente en refrigeración.⁴ Implementar sistemas GB200 NVL72 refrigerados por líquido permite a los centros de datos hyperscale lograr ahorros de costos de hasta 25x, traduciéndose en más de $4 millones en ahorros anuales para una instalación de 50 megavatios.⁵ Las organizaciones que resistan la transición se encontrarán incapaces de implementar las generaciones de GPU que definen la capacidad de IA.
La física que impulsa la transición
Los servidores optimizados para IA y los clústeres densos en GPU empujan las densidades de potencia más allá de 50 kilovatios por rack, alcanzando niveles donde la refrigeración tradicional por aire no puede asegurar una disipación de calor estable o eficiente.⁶ Según el Uptime Institute, la densidad de potencia promedio por rack en centros de datos aumentó un 38% de 2022 a 2024, con el crecimiento más pronunciado en implementaciones de IA y hyperscale.⁷ Las densidades de potencia que antes llegaban a un máximo de 15 kilovatios ahora alcanzan entre 80 y 120 kilovatios en clústeres de IA.⁸
La ventaja fundamental de la refrigeración líquida radica en la termodinámica. Con casi 1,000 veces la densidad del aire, el líquido sobresale en transportar el calor gracias a su superior capacidad calorífica y conductividad térmica.⁹ Al transferir eficientemente el calor de las GPU de alto rendimiento, la refrigeración líquida reduce la dependencia de ventiladores de refrigeración que consumen mucha energía. El resultado: una reducción promedio del 11% en el consumo de energía del servidor mientras se eliminan el 80% de los requisitos de espacio de la infraestructura de refrigeración tradicional.¹⁰
Los sistemas de refrigeración por aire luchan por manejar densidades de potencia superiores a 10-15 kilovatios por rack.¹¹ Muchas cargas de trabajo de IA requieren racks funcionando a 30-60 kilovatios o más.¹² La brecha entre lo que ofrece la refrigeración por aire y lo que demanda la infraestructura de IA crece con cada generación de GPU.
La refrigeración directa al chip domina la producción
La refrigeración directa al chip se convirtió rápidamente en la forma más común de refrigeración líquida implementada en entornos de producción.¹³ Las placas frías se montan directamente sobre CPUs, GPUs, módulos de memoria y reguladores de voltaje. Un sistema de circuito cerrado hace circular el refrigerante a través de estas placas, eliminando el calor en la fuente.¹⁴
Los sistemas GB200 NVL72 y GB300 NVL72 de NVIDIA utilizan refrigeración líquida directa al chip como configuración estándar.¹⁵ A diferencia de la refrigeración evaporativa o por inmersión, la refrigeración líquida del NVL72 opera como un sistema de circuito cerrado donde el refrigerante no se evapora ni requiere reemplazo, ahorrando agua.¹⁶ La arquitectura ofrece 40x mayor potencial de ingresos, 30x mayor rendimiento, 25x más eficiencia energética y 300x más eficiencia hídrica que los sistemas tradicionales refrigerados por aire.¹⁷
Las soluciones directas al chip ahora manejan hasta 1,600 vatios por componente, permitiendo un 58% más de densidad de servidores en comparación con la refrigeración por aire mientras reducen el consumo de energía de la infraestructura en un 40%.¹⁸ El sistema DLC-2 de Supermicro habilitado para NVIDIA HGX B200 captura hasta el 98% del calor del sistema al refrigerar por líquido CPUs, GPUs, DIMMs, switches PCIe, reguladores de voltaje y fuentes de alimentación, permitiendo la operación silenciosa del centro de datos con niveles de ruido tan bajos como 50 decibelios.¹⁹
Accelsius logró dos hitos térmicos con su tecnología NeuCool: enfriar exitosamente 4,500 vatios por socket de GPU y mantener temperaturas seguras de GPU en un rack de IA completamente cargado de 250 kilovatios usando agua de instalación tibia a 40°C.²⁰ La capacidad de usar agua tibia en lugar de agua enfriada reduce los requisitos de infraestructura de refrigeración y los costos operativos.
La refrigeración por inmersión escala para densidad extrema
La refrigeración por inmersión sumerge los servidores en fluido dieléctrico, logrando más de 100 kilovatios por rack y, en algunos diseños, escalando hasta 250 kilovatios.²¹ Sistemas como ICEraQ de GRC alcanzan capacidades de refrigeración de hasta 368 kilovatios por sistema mientras mantienen la efectividad del uso de energía por debajo de 1.03.²² El enfoque elimina completamente los ventiladores y permite a los operadores empaquetar de 10 a 15 veces más capacidad de cómputo en la misma superficie.²³
El mercado de refrigeración por inmersión en centros de datos alcanzó los $4.87 mil millones en 2025 y crecerá a $11.10 mil millones para 2030 con una tasa de crecimiento anual compuesta del 17.91%.²⁴ Los sistemas monofásicos retienen la mayor cuota de mercado debido a la familiaridad de instalación, aunque los diseños bifásicos ganan pilotos donde la densidad extrema y las arquitecturas sin bombas resultan esenciales.²⁵
Comparada con la refrigeración tradicional por aire, la refrigeración por inmersión monofásica reduce la demanda de electricidad hasta casi la mitad, contribuye a reducciones de emisiones de CO2 de hasta el 30% y soporta hasta un 99% menos de consumo de agua.²⁶ Las ganancias de eficiencia se traducen directamente en un tiempo más rápido hacia los ingresos para servicios de IA. La capacidad de impulsar una mayor utilización de cada metro cuadrado sigue siendo la palanca económica más fuerte que motiva la adopción hyperscale.²⁷
En mayo de 2025, Intel se asoció con Shell Global Solutions para lanzar la primera solución de refrigeración por inmersión certificada por Intel para procesadores Xeon de 4ª y 5ª generación, permitiendo la gestión térmica de alto rendimiento a escala de producción.²⁸ La asociación señala que la refrigeración por inmersión alcanzó los niveles de certificación y soporte que requieren las implementaciones empresariales.
Las implementaciones de hyperscalers establecen el estándar
Los clústeres Azure AI de Microsoft, las implementaciones TPU de Google y los nodos de entrenamiento del modelo LLaMA de Meta cambiaron a refrigeración líquida.²⁹ La supercomputadora avanzada de IA de Microsoft, presentada en 2025, cuenta exclusivamente con racks refrigerados por líquido que soportan cargas de trabajo de entrenamiento de GPT-Next.³⁰ Los compromisos de los hyperscalers validan la refrigeración líquida como infraestructura lista para producción en lugar de tecnología experimental.
HPE envió su primera solución de la familia NVIDIA Blackwell, el GB200 NVL72, en febrero de 2025.³¹ HPE construyó siete de las diez supercomputadoras más rápidas del mundo, estableciendo una profunda experiencia en refrigeración líquida directa.³² Las arquitecturas de referencia de la compañía proporcionan planos para implementaciones empresariales.
La arquitectura de referencia de Vertiv para servidores NVIDIA GB200 NVL72 reduce el consumo anual de energía en un 25%, recorta los requisitos de espacio en rack en un 75% y reduce la huella de potencia en un 30%.³³ La infraestructura de refrigeración líquida de Schneider Electric soporta hasta 132 kilovatios por rack para centros de datos de IA GB200 NVL72.³⁴ El ecosistema de proveedores ahora ofrece soluciones llave en mano en lugar de requerir ingeniería personalizada.
Meta desarrolló Air-Assisted Liquid Cooling con Microsoft como una solución híbrida y adaptable.³⁵ El enfoque permitió a Meta comenzar a integrar refrigeración líquida sin renovar toda su infraestructura refrigerada por aire, demostrando caminos de transición pragmáticos para organizaciones con instalaciones existentes.
Los desafíos de adaptación persisten
Adaptar un centro de datos en operación para acomodar procesadores más potentes presenta desafíos técnicos y logísticos significativos.³⁶ Algunos operadores concluyen que construir nuevas instalaciones resulta más fácil que actualizar las existentes.³⁷ La decisión depende de la antigüedad de la instalación, la vida útil restante y la escala de las implementaciones de IA planificadas.
La refrigeración líquida requiere infraestructura especializada incluyendo unidades de distribución de líquido, placas frías, tanques de inmersión y bombas de refrigerante.³⁸ La adaptación implica modificar los racks de servidores, agregar sistemas de prevención de fugas y asegurar el cumplimiento normativo.³⁹ Los sitios brownfield enfrentan limitaciones arquitectónicas y de infraestructura que los proyectos greenfield evitan.
Las tasas de adopción más bajas para soluciones intensivas en infraestructura como la refrigeración por inmersión, del 20.4% entre sitios brownfield, reflejan restricciones prácticas.⁴⁰ Estas restricciones incluyen adaptaciones extensivas para acomodar tanques, espacio de piso limitado y desafíos para integrarse con la infraestructura existente de energía y refrigeración.⁴¹ Los sitios brownfield parecen más propensos a adoptar soluciones incrementales como la refrigeración líquido-aire que evitan una renovación completa de la infraestructura.⁴²
Schneider Electric se asoció con NVIDIA en tres diseños de referencia para adaptación destinados a operadores de centros de datos que buscan mejoras de rendimiento sin rediseñar las instalaciones desde cero.⁴³ Los diseños reconocen que la mayoría de las organizaciones no pueden construir centros de datos de IA greenfield y deben trabajar dentro de las restricciones existentes.
La complejidad operativa aumenta
Debido a que los sistemas líquidos solo enfrían los chips, la refrigeración por aire suplementaria aún maneja del 20% al 30% de la carga térmica total.⁴⁴ Las arquitecturas de refrigeración híbrida requieren experiencia que muchas organizaciones carecen internamente.⁴⁵ El cambio operativo resulta tan significativo como la actualización mecánica en sí.
La refrigeración líquida introduce nuevos requisitos operativos: detección de fugas, redundancia hidráulica, control de calidad del refrigerante y capacitación de técnicos.⁴⁶ Los equipos tradicionales de operaciones de centros de datos pueden no tener experiencia con plomería, bombas e intercambiadores de calor a la escala que demanda la infraestructura de IA. La brecha de habilidades afecta los plazos de implementación y las operaciones continuas.
ZutaCore desarrolló sistemas de refrigeración líquida directa al chip que soportan el superchip GB200, que combina procesadores NVIDIA Grace ARM con GPUs Blackwell.⁴⁷ Las soluciones de terceros expanden las opciones pero también complican la gestión de proveedores y los acuerdos de soporte.
Los problemas de la cadena de suministro podrían complicar los planes de refrigeración híbrida, potencialmente agravados por cambios en la política comercial.⁴⁸ El rápido aumento en la potencia de cómputo significa que los centros de datos a la vanguardia hoy pueden quedarse atrás rápidamente.⁴⁹ Diseñar instalaciones con capacidad para futuras densidades de potencia resulta desafiante cuando el objetivo continúa moviéndose.
Patrones regionales de adopción
América del Norte lidera la adopción del mercado a través de despliegues a escala de producción por parte de proveedores de nube hyperscale.⁵⁰ El mercado estadounidense crecerá de $1.09 mil millones en 2024 a $6.39 mil millones para 2034.⁵¹ Las inversiones de hyperscalers de AWS, Google y Microsoft impulsan la adopción mientras las empresas siguen su ejemplo.
Asia-Pacífico exhibe el crecimiento más pronunciado mientras Japón, China y Corea del Sur impulsan clústeres de IA refrigerados por líquido.⁵² La refrigeración convencional por aire resulta prohibitivamente costosa en climas cálidos y húmedos.⁵³ La refrigeración por inmersión ofrece soluciones sostenibles y eficientes en espacio particularmente adecuadas para las condiciones regionales. Asia-Pacífico lidera el mercado global de refrigeración por inmersión durante todo el período de pronóstico.⁵⁴
La distribución geográfica refleja tanto consideraciones climáticas como la concentración de inversión en infraestructura de IA. Las regiones con programas agresivos de desarrollo de IA impulsan la innovación en refrigeración por necesidad.
Consideraciones de planificación estratégica
Las organizaciones que planifican infraestructura de IA deben considerar la refrigeración líquida en las decisiones de instalaciones y presupuesto. La elección entre refrigeración directa al chip e inmersión depende de la escala de implementación, las restricciones de adaptación y las capacidades operativas.
Para nuevas implementaciones, la refrigeración líquida debería ser la especificación predeterminada para cualquier rack que exceda los 30 kilovatios. Planificar para densidades de más de 100 kilovatios anticipa las hojas de ruta de GPU hasta 2027. Las instalaciones diseñadas hoy sin infraestructura de refrigeración líquida enfrentarán costosas adaptaciones o reemplazo en años.
Para instalaciones existentes, evalúe la viabilidad de adaptación honestamente. Los diseños de referencia de Schneider Electric proporcionan puntos de partida, pero aún se requiere trabajo de ingeniería significativo. Los enfoques híbridos que superponen refrigeración líquida sobre infraestructura refrigerada por aire ofrecen caminos incrementales hacia adelante.
El
[Contenido truncado para traducción]