Racks de Alta Densidad: Diseños de 100kW+ para Infraestructura de Centros de Datos de IA
Actualizado el 11 de diciembre de 2025
Actualización de diciembre de 2025: El rack promedio de IA costará $3.9M en 2025 vs $500K tradicional—un aumento de 7x. Los racks GB200NVL72 alcanzan 132kW; Blackwell Ultra y Rubin apuntan a 250-900kW con 576 GPUs/rack para 2026-2027. NVIDIA presenta en OCP 2025 diseños de racks de 1MW. Eaton Heavy-Duty SmartRack soporta 2,268 kg de peso estático para IA. Construir infraestructura de 100kW cuesta $200-300K/rack.
El rack promedio de IA costará $3.9 millones en 2025, comparado con $500,000 para racks de servidores tradicionales.¹ Ese aumento de siete veces en el costo refleja la transformación fundamental en los requisitos de rack mientras las GPUs que superan el umbral de 1,000 vatios impulsan las densidades de potencia por rack más allá de 100kW hacia 1MW.² Los servidores de IA NVIDIA Blackwell Ultra y Rubin requerirán entre 250 y 900kW con hasta 576 GPUs por rack para 2026-2027.³ La infraestructura de rack que aloja estos sistemas debe evolucionar en consecuencia, con refuerzo estructural, integración de refrigeración líquida y capacidades de distribución de energía que los gabinetes tradicionales nunca anticiparon.
El mercado de racks para centros de datos proyecta un crecimiento a $9.41 mil millones para 2033 mientras las cargas de trabajo de IA remodelan los requisitos de infraestructura física.⁴ A diferencia de los centros de datos tradicionales que manejan 10-15kW por rack, las instalaciones de IA necesitan entre 40-250kW por rack para soportar las demandas computacionales del aprendizaje automático.⁵ Las organizaciones que planifican infraestructura de IA deben evaluar las especificaciones de rack contra los requisitos actuales y proyectados de GPU en lugar de suposiciones heredadas sobre densidad de potencia y capacidad de peso.
La evolución de la densidad de potencia exige nuevos diseños de rack
El aumento a más de 100kW por rack representa tanto evolución como revolución en la infraestructura de centros de datos.⁶ Los racks tradicionales diseñados para cargas de 5-10kW no pueden soportar de manera segura los requisitos de potencia de servidores GPU modernos sin cambios arquitectónicos fundamentales.
Los rangos de densidad actuales abarcan amplios escenarios de implementación. Los clústeres de entrenamiento de IA de alta densidad requieren racks de 40-60kW. Las cargas de trabajo de modelos de lenguaje grandes demandan al menos 70kW. Las aplicaciones de supercomputación para seguridad nacional e investigación de IA consumen 100kW o más.⁷ La trayectoria continúa acelerándose.
Los requisitos del sistema NVIDIA definen los puntos de referencia de infraestructura. Los diseños de rack GB200NVL72 introducidos en 2024 alcanzan una densidad de potencia pico de 132kW.⁸ Los futuros sistemas Blackwell Ultra y Rubin requieren hasta 900kW con 576 GPUs por rack.⁹ El discurso inaugural de NVIDIA en OCP 2025 presentó racks de IA de próxima generación que demandan hasta 1MW.¹⁰
Las arquitecturas de distribución de energía se adaptan a los aumentos de densidad. La rectificación centralizada convierte CA a CC más cerca de la fuente, luego distribuye CC de alto voltaje directamente a los racks, reduciendo pérdidas y mejorando el PUE.¹¹ Los hyperscalers incluyendo Meta, Google y Microsoft implementan distribución de medio voltaje hasta 13.8kV y arquitecturas de CC de mayor voltaje a 400VDC y 800VDC.¹²
Las implicaciones de costo resultan significativas. Construir nueva infraestructura con capacidad de 100kW cuesta $200,000-300,000 por rack pero proporciona margen para el crecimiento futuro.¹³ Modernizar instalaciones existentes para densidad de 40kW cuesta $50,000-100,000 por rack.¹⁴ La escala de inversión requiere una planificación cuidadosa de capacidad.
Requisitos estructurales para implementaciones densas
La capacidad de peso se vuelve crítica a medida que los servidores GPU exceden la masa tradicional de servidores. Los servidores de IA contienen componentes más densos, disipadores de calor más grandes y hardware de refrigeración líquida que los racks heredados no pueden soportar de manera segura.
La capacidad de peso estático debe acomodar configuraciones completamente cargadas. Eaton lanzó gabinetes Heavy-Duty SmartRack en octubre de 2024 específicamente para IA, con capacidad de peso estático de hasta 2,268 kg (5,000 lbs).¹⁵ La profundidad extendida de 137 cm (54 pulgadas) acomoda servidores de IA más grandes comunes en implementaciones GPU.¹⁶ Los racks estándar diseñados para cargas de 900-1,360 kg requieren evaluación antes de la implementación de servidores de IA.
La carga del piso exige evaluación de las instalaciones. El peso del CDU cuando está lleno puede alcanzar 3 toneladas, requiriendo capacidad de carga de piso de 800kg/m².¹⁷ Combinado con el peso del servidor y la infraestructura de refrigeración líquida, la carga total del piso puede exceder las especificaciones tradicionales del centro de datos.
La profundidad del rack se extiende más allá de las dimensiones estándar. Los servidores NVIDIA HGX y plataformas similares requieren gabinetes más profundos de lo que proporcionan los racks de profundidad estándar de 107 cm (42 pulgadas).¹⁸ La planificación para profundidad extendida afecta el espaciado de pasillos, el diseño de las instalaciones y el enrutamiento de cables.
La integración de gestión térmica afecta el diseño estructural. Los racks de alta potencia generan columnas de calor que requieren rutas de flujo de aire ininterrumpidas.¹⁹ NVIDIA recomienda colocar dos servidores en la parte inferior, un espacio vacío de 3-6U, luego dos servidores arriba para configuraciones optimizadas de refrigeración por aire.²⁰ La disposición del rack impacta directamente la efectividad de la refrigeración.
Requisitos de integración de refrigeración líquida
Los racks que sirven cargas de trabajo de IA deben acomodar infraestructura de refrigeración líquida que los gabinetes refrigerados por aire nunca anticiparon. La integración añade complejidad a la selección de rack y la planificación de instalaciones.
El soporte de placa fría requiere integración de colectores. La refrigeración directa al chip lleva el refrigerante a las fuentes de calor de CPU y GPU, removiendo 30-40kW por rack.²¹ Los racks deben proporcionar puntos de montaje, rutas de enrutamiento y contención de fugas para la distribución de fluidos dentro del gabinete.
El montaje de intercambiador de calor de puerta trasera permite refrigeración híbrida. Los sistemas RDHx se acoplan a la parte trasera del rack, removiendo hasta 120kW por rack en las últimas configuraciones.²² Las especificaciones estructurales del rack deben soportar el peso del RDHx y las conexiones de plomería.
La compatibilidad de inmersión permite las densidades más altas. La refrigeración por inmersión sumerge los sistemas en fluido dieléctrico, manejando 50-100kW mientras elimina ventiladores.²³ Algunas implementaciones usan tanques de inmersión a escala de rack en lugar de gabinetes tradicionales, requiriendo diferente planificación de instalaciones.
Las arquitecturas híbridas combinan enfoques de refrigeración. Un diseño común de 2025 involucra 70% refrigeración líquida y 30% refrigeración por aire, con el rack sirviendo como punto de integración.²⁴ Los racks deben acomodar ambas modalidades de refrigeración simultáneamente.
Las especificaciones de caudal determinan la capacidad de refrigeración. El estándar de la industria de 1.2 LPM/kW a temperatura de entrada de 45°C significa que un rack de 85kW requiere CDU e intercambiador de calor que soporten flujo de 102 LPM con enfriamiento a 45°C.²⁵ La plomería del rack no debe restringir los caudales requeridos.
Especificaciones OCP Open Rack
El Open Compute Project define estándares de rack optimizando para eficiencia a hiperescala. Los requisitos de cargas de trabajo de IA impulsan la evolución continua de especificaciones.
Open Rack V3 (ORV3) estableció la base. Meta definió y publicó la especificación base en 2022 con contribuciones de Google y Rittal.²⁶ El ancho de 53 cm (21 pulgadas) excede el estándar EIA de 48 cm (19 pulgadas), permitiendo un aumento significativo del flujo de aire.²⁷ Las especificaciones de estante de potencia, rectificador y respaldo de batería permiten distribución de energía integrada.
Open Rack Wide (ORW) aborda la IA de próxima generación. Meta introdujo las especificaciones ORW en OCP 2025 como un estándar de rack de doble ancho de código abierto optimizado para las demandas de potencia, refrigeración y serviciabilidad de los sistemas de IA de próxima generación.²⁸ La especificación representa un cambio fundamental hacia el diseño de centros de datos estandarizado, interoperable y escalable.²⁹
Las especificaciones Mt Diablo (Diablo 400) describen sidecars de rack de potencia para clústeres de IA. Coautoradas por Google, Meta y Microsoft, la especificación define racks de potencia desagregados que impulsan la entrega de energía más allá de las configuraciones tradicionales de 48V.³⁰ Delta Electronics debutó el ecosistema "AI Power Cube" de 800VDC desarrollado con NVIDIA para alimentar racks de IA a escala de 1.1MW.³¹
La especificación Clemente describe bandejas de cómputo que integran módulos de procesador host NVIDIA GB300 en factores de forma para los casos de uso de entrenamiento e inferencia de IA/ML de Meta.³² La especificación representa la primera implementación usando OCP ORv3 HPR con racks de potencia sidecar.
Las implementaciones de la industria demuestran el valor de las especificaciones. AMD anunció el sistema de referencia a escala de rack "Helios" construido sobre estándares abiertos ORW.³³ La preparación de Rittal para Open Rack V3 con refrigeración líquida directa aborda la disipación de calor de computación de alto rendimiento y tecnología de IA.³⁴
Soluciones de proveedores para implementaciones de rack de IA
Los principales proveedores de infraestructura lanzaron productos de rack específicos para IA a lo largo de 2024-2025.
Schneider Electric lanzó racks NetShelter de alta densidad en junio de 2025 seguido por nuevos sistemas de rack inspirados en OCP que soportan la arquitectura MGX de NVIDIA.³⁵ Los productos se integran con los portafolios de distribución de energía y refrigeración de Schneider.
Los gabinetes Eaton Heavy-Duty SmartRack apuntan a implementaciones de IA con capacidad de peso estático de 2,268 kg y profundidad extendida de 137 cm.³⁶ Las especificaciones abordan los servidores más grandes y pesados comunes en infraestructura GPU.
Supermicro ofrece soluciones de refrigeración líquida a escala de rack con hasta 100kW de potencia y refrigeración por rack, totalmente validadas a nivel de sistema, rack y clúster con tiempos de entrega acelerados.³⁷ Las soluciones se integran con el portafolio de servidores GPU de Supermicro.
Rittal proporciona racks compatibles con OCP ORV3 con preparación para refrigeración líquida que aborda los requisitos de disipación de calor de tecnología de IA.³⁸ Los productos soportan integración de refrigeración líquida directa.
Legrand logró un aumento de ingresos del 24% de su portafolio de infraestructura de centros de datos enfocado en IA en H1 2025, realizando siete adquisiciones que añadieron €500M en ingresos anualizados.³⁹ Los ingresos de centros de datos de la empresa proyectan exceder €2B en 2025.⁴⁰
Consideraciones de infraestructura de red
Los clústeres de IA requieren cinco veces más densidad de infraestructura de fibra que los centros de datos convencionales.⁴¹ La selección de rack debe acomodar la densidad de cables que demandan las redes de IA.
El cableado de InfiniBand y Ethernet de alta velocidad requiere capacidad de enrutamiento. Los clústeres de IA dependen de redes de ancho de banda ultra alto y baja latencia (Ethernet de 400Gbps+ o InfiniBand XDR) para sincronizar GPUs entre servidores.⁴² La estructura de red se asemeja al diseño de supercomputadoras con 4-5x más interconexiones de fibra por rack.⁴³
La integración de gestión de cables afecta la selección de rack. Los accesorios estándar de gestión de cables diseñados para 10-20 cables por rack no pueden acomodar los cientos de conexiones de alta velocidad que requieren las redes de IA. Evalúe la capacidad de gestión de cables del rack antes de la adquisición.
El enrutamiento aéreo versus bajo piso impacta el posicionamiento del rack. Las densidades de cables de IA pueden exceder la capacidad tradicional del piso elevado, impulsando la adopción de gestión de cables aérea. La altura del rack debe acomodar el enrutamiento aéreo mientras mantiene la serviciabilidad.
Planificación para el crecimiento de densidad
Las organizaciones que implementan infraestructura de IA deberían dimensionar las inversiones en rack para el crecimiento esperado en lugar de los requisitos actuales.
El conocimiento de la hoja de ruta de GPU informa la planificación de capacidad. La progresión de NVIDIA desde H100 (700W) a Blackwell (1000W+) a Rubin (mayor) continúa la escalada de densidad. Los racks implementados para GPUs actuales deberían acomodar los requisitos de potencia de próxima generación.
La distribución de energía modular permite aumentos incrementales de capacidad. PDU por rack versus distribución por busway afecta cómo escala la capacidad. Planifique la arquitectura de energía junto con la selección de rack.
El margen de refrigeración previene cómputo varado. Los racks con capacidad de refrigeración líquida incluso para implementaciones iniciales refrigeradas por aire permiten la transición a medida que aumentan las densidades. El costo incremental resulta menor comparado con el reemplazo de rack.
La eficiencia del espacio de piso se compone a escala. Los racks de mayor densidad reducen el conteo total de racks para capacidad de cómputo equivalente. Menos racks significan menos espacio de piso, recorridos de cable más cortos y potencialmente instalaciones más pequeñas.
Los equipos de ingeniería global de Introl implementan infraestructura de rack de alta densidad para instalaciones de IA en 257 ubicaciones, desde implementaciones iniciales de servidores GPU hasta instalaciones de 100,000 aceleradores. La selección de rack impacta directamente la eficiencia de las instalaciones y la capacidad para futuras generaciones de GPU.
La base de infraestructura
Los racks representan la base física para las inversiones en infraestructura de IA. El gabinete que aloja $3.9 millones en servidores GPU y equipos de red debe soportar esa inversión de manera segura mientras permite la entrega de energía y la infraestructura de refrigeración que esos sistemas requieren.