CXL 4.0 y las Guerras de Interconexión: Cómo la Memoria para IA Está Transformando la Arquitectura de los Centros de Datos

Especificación CXL 4.0 publicada el 18 de noviembre con PCIe 7.0, 128 GT/s, puertos agrupados. Panmnesia envía el primer switch de fabric CXL 3.2. UALink, Ultra Ethernet y UB-Mesh de Huawei compiten.

Blake Crosley

Dec 12, 2025 8 min read Disclaimer

CXL 4.0 y las Guerras de Interconexión: Cómo la Memoria para IA Está Transformando la Arquitectura de los Centros de Datos

12 de diciembre de 2025

Actualización de diciembre de 2025: El Consorcio CXL publicó CXL 4.0 el 18 de noviembre, duplicando el ancho de banda a 128 GT/s con PCIe 7.0 e introduciendo puertos agrupados para conexiones de 1,5 TB/s. Panmnesia comenzó a enviar muestras del primer switch de fabric CXL 3.2 de la industria con enrutamiento basado en puertos. Mientras tanto, UALink apunta a un despliegue a finales de 2026 y Huawei liberó UB-Mesh como código abierto como alternativa.

Resumen Ejecutivo

CXL 4.0 representa la próxima generación de tecnología de interconexión de memoria, permitiendo más de 100 terabytes de memoria compartida con coherencia de caché en toda la infraestructura de IA. La función de puertos agrupados de la especificación permite agregar múltiples puertos físicos en conexiones lógicas únicas que entregan 1,5 TB/s de ancho de banda total. El switch de fabric CXL 3.2 de Panmnesia marca el primer hardware que implementa enrutamiento basado en puertos para clústeres de IA multi-rack. El panorama más amplio de interconexiones se fragmenta aún más mientras UALink, Ultra Ethernet y UB-Mesh de Huawei compiten por diferentes nichos.

Qué Sucedió

El Consorcio CXL publicó la especificación Compute Express Link 4.0 el 18 de noviembre de 2025, en SC25.¹ La especificación cambia de PCIe 6.x (64 GT/s) a PCIe 7.0 (128 GT/s), duplicando el ancho de banda disponible mientras mantiene el formato FLIT de 256 bytes introducido con CXL 3.x.²

"La publicación de la especificación CXL 4.0 establece un nuevo hito para avanzar en la conectividad de memoria coherente, duplicando el ancho de banda sobre la generación anterior con potentes nuevas características," declaró Derek Rohde, Presidente del Consorcio CXL e Ingeniero Principal en NVIDIA.³

Cuatro días antes, el 12 de noviembre, la startup coreana Panmnesia anunció la disponibilidad de muestras de su Switch de Fabric PCIe 6.0/CXL 3.2: el primer silicio que implementa enrutamiento basado en puertos (PBR) para fabrics CXL.⁴

El panorama de interconexiones continúa fragmentándose. UALink apunta al despliegue en centros de datos a finales de 2026. Huawei anunció que liberará su protocolo UB-Mesh como código abierto, diseñado para reemplazar PCIe, CXL, NVLink y TCP/IP con un estándar unificado.⁵

Por Qué Importa para la Infraestructura

La Memoria Se Vuelve Componible: CXL 4.0 habilita la agrupación de memoria a escala. Las cargas de trabajo de inferencia de IA que requieren cientos de terabytes ahora pueden acceder a pools de memoria compartida entre racks con coherencia de caché, no solo dentro de un único servidor.

El Ancho de Banda Iguala la Demanda de IA: Un puerto agrupado CXL 4.0 con enlaces x16 a 128 GT/s entrega 768 GB/s en cada dirección (1,536 TB/s de ancho de banda total entre dispositivo y CPU).⁶ El servicio de inferencia de LLM se beneficia directamente de esta capacidad.

Clústeres de IA Multi-Rack: El enrutamiento basado en puertos en CXL 3.2/4.0 permite que los switches de fabric interconecten miles de dispositivos a través de múltiples racks sin incurrir en latencias largas de red. Panmnesia afirma "latencia de nanosegundos de dos dígitos" para el acceso a memoria.⁷

Riesgo de Fragmentación de Estándares: Cuatro ecosistemas de interconexión en competencia (CXL/PCIe, UALink, Ultra Ethernet, NVLink) obligan a los planificadores de infraestructura a apostar por ganadores. El equipamiento comprado hoy puede enfrentar desafíos de interoperabilidad en 2027.

Detalles Técnicos

Especificación CXL 4.0

Característica	CXL 3.x	CXL 4.0
Protocolo Base	PCIe 6.x	PCIe 7.0
Velocidad de Transferencia	64 GT/s	128 GT/s
Tamaño FLIT	256B	256B
Retimers Soportados	2	4
Opciones de Ancho de Enlace	Estándar	x2 nativo añadido
Puertos Agrupados	No	Sí

Arquitectura de Puertos Agrupados

Los puertos agrupados de CXL 4.0 agregan múltiples puertos físicos de dispositivos CXL en una única entidad lógica:⁸

Host y dispositivos Tipo 1/2 pueden combinar múltiples puertos físicos
El software del sistema ve un único dispositivo a pesar de múltiples conexiones físicas
Optimizado para Modo Flit de 256B, eliminando la sobrecarga del Flit heredado de 68B
Habilita más de 1,5 TB/s de ancho de banda total por conexión lógica

Switch de Fabric CXL 3.2 de Panmnesia

El primer silicio de switch CXL 3.2 incluye:⁹

Especificación	Detalle
Soporte de Protocolo	Híbrido PCIe Gen 6.0 + CXL 3.2
Tasa de Datos	64 GT/s
Modos de Enrutamiento	PBR (basado en puertos) y HBR (basado en jerarquía)
Subprotocolos CXL	CXL.cache, CXL.mem, CXL.io
Conteo de Lanes	256 lanes con alto fan-out
Latencia	Nanosegundos de dos dígitos
Compatibilidad Retroactiva	Todas las generaciones anteriores de PCIe/CXL

Las aplicaciones objetivo incluyen DLRM (Modelos de Recomendación de Deep Learning), inferencia de LLM, cargas de trabajo RAG y simulaciones HPC basadas en MPI.

Estándares de Interconexión en Competencia

Estándar	Propietario	Propósito	Ancho de Banda	Escala	Cronograma
CXL 4.0	Consorcio	Coherencia de memoria	128 GT/s	Multi-rack	Finales 2026-2027
NVLink 5	NVIDIA	GPU-GPU	1,8 TB/s	576 GPUs	Disponible
UALink 1.0	Consorcio liderado por AMD	Acelerador-acelerador	200 Gb/s/lane	1.024 dispositivos	Finales 2026
Ultra Ethernet	UEC	Redes de escalado horizontal	Basado en Ethernet	10.000+ endpoints	2026+
UB-Mesh	Huawei	Interconexión unificada	1+ TB/s/dispositivo	1M procesadores	Código abierto

Marco de Decisión de Interconexión

Cuándo usar qué estándar:

Caso de Uso	Mejor Opción	Por Qué
GPU-a-GPU dentro del nodo	NVLink	Mayor ancho de banda (1,8 TB/s), menor latencia
GPU-a-GPU entre nodos	UALink	Alternativa de estándar abierto a NVLink
Expansión de memoria	CXL	Coherencia de caché con CPU, agrupación de memoria
Redes de escalado horizontal	Ultra Ethernet / InfiniBand	Diseñado para clústeres de 10.000+ endpoints
Ecosistema unificado de China	UB-Mesh	Evita restricciones de IP occidentales

Posicionamiento de UALink vs. CXL

UALink no compite directamente con CXL. Sirven propósitos diferentes:¹⁰

UALink: Escalado GPU-a-GPU para clústeres de aceleradores (scale-up)
CXL: Coherencia CPU-memoria y agrupación de memoria (expansión de memoria)
Ultra Ethernet: Redes de escalado horizontal a través de centros de datos

"UALink trabaja junto con PCIe y CXL, pero solo UALink tiene el efecto de unificar los recursos asignados. UALink está diseñado para conectar tus unidades GPU principales para escalado GPU-a-GPU," explicó Michael Posner, VP de Gestión de Producto en Synopsys.¹¹

UB-Mesh de Huawei

El enfoque alternativo de Huawei busca reemplazar todas las interconexiones existentes:¹²

Objetivo de más de 1 TB/s de ancho de banda por dispositivo
~150 ns de latencia por salto (mejora de microsegundos a nanosegundos)
Semántica síncrona load/store vs. basada en paquetes
Licencia de código abierto anunciada en septiembre de 2025
Escala a 1 millón de procesadores en arquitectura "SuperNode"

La adopción de la industria permanece incierta dadas las preocupaciones geopolíticas y el impulso de los estándares existentes.

Qué Viene Después

Finales de 2026: Los switches UALink llegan a los centros de datos; los productos CXL 4.0 comienzan el muestreo.

Finales de 2026-2027: Los sistemas multi-rack CXL 4.0 alcanzan despliegue en producción.¹³

Q4 2026: Upscale AI apunta a la entrega de switches UALink.¹⁴

En curso: Los organismos de estándares navegan la coexistencia de CXL, UALink y Ultra Ethernet. El UB-Mesh de Huawei busca adopción fuera de los mercados occidentales.

El panorama de interconexiones permanecerá fragmentado al menos hasta 2027. Ningún estándar único aborda todos los casos de uso: agrupación de memoria (CXL), escalado de aceleradores (UALink/NVLink) y fabric de red (Ultra Ethernet/InfiniBand).

Conclusiones Clave

Para planificadores de infraestructura: - CXL 4.0 habilita pools de memoria de más de 100 TB con coherencia de caché entre racks - Panmnesia está muestreando el primer switch de fabric CXL 3.2 con enrutamiento basado en puertos - Planificar para la coexistencia de estándares: CXL + UALink + Ultra Ethernet/InfiniBand - Cronograma de despliegue para sistemas de producción CXL 4.0: finales de 2026-2027

Para equipos de operaciones: - CXL mantiene compatibilidad retroactiva con generaciones anteriores - El enrutamiento basado en puertos simplifica la gestión de fabric multi-rack - Latencia de nanosegundos de dos dígitos para acceso a memoria a través de switches - Monitorear a Panmnesia, XConn y otros proveedores de switches CXL para disponibilidad

Para planificación estratégica: - Ningún estándar de interconexión único "ganará" porque diferentes capas sirven propósitos diferentes - La agrupación de memoria se vuelve viable para inferencia de IA a escala - El UB-Mesh de Huawei crea un ecosistema paralelo principalmente para el mercado chino - Las decisiones de equipamiento en 2025-2026 afectarán la interoperabilidad hasta 2030

Referencias

Para despliegue de infraestructura de IA con arquitecturas de interconexión avanzadas, contacte a Introl.

CXL Consortium. "CXL Consortium Releases the Compute Express Link 4.0 Specification." 18 de noviembre de 2025. ↩
VideoCardz. "CXL 4.0 spec moves to PCIe 7.0, doubles bandwidth over CXL 3.0." Noviembre de 2025. ↩
Business Wire. "CXL Consortium Releases the Compute Express Link 4.0 Specification Increasing Speed and Bandwidth." 18 de noviembre de 2025. ↩
Business Wire. "Panmnesia Announces Sample Availability of PCIe 6.0/CXL 3.2 Fabric Switch." 12 de noviembre de 2025. ↩
Tom's Hardware. "Huawei to open-source its UB-Mesh data center-scale interconnect soon." Agosto de 2025. ↩
Datacenter.news. "CXL 4.0 doubles bandwidth, introduces bundled ports for data centres." Noviembre de 2025. ↩
Panmnesia. "Press Release: PCIe 6.0/CXL 3.2 Fabric Switch." Noviembre de 2025. ↩
Blocks and Files. "CXL 4.0 doubles bandwidth and stretches memory pooling to multi-rack setups." 24 de noviembre de 2025. ↩
TechPowerUp. "Panmnesia Samples Industry's First PCIe 6.0/CXL 3.2 Fabric Switch." Noviembre de 2025. ↩
Semi Engineering. "New Data Center Protocols Tackle AI." 2025. ↩
Synopsys. "Ultra Ethernet UaLink AI Networks." 2025. ↩
ServeTheHome. "Huawei Presents UB-Mesh Interconnect for Large AI SuperNodes at Hot Chips 2025." Agosto de 2025. ↩
Blocks and Files. "CXL 4.0 doubles bandwidth." Noviembre de 2025. ↩
HPCwire. "Upscale AI Eyes Late 2026 for Scale-Up UALink Switch." 2 de diciembre de 2025. ↩
EE Times. "CXL Adds Port Bundling to Quench AI Thirst." Noviembre de 2025. ↩
SDxCentral. "Compute Express Link Consortium debuts 4.0 spec to push past bandwidth bottlenecks." Noviembre de 2025. ↩
CXL Consortium. "CXL 4.0 White Paper." Noviembre de 2025. ↩

CXL 4.0 y las Guerras de Interconexión: Cómo la Memoria para IA Está Transformando la Arquitectura de los Centros de Datos

Resumen Ejecutivo

Qué Sucedió

Por Qué Importa para la Infraestructura

Detalles Técnicos

Especificación CXL 4.0

Arquitectura de Puertos Agrupados

Switch de Fabric CXL 3.2 de Panmnesia

Estándares de Interconexión en Competencia

Marco de Decisión de Interconexión

Posicionamiento de UALink vs. CXL

UB-Mesh de Huawei

Qué Viene Después

Conclusiones Clave

Referencias

You Might Also Like

Malasia y Tailandia: Centros Emergentes de Data Centers de I...

El Auge de $27B en Infraestructura de IA de Singapur: Oportu...

Backup y Recuperación para AI: Protegiendo Datos de Entrenam...

Solicitar Cotización_

Solicitud Recibida_