CXL 4.0 y las Guerras de Interconexión: Cómo la Memoria de IA Está Transformando la Arquitectura de Centros de Datos

Especificación CXL 4.0 lanzada el 18 de noviembre con PCIe 7.0, 128 GT/s, puertos agrupados. Panmnesia envía el primer switch de fabric CXL 3.2. UALink, Ultra Ethernet y UB-Mesh de Huawei compiten.

CXL 4.0 y las Guerras de Interconexión: Cómo la Memoria de IA Está Transformando la Arquitectura de Centros de Datos

CXL 4.0 y las Guerras de Interconexión: Cómo la Memoria de IA Está Transformando la Arquitectura de Centros de Datos

12 de diciembre de 2025

Actualización de diciembre de 2025: El Consorcio CXL lanzó CXL 4.0 el 18 de noviembre, duplicando el ancho de banda a 128 GT/s con PCIe 7.0 e introduciendo puertos agrupados para conexiones de 1,5 TB/s. Panmnesia comenzó a enviar muestras del primer switch de fabric CXL 3.2 de la industria con enrutamiento basado en puertos. Mientras tanto, UALink apunta a implementación a finales de 2026 y Huawei publicó UB-Mesh como código abierto como alternativa.


Resumen

CXL 4.0 representa la próxima generación de tecnología de interconexión de memoria, permitiendo más de 100 terabytes de memoria agrupada con coherencia de caché en toda la infraestructura de IA. La función de puertos agrupados de la especificación permite agregar múltiples puertos físicos en conexiones lógicas únicas que entregan 1,5 TB/s de ancho de banda total. El switch de fabric CXL 3.2 de Panmnesia marca el primer hardware que implementa enrutamiento basado en puertos para clústeres de IA multi-rack. El panorama más amplio de interconexión se fragmenta aún más mientras UALink, Ultra Ethernet y UB-Mesh de Huawei compiten por diferentes nichos.


Qué Sucedió

El Consorcio CXL lanzó la especificación Compute Express Link 4.0 el 18 de noviembre de 2025, en SC25.1 La especificación cambia de PCIe 6.x (64 GT/s) a PCIe 7.0 (128 GT/s), duplicando el ancho de banda disponible mientras mantiene el formato FLIT de 256 bytes introducido con CXL 3.x.2

"El lanzamiento de la especificación CXL 4.0 establece un nuevo hito para avanzar en la conectividad de memoria coherente, duplicando el ancho de banda sobre la generación anterior con potentes nuevas funcionalidades," declaró Derek Rohde, Presidente del Consorcio CXL e Ingeniero Principal en NVIDIA.3

Cuatro días antes, el 12 de noviembre, la startup coreana Panmnesia anunció la disponibilidad de muestras de su Switch de Fabric PCIe 6.0/CXL 3.2: el primer silicio que implementa enrutamiento basado en puertos (PBR) para fabrics CXL.4

El panorama de interconexión continúa fragmentándose. UALink apunta a implementación en centros de datos a finales de 2026. Huawei anunció que publicará como código abierto su protocolo UB-Mesh, diseñado para reemplazar PCIe, CXL, NVLink y TCP/IP con un estándar unificado.5


Por Qué Importa para la Infraestructura

La Memoria Se Vuelve Componible: CXL 4.0 permite el agrupamiento de memoria a escala. Las cargas de trabajo de inferencia de IA que requieren cientos de terabytes ahora pueden acceder a pools de memoria compartida a través de racks con coherencia de caché, no solo dentro de un único servidor.

El Ancho de Banda Coincide con la Demanda de IA: Un puerto agrupado CXL 4.0 con enlaces x16 a 128 GT/s entrega 768 GB/s en cada dirección (1,536 TB/s de ancho de banda total entre dispositivo y CPU).6 El servicio de inferencia de LLM se beneficia directamente de esta capacidad.

Clústeres de IA Multi-Rack: El enrutamiento basado en puertos en CXL 3.2/4.0 permite que los switches de fabric interconecten miles de dispositivos a través de múltiples racks sin incurrir en latencia de red larga. Panmnesia afirma "latencia de dos dígitos en nanosegundos" para acceso a memoria.7

Riesgo de Fragmentación de Estándares: Cuatro ecosistemas de interconexión competidores (CXL/PCIe, UALink, Ultra Ethernet, NVLink) obligan a los planificadores de infraestructura a apostar por ganadores. El equipo comprado hoy puede enfrentar desafíos de interoperabilidad en 2027.


Detalles Técnicos

Especificación CXL 4.0

Característica CXL 3.x CXL 4.0
Protocolo Base PCIe 6.x PCIe 7.0
Velocidad de Transferencia 64 GT/s 128 GT/s
Tamaño de FLIT 256B 256B
Repetidores Soportados 2 4
Opciones de Ancho de Enlace Estándar x2 nativo añadido
Puertos Agrupados No

Arquitectura de Puertos Agrupados

Los puertos agrupados de CXL 4.0 agregan múltiples puertos físicos de dispositivos CXL en una única entidad lógica:8

  • Host y dispositivos Tipo 1/2 pueden combinar múltiples puertos físicos
  • El software del sistema ve un único dispositivo a pesar de múltiples conexiones físicas
  • Optimizado para Modo FLIT de 256B, eliminando la sobrecarga del FLIT heredado de 68B
  • Permite más de 1,5 TB/s de ancho de banda total por conexión lógica

Switch de Fabric CXL 3.2 de Panmnesia

El primer silicio de switch CXL 3.2 incluye:9

Especificación Detalle
Soporte de Protocolo Híbrido PCIe Gen 6.0 + CXL 3.2
Velocidad de Datos 64 GT/s
Modos de Enrutamiento PBR (basado en puertos) y HBR (basado en jerarquía)
Subprotocolos CXL CXL.cache, CXL.mem, CXL.io
Conteo de Carriles 256 carriles de alto fan-out
Latencia Nanosegundos de dos dígitos
Compatibilidad hacia Atrás Todas las generaciones previas de PCIe/CXL

Las aplicaciones objetivo incluyen DLRM (Modelos de Recomendación de Deep Learning), inferencia de LLM, cargas de trabajo RAG y simulaciones HPC basadas en MPI.

Estándares de Interconexión Competidores

Estándar Propietario Propósito Ancho de Banda Escala Cronograma
CXL 4.0 Consorcio Coherencia de memoria 128 GT/s Multi-rack Finales 2026-2027
NVLink 5 NVIDIA GPU-GPU 1,8 TB/s 576 GPUs Disponible
UALink 1.0 Consorcio liderado por AMD Acelerador-acelerador 200 Gb/s/carril 1.024 dispositivos Finales 2026
Ultra Ethernet UEC Redes scale-out Basado en Ethernet 10.000+ endpoints 2026+
UB-Mesh Huawei Interconexión unificada 1+ TB/s/dispositivo 1M procesadores Código abierto

Marco de Decisión de Interconexión

Cuándo usar cada estándar:

Caso de Uso Mejor Opción Por Qué
GPU-a-GPU dentro del nodo NVLink Mayor ancho de banda (1,8 TB/s), menor latencia
GPU-a-GPU entre nodos UALink Alternativa de estándar abierto a NVLink
Expansión de memoria CXL Coherencia de caché con CPU, agrupamiento de memoria
Redes scale-out Ultra Ethernet / InfiniBand Diseñado para clústeres de 10.000+ endpoints
Ecosistema unificado de China UB-Mesh Evita restricciones de PI occidental

UALink no compite directamente con CXL. Sirven propósitos diferentes:10

  • UALink: Escalamiento GPU-a-GPU para clústeres de aceleradores (scale-up)
  • CXL: Coherencia CPU-memoria y agrupamiento de memoria (expansión de memoria)
  • Ultra Ethernet: Redes scale-out a través de centros de datos

"UALink funciona junto con PCIe y CXL, pero solo UALink tiene el efecto de unificar los recursos asignados. UALink está diseñado para conectar sus unidades GPU principales para escalamiento GPU-a-GPU," explicó Michael Posner, VP de Gestión de Productos en Synopsys.11

UB-Mesh de Huawei

El enfoque alternativo de Huawei apunta a reemplazar todas las interconexiones existentes:12

  • Apunta a más de 1 TB/s de ancho de banda por dispositivo
  • ~150 ns de latencia por salto (mejora de microsegundos a nanosegundos)
  • Semántica de carga/almacenamiento síncrona vs. basada en paquetes
  • Licencia de código abierto anunciada en septiembre de 2025
  • Escala hasta 1 millón de procesadores en arquitectura "SuperNode"

La adopción de la industria permanece incierta dado las preocupaciones geopolíticas y el impulso de los estándares existentes.


Qué Sigue

Finales de 2026: Los switches UALink llegan a los centros de datos; los productos CXL 4.0 comienzan a enviarse como muestras.

Finales de 2026-2027: Los sistemas multi-rack CXL 4.0 alcanzan implementación de producción.13

Q4 2026: Upscale AI apunta a la entrega de switches UALink.14

En curso: Los organismos de estándares navegan la coexistencia de CXL, UALink y Ultra Ethernet. El UB-Mesh de Huawei busca adopción fuera de los mercados occidentales.

El panorama de interconexión permanecerá fragmentado hasta al menos 2027. Ningún estándar único aborda todos los casos de uso: agrupamiento de memoria (CXL), escalamiento de aceleradores (UALink/NVLink) y fabric de red (Ultra Ethernet/InfiniBand).


Puntos Clave

Para planificadores de infraestructura: - CXL 4.0 permite pools de memoria de más de 100 TB con coherencia de caché entre racks - Panmnesia está enviando muestras del primer switch de fabric CXL 3.2 con enrutamiento basado en puertos - Planifique para coexistencia de estándares: CXL + UALink + Ultra Ethernet/InfiniBand - Cronograma de implementación de finales de 2026-2027 para sistemas de producción CXL 4.0

Para equipos de operaciones: - CXL mantiene compatibilidad hacia atrás con generaciones anteriores - El enrutamiento basado en puertos simplifica la gestión de fabric multi-rack - Latencia de nanosegundos de dos dígitos para acceso a memoria a través de switches - Monitoree a Panmnesia, XConn y otros proveedores de switches CXL para disponibilidad

Para planificación estratégica: - Ningún estándar de interconexión único "ganará" porque diferentes capas sirven propósitos diferentes - El agrupamiento de memoria se vuelve viable para inferencia de IA a escala - El UB-Mesh de Huawei crea un ecosistema paralelo principalmente para el mercado chino - Las decisiones de equipamiento en 2025-2026 afectarán la interoperabilidad hasta 2030


Referencias


Para implementación de infraestructura de IA con arquitecturas de interconexión avanzadas, contacte a Introl.


  1. CXL Consortium. "CXL Consortium Releases the Compute Express Link 4.0 Specification." 18 de noviembre de 2025. 

  2. VideoCardz. "CXL 4.0 spec moves to PCIe 7.0, doubles bandwidth over CXL 3.0." Noviembre de 2025. 

  3. Business Wire. "CXL Consortium Releases the Compute Express Link 4.0 Specification Increasing Speed and Bandwidth." 18 de noviembre de 2025. 

  4. Business Wire. "Panmnesia Announces Sample Availability of PCIe 6.0/CXL 3.2 Fabric Switch." 12 de noviembre de 2025. 

  5. Tom's Hardware. "Huawei to open-source its UB-Mesh data center-scale interconnect soon." Agosto de 2025. 

  6. Datacenter.news. "CXL 4.0 doubles bandwidth, introduces bundled ports for data centres." Noviembre de 2025. 

  7. Panmnesia. "Press Release: PCIe 6.0/CXL 3.2 Fabric Switch." Noviembre de 2025. 

  8. Blocks and Files. "CXL 4.0 doubles bandwidth and stretches memory pooling to multi-rack setups." 24 de noviembre de 2025. 

  9. TechPowerUp. "Panmnesia Samples Industry's First PCIe 6.0/CXL 3.2 Fabric Switch." Noviembre de 2025. 

  10. Semi Engineering. "New Data Center Protocols Tackle AI." 2025. 

  11. Synopsys. "Ultra Ethernet UaLink AI Networks." 2025. 

  12. ServeTheHome. "Huawei Presents UB-Mesh Interconnect for Large AI SuperNodes at Hot Chips 2025." Agosto de 2025. 

  13. Blocks and Files. "CXL 4.0 doubles bandwidth." Noviembre de 2025. 

  14. HPCwire. "Upscale AI Eyes Late 2026 for Scale-Up UALink Switch." 2 de diciembre de 2025. 

  15. EE Times. "CXL Adds Port Bundling to Quench AI Thirst." Noviembre de 2025. 

  16. SDxCentral. "Compute Express Link Consortium debuts 4.0 spec to push past bandwidth bottlenecks." Noviembre de 2025. 

  17. CXL Consortium. "CXL 4.0 White Paper." Noviembre de 2025. 

Request a Quote_

Tell us about your project and we'll respond within 72 hours.

> TRANSMISSION_COMPLETE

Request Received_

Thank you for your inquiry. Our team will review your request and respond within 72 hours.

QUEUED FOR PROCESSING