CXL 4.0 y las Guerras de Interconexión: Cómo la Memoria para IA Está Transformando la Arquitectura de los Centros de Datos

Especificación CXL 4.0 publicada el 18 de noviembre con PCIe 7.0, 128 GT/s, puertos agrupados. Panmnesia envía el primer switch de fabric CXL 3.2. UALink, Ultra Ethernet y UB-Mesh de Huawei compiten.

CXL 4.0 y las Guerras de Interconexión: Cómo la Memoria para IA Está Transformando la Arquitectura de los Centros de Datos

CXL 4.0 y las Guerras de Interconexión: Cómo la Memoria para IA Está Transformando la Arquitectura de los Centros de Datos

12 de diciembre de 2025

Actualización de diciembre de 2025: El Consorcio CXL publicó CXL 4.0 el 18 de noviembre, duplicando el ancho de banda a 128 GT/s con PCIe 7.0 e introduciendo puertos agrupados para conexiones de 1,5 TB/s. Panmnesia comenzó a enviar muestras del primer switch de fabric CXL 3.2 de la industria con enrutamiento basado en puertos. Mientras tanto, UALink apunta a un despliegue a finales de 2026 y Huawei liberó UB-Mesh como código abierto como alternativa.


Resumen Ejecutivo

CXL 4.0 representa la próxima generación de tecnología de interconexión de memoria, permitiendo más de 100 terabytes de memoria compartida con coherencia de caché en toda la infraestructura de IA. La función de puertos agrupados de la especificación permite agregar múltiples puertos físicos en conexiones lógicas únicas que entregan 1,5 TB/s de ancho de banda total. El switch de fabric CXL 3.2 de Panmnesia marca el primer hardware que implementa enrutamiento basado en puertos para clústeres de IA multi-rack. El panorama más amplio de interconexiones se fragmenta aún más mientras UALink, Ultra Ethernet y UB-Mesh de Huawei compiten por diferentes nichos.


Qué Sucedió

El Consorcio CXL publicó la especificación Compute Express Link 4.0 el 18 de noviembre de 2025, en SC25.1 La especificación cambia de PCIe 6.x (64 GT/s) a PCIe 7.0 (128 GT/s), duplicando el ancho de banda disponible mientras mantiene el formato FLIT de 256 bytes introducido con CXL 3.x.2

"La publicación de la especificación CXL 4.0 establece un nuevo hito para avanzar en la conectividad de memoria coherente, duplicando el ancho de banda sobre la generación anterior con potentes nuevas características," declaró Derek Rohde, Presidente del Consorcio CXL e Ingeniero Principal en NVIDIA.3

Cuatro días antes, el 12 de noviembre, la startup coreana Panmnesia anunció la disponibilidad de muestras de su Switch de Fabric PCIe 6.0/CXL 3.2: el primer silicio que implementa enrutamiento basado en puertos (PBR) para fabrics CXL.4

El panorama de interconexiones continúa fragmentándose. UALink apunta al despliegue en centros de datos a finales de 2026. Huawei anunció que liberará su protocolo UB-Mesh como código abierto, diseñado para reemplazar PCIe, CXL, NVLink y TCP/IP con un estándar unificado.5


Por Qué Importa para la Infraestructura

La Memoria Se Vuelve Componible: CXL 4.0 habilita la agrupación de memoria a escala. Las cargas de trabajo de inferencia de IA que requieren cientos de terabytes ahora pueden acceder a pools de memoria compartida entre racks con coherencia de caché, no solo dentro de un único servidor.

El Ancho de Banda Iguala la Demanda de IA: Un puerto agrupado CXL 4.0 con enlaces x16 a 128 GT/s entrega 768 GB/s en cada dirección (1,536 TB/s de ancho de banda total entre dispositivo y CPU).6 El servicio de inferencia de LLM se beneficia directamente de esta capacidad.

Clústeres de IA Multi-Rack: El enrutamiento basado en puertos en CXL 3.2/4.0 permite que los switches de fabric interconecten miles de dispositivos a través de múltiples racks sin incurrir en latencias largas de red. Panmnesia afirma "latencia de nanosegundos de dos dígitos" para el acceso a memoria.7

Riesgo de Fragmentación de Estándares: Cuatro ecosistemas de interconexión en competencia (CXL/PCIe, UALink, Ultra Ethernet, NVLink) obligan a los planificadores de infraestructura a apostar por ganadores. El equipamiento comprado hoy puede enfrentar desafíos de interoperabilidad en 2027.


Detalles Técnicos

Especificación CXL 4.0

Característica CXL 3.x CXL 4.0
Protocolo Base PCIe 6.x PCIe 7.0
Velocidad de Transferencia 64 GT/s 128 GT/s
Tamaño FLIT 256B 256B
Retimers Soportados 2 4
Opciones de Ancho de Enlace Estándar x2 nativo añadido
Puertos Agrupados No

Arquitectura de Puertos Agrupados

Los puertos agrupados de CXL 4.0 agregan múltiples puertos físicos de dispositivos CXL en una única entidad lógica:8

  • Host y dispositivos Tipo 1/2 pueden combinar múltiples puertos físicos
  • El software del sistema ve un único dispositivo a pesar de múltiples conexiones físicas
  • Optimizado para Modo Flit de 256B, eliminando la sobrecarga del Flit heredado de 68B
  • Habilita más de 1,5 TB/s de ancho de banda total por conexión lógica

Switch de Fabric CXL 3.2 de Panmnesia

El primer silicio de switch CXL 3.2 incluye:9

Especificación Detalle
Soporte de Protocolo Híbrido PCIe Gen 6.0 + CXL 3.2
Tasa de Datos 64 GT/s
Modos de Enrutamiento PBR (basado en puertos) y HBR (basado en jerarquía)
Subprotocolos CXL CXL.cache, CXL.mem, CXL.io
Conteo de Lanes 256 lanes con alto fan-out
Latencia Nanosegundos de dos dígitos
Compatibilidad Retroactiva Todas las generaciones anteriores de PCIe/CXL

Las aplicaciones objetivo incluyen DLRM (Modelos de Recomendación de Deep Learning), inferencia de LLM, cargas de trabajo RAG y simulaciones HPC basadas en MPI.

Estándares de Interconexión en Competencia

Estándar Propietario Propósito Ancho de Banda Escala Cronograma
CXL 4.0 Consorcio Coherencia de memoria 128 GT/s Multi-rack Finales 2026-2027
NVLink 5 NVIDIA GPU-GPU 1,8 TB/s 576 GPUs Disponible
UALink 1.0 Consorcio liderado por AMD Acelerador-acelerador 200 Gb/s/lane 1.024 dispositivos Finales 2026
Ultra Ethernet UEC Redes de escalado horizontal Basado en Ethernet 10.000+ endpoints 2026+
UB-Mesh Huawei Interconexión unificada 1+ TB/s/dispositivo 1M procesadores Código abierto

Marco de Decisión de Interconexión

Cuándo usar qué estándar:

Caso de Uso Mejor Opción Por Qué
GPU-a-GPU dentro del nodo NVLink Mayor ancho de banda (1,8 TB/s), menor latencia
GPU-a-GPU entre nodos UALink Alternativa de estándar abierto a NVLink
Expansión de memoria CXL Coherencia de caché con CPU, agrupación de memoria
Redes de escalado horizontal Ultra Ethernet / InfiniBand Diseñado para clústeres de 10.000+ endpoints
Ecosistema unificado de China UB-Mesh Evita restricciones de IP occidentales

UALink no compite directamente con CXL. Sirven propósitos diferentes:10

  • UALink: Escalado GPU-a-GPU para clústeres de aceleradores (scale-up)
  • CXL: Coherencia CPU-memoria y agrupación de memoria (expansión de memoria)
  • Ultra Ethernet: Redes de escalado horizontal a través de centros de datos

"UALink trabaja junto con PCIe y CXL, pero solo UALink tiene el efecto de unificar los recursos asignados. UALink está diseñado para conectar tus unidades GPU principales para escalado GPU-a-GPU," explicó Michael Posner, VP de Gestión de Producto en Synopsys.11

UB-Mesh de Huawei

El enfoque alternativo de Huawei busca reemplazar todas las interconexiones existentes:12

  • Objetivo de más de 1 TB/s de ancho de banda por dispositivo
  • ~150 ns de latencia por salto (mejora de microsegundos a nanosegundos)
  • Semántica síncrona load/store vs. basada en paquetes
  • Licencia de código abierto anunciada en septiembre de 2025
  • Escala a 1 millón de procesadores en arquitectura "SuperNode"

La adopción de la industria permanece incierta dadas las preocupaciones geopolíticas y el impulso de los estándares existentes.


Qué Viene Después

Finales de 2026: Los switches UALink llegan a los centros de datos; los productos CXL 4.0 comienzan el muestreo.

Finales de 2026-2027: Los sistemas multi-rack CXL 4.0 alcanzan despliegue en producción.13

Q4 2026: Upscale AI apunta a la entrega de switches UALink.14

En curso: Los organismos de estándares navegan la coexistencia de CXL, UALink y Ultra Ethernet. El UB-Mesh de Huawei busca adopción fuera de los mercados occidentales.

El panorama de interconexiones permanecerá fragmentado al menos hasta 2027. Ningún estándar único aborda todos los casos de uso: agrupación de memoria (CXL), escalado de aceleradores (UALink/NVLink) y fabric de red (Ultra Ethernet/InfiniBand).


Conclusiones Clave

Para planificadores de infraestructura: - CXL 4.0 habilita pools de memoria de más de 100 TB con coherencia de caché entre racks - Panmnesia está muestreando el primer switch de fabric CXL 3.2 con enrutamiento basado en puertos - Planificar para la coexistencia de estándares: CXL + UALink + Ultra Ethernet/InfiniBand - Cronograma de despliegue para sistemas de producción CXL 4.0: finales de 2026-2027

Para equipos de operaciones: - CXL mantiene compatibilidad retroactiva con generaciones anteriores - El enrutamiento basado en puertos simplifica la gestión de fabric multi-rack - Latencia de nanosegundos de dos dígitos para acceso a memoria a través de switches - Monitorear a Panmnesia, XConn y otros proveedores de switches CXL para disponibilidad

Para planificación estratégica: - Ningún estándar de interconexión único "ganará" porque diferentes capas sirven propósitos diferentes - La agrupación de memoria se vuelve viable para inferencia de IA a escala - El UB-Mesh de Huawei crea un ecosistema paralelo principalmente para el mercado chino - Las decisiones de equipamiento en 2025-2026 afectarán la interoperabilidad hasta 2030


Referencias


Para despliegue de infraestructura de IA con arquitecturas de interconexión avanzadas, contacte a Introl.



  1. CXL Consortium. "CXL Consortium Releases the Compute Express Link 4.0 Specification." 18 de noviembre de 2025. 

  2. VideoCardz. "CXL 4.0 spec moves to PCIe 7.0, doubles bandwidth over CXL 3.0." Noviembre de 2025. 

  3. Business Wire. "CXL Consortium Releases the Compute Express Link 4.0 Specification Increasing Speed and Bandwidth." 18 de noviembre de 2025. 

  4. Business Wire. "Panmnesia Announces Sample Availability of PCIe 6.0/CXL 3.2 Fabric Switch." 12 de noviembre de 2025. 

  5. Tom's Hardware. "Huawei to open-source its UB-Mesh data center-scale interconnect soon." Agosto de 2025. 

  6. Datacenter.news. "CXL 4.0 doubles bandwidth, introduces bundled ports for data centres." Noviembre de 2025. 

  7. Panmnesia. "Press Release: PCIe 6.0/CXL 3.2 Fabric Switch." Noviembre de 2025. 

  8. Blocks and Files. "CXL 4.0 doubles bandwidth and stretches memory pooling to multi-rack setups." 24 de noviembre de 2025. 

  9. TechPowerUp. "Panmnesia Samples Industry's First PCIe 6.0/CXL 3.2 Fabric Switch." Noviembre de 2025. 

  10. Semi Engineering. "New Data Center Protocols Tackle AI." 2025. 

  11. Synopsys. "Ultra Ethernet UaLink AI Networks." 2025. 

  12. ServeTheHome. "Huawei Presents UB-Mesh Interconnect for Large AI SuperNodes at Hot Chips 2025." Agosto de 2025. 

  13. Blocks and Files. "CXL 4.0 doubles bandwidth." Noviembre de 2025. 

  14. HPCwire. "Upscale AI Eyes Late 2026 for Scale-Up UALink Switch." 2 de diciembre de 2025. 

  15. EE Times. "CXL Adds Port Bundling to Quench AI Thirst." Noviembre de 2025. 

  16. SDxCentral. "Compute Express Link Consortium debuts 4.0 spec to push past bandwidth bottlenecks." Noviembre de 2025. 

  17. CXL Consortium. "CXL 4.0 White Paper." Noviembre de 2025. 

Solicitar Cotización_

Cuéntanos sobre tu proyecto y te responderemos en 72 horas.

> TRANSMISIÓN_COMPLETA

Solicitud Recibida_

Gracias por su consulta. Nuestro equipo revisará su solicitud y responderá dentro de 72 horas.

EN COLA PARA PROCESAMIENTO