CXL 4.0 e as Guerras de Interconexão: Como a Memória de IA Está Reformulando a Arquitetura de Data Centers

Especificação CXL 4.0 lançada em 18 de novembro com PCIe 7.0, 128 GT/s, portas agrupadas. Panmnesia envia primeiro switch fabric CXL 3.2. UALink, Ultra Ethernet, UB-Mesh da Huawei competem.

Blake Crosley

Jan 16, 2026 8 min read Disclaimer

CXL 4.0 e as Guerras de Interconexão: Como a Memória de IA Está Reformulando a Arquitetura de Data Centers

12 de dezembro de 2025

Atualização de dezembro de 2025: O Consórcio CXL lançou o CXL 4.0 em 18 de novembro, dobrando a largura de banda para 128 GT/s com PCIe 7.0 e introduzindo portas agrupadas para conexões de 1,5 TB/s. A Panmnesia começou a fornecer amostras do primeiro switch fabric CXL 3.2 da indústria com roteamento baseado em portas. Enquanto isso, o UALink visa implantação no final de 2026 e a Huawei publicou o UB-Mesh como código aberto como alternativa.

Resumo

O CXL 4.0 representa a próxima geração de tecnologia de interconexão de memória, permitindo mais de 100 terabytes de memória agrupada com coerência de cache em toda a infraestrutura de IA. O recurso de portas agrupadas da especificação permite agregar múltiplas portas físicas em conexões lógicas únicas que fornecem 1,5 TB/s de largura de banda total. O switch fabric CXL 3.2 da Panmnesia marca o primeiro hardware implementando roteamento baseado em portas para clusters de IA multi-rack. O cenário mais amplo de interconexão se fragmenta ainda mais enquanto UALink, Ultra Ethernet e UB-Mesh da Huawei competem por diferentes nichos.

O Que Aconteceu

O Consórcio CXL lançou a especificação Compute Express Link 4.0 em 18 de novembro de 2025, na SC25.¹ A especificação muda de PCIe 6.x (64 GT/s) para PCIe 7.0 (128 GT/s), dobrando a largura de banda disponível enquanto mantém o formato FLIT de 256 bytes introduzido com CXL 3.x.²

"O lançamento da especificação CXL 4.0 estabelece um novo marco para avançar a conectividade de memória coerente, dobrando a largura de banda em relação à geração anterior com novos recursos poderosos," declarou Derek Rohde, Presidente do Consórcio CXL e Engenheiro Principal na NVIDIA.³

Quatro dias antes, em 12 de novembro, a startup coreana Panmnesia anunciou a disponibilidade de amostras do seu Switch Fabric PCIe 6.0/CXL 3.2: o primeiro silício implementando roteamento baseado em portas (PBR) para fabrics CXL.⁴

O cenário de interconexão continua se fragmentando. O UALink visa implantação em data centers no final de 2026. A Huawei anunciou que publicará seu protocolo UB-Mesh como código aberto, projetado para substituir PCIe, CXL, NVLink e TCP/IP por um padrão unificado.⁵

Por Que Importa para a Infraestrutura

A Memória Se Torna Componível: O CXL 4.0 permite o agrupamento de memória em escala. Cargas de trabalho de inferência de IA que requerem centenas de terabytes agora podem acessar pools de memória compartilhada através de racks com coerência de cache, não apenas dentro de um único servidor.

A Largura de Banda Atende à Demanda de IA: Uma porta agrupada CXL 4.0 com links x16 a 128 GT/s fornece 768 GB/s em cada direção (1,536 TB/s de largura de banda total entre dispositivo e CPU).⁶ O serviço de inferência de LLM se beneficia diretamente dessa capacidade.

Clusters de IA Multi-Rack: O roteamento baseado em portas no CXL 3.2/4.0 permite que switches fabric interconectem milhares de dispositivos através de múltiplos racks sem incorrer em longa latência de rede. A Panmnesia afirma "latência de nanossegundos de dois dígitos" para acesso à memória.⁷

Risco de Fragmentação de Padrões: Quatro ecossistemas de interconexão concorrentes (CXL/PCIe, UALink, Ultra Ethernet, NVLink) forçam os planejadores de infraestrutura a apostar nos vencedores. Equipamentos comprados hoje podem enfrentar desafios de interoperabilidade em 2027.

Detalhes Técnicos

Especificação CXL 4.0

Recurso	CXL 3.x	CXL 4.0
Protocolo Base	PCIe 6.x	PCIe 7.0
Velocidade de Transferência	64 GT/s	128 GT/s
Tamanho do FLIT	256B	256B
Retimers Suportados	2	4
Opções de Largura de Link	Padrão	x2 nativo adicionado
Portas Agrupadas	Não	Sim

Arquitetura de Portas Agrupadas

As portas agrupadas do CXL 4.0 agregam múltiplas portas físicas de dispositivos CXL em uma única entidade lógica:⁸

Host e dispositivos Tipo 1/2 podem combinar múltiplas portas físicas
O software do sistema vê um único dispositivo apesar de múltiplas conexões físicas
Otimizado para Modo FLIT 256B, eliminando overhead do FLIT legado 68B
Permite mais de 1,5 TB/s de largura de banda total por conexão lógica

Switch Fabric CXL 3.2 da Panmnesia

O primeiro silício de switch CXL 3.2 inclui:⁹

Especificação	Detalhe
Suporte a Protocolo	Híbrido PCIe Gen 6.0 + CXL 3.2
Taxa de Dados	64 GT/s
Modos de Roteamento	PBR (baseado em porta) e HBR (baseado em hierarquia)
Subprotocolos CXL	CXL.cache, CXL.mem, CXL.io
Contagem de Lanes	256 lanes de alto fan-out
Latência	Nanossegundos de dois dígitos
Compatibilidade Retroativa	Todas as gerações anteriores de PCIe/CXL

Aplicações alvo incluem DLRM (Modelos de Recomendação de Deep Learning), inferência de LLM, cargas de trabalho RAG e simulações HPC baseadas em MPI.

Padrões de Interconexão Concorrentes

Padrão	Proprietário	Propósito	Largura de Banda	Escala	Cronograma
CXL 4.0	Consórcio	Coerência de memória	128 GT/s	Multi-rack	Final 2026-2027
NVLink 5	NVIDIA	GPU-GPU	1,8 TB/s	576 GPUs	Disponível
UALink 1.0	Consórcio liderado pela AMD	Acelerador-acelerador	200 Gb/s/lane	1.024 dispositivos	Final 2026
Ultra Ethernet	UEC	Rede scale-out	Baseado em Ethernet	10.000+ endpoints	2026+
UB-Mesh	Huawei	Interconexão unificada	1+ TB/s/dispositivo	1M processadores	Código aberto

Framework de Decisão de Interconexão

Quando usar qual padrão:

Caso de Uso	Melhor Escolha	Por Quê
GPU-para-GPU dentro do nó	NVLink	Maior largura de banda (1,8 TB/s), menor latência
GPU-para-GPU entre nós	UALink	Alternativa de padrão aberto ao NVLink
Expansão de memória	CXL	Coerência de cache com CPU, agrupamento de memória
Rede scale-out	Ultra Ethernet / InfiniBand	Projetado para clusters de 10.000+ endpoints
Ecossistema unificado da China	UB-Mesh	Evita restrições de IP ocidentais

Posicionamento UALink vs. CXL

O UALink não compete diretamente com o CXL. Eles servem propósitos diferentes:¹⁰

UALink: Escalonamento GPU-para-GPU para clusters de aceleradores (scale-up)
CXL: Coerência CPU-memória e agrupamento de memória (expansão de memória)
Ultra Ethernet: Rede scale-out através de data centers

"O UALink trabalha junto com PCIe e CXL, mas apenas o UALink tem o efeito de unificar os recursos alocados. O UALink é projetado para conectar suas unidades GPU principais para escalonamento GPU-para-GPU," explicou Michael Posner, VP de Gestão de Produtos na Synopsys.¹¹

UB-Mesh da Huawei

A abordagem alternativa da Huawei visa substituir todas as interconexões existentes:¹²

Visa mais de 1 TB/s de largura de banda por dispositivo
~150 ns de latência por salto (melhoria de microssegundos para nanossegundos)
Semântica de carga/armazenamento síncrona vs. baseada em pacotes
Licença de código aberto anunciada em setembro de 2025
Escala até 1 milhão de processadores em arquitetura "SuperNode"

A adoção pela indústria permanece incerta dadas as preocupações geopolíticas e o impulso dos padrões existentes.

O Que Vem a Seguir

Final de 2026: Switches UALink chegam aos data centers; produtos CXL 4.0 começam a fornecer amostras.

Final de 2026-2027: Sistemas multi-rack CXL 4.0 alcançam implantação de produção.¹³

Q4 2026: Upscale AI visa entrega de switch UALink.¹⁴

Em andamento: Órgãos de padronização navegam a coexistência de CXL, UALink e Ultra Ethernet. O UB-Mesh da Huawei busca adoção fora dos mercados ocidentais.

O cenário de interconexão permanecerá fragmentado pelo menos até 2027. Nenhum padrão único aborda todos os casos de uso: agrupamento de memória (CXL), escalonamento de aceleradores (UALink/NVLink) e fabric de rede (Ultra Ethernet/InfiniBand).

Pontos-Chave

Para planejadores de infraestrutura: - CXL 4.0 permite pools de memória de 100+ TB com coerência de cache entre racks - Panmnesia fornecendo amostras do primeiro switch fabric CXL 3.2 com roteamento baseado em portas - Planeje para coexistência de padrões: CXL + UALink + Ultra Ethernet/InfiniBand - Cronograma de implantação final de 2026-2027 para sistemas de produção CXL 4.0

Para equipes de operações: - CXL mantém compatibilidade retroativa com gerações anteriores - Roteamento baseado em portas simplifica gerenciamento de fabric multi-rack - Latência de nanossegundos de dois dígitos para acesso à memória através de switches - Monitore Panmnesia, XConn e outros fornecedores de switch CXL para disponibilidade

Para planejamento estratégico: - Nenhum padrão de interconexão único "vencerá" porque diferentes camadas servem diferentes propósitos - Agrupamento de memória se torna viável para inferência de IA em escala - UB-Mesh da Huawei cria ecossistema paralelo principalmente para o mercado chinês - Decisões de equipamentos em 2025-2026 afetarão interoperabilidade até 2030

Referências

Para implantação de infraestrutura de IA com arquiteturas de interconexão avançadas, entre em contato com Introl.

CXL Consortium. "CXL Consortium Releases the Compute Express Link 4.0 Specification." 18 de novembro de 2025. ↩
VideoCardz. "CXL 4.0 spec moves to PCIe 7.0, doubles bandwidth over CXL 3.0." Novembro de 2025. ↩
Business Wire. "CXL Consortium Releases the Compute Express Link 4.0 Specification Increasing Speed and Bandwidth." 18 de novembro de 2025. ↩
Business Wire. "Panmnesia Announces Sample Availability of PCIe 6.0/CXL 3.2 Fabric Switch." 12 de novembro de 2025. ↩
Tom's Hardware. "Huawei to open-source its UB-Mesh data center-scale interconnect soon." Agosto de 2025. ↩
Datacenter.news. "CXL 4.0 doubles bandwidth, introduces bundled ports for data centres." Novembro de 2025. ↩
Panmnesia. "Press Release: PCIe 6.0/CXL 3.2 Fabric Switch." Novembro de 2025. ↩
Blocks and Files. "CXL 4.0 doubles bandwidth and stretches memory pooling to multi-rack setups." 24 de novembro de 2025. ↩
TechPowerUp. "Panmnesia Samples Industry's First PCIe 6.0/CXL 3.2 Fabric Switch." Novembro de 2025. ↩
Semi Engineering. "New Data Center Protocols Tackle AI." 2025. ↩
Synopsys. "Ultra Ethernet UaLink AI Networks." 2025. ↩
ServeTheHome. "Huawei Presents UB-Mesh Interconnect for Large AI SuperNodes at Hot Chips 2025." Agosto de 2025. ↩
Blocks and Files. "CXL 4.0 doubles bandwidth." Novembro de 2025. ↩
HPCwire. "Upscale AI Eyes Late 2026 for Scale-Up UALink Switch." 2 de dezembro de 2025. ↩
EE Times. "CXL Adds Port Bundling to Quench AI Thirst." Novembro de 2025. ↩
SDxCentral. "Compute Express Link Consortium debuts 4.0 spec to push past bandwidth bottlenecks." Novembro de 2025. ↩
CXL Consortium. "CXL 4.0 White Paper." Novembro de 2025. ↩

CXL 4.0 e as Guerras de Interconexão: Como a Memória de IA Está Reformulando a Arquitetura de Data Centers

Resumo

O Que Aconteceu

Por Que Importa para a Infraestrutura

Detalhes Técnicos

Especificação CXL 4.0

Arquitetura de Portas Agrupadas

Switch Fabric CXL 3.2 da Panmnesia

Padrões de Interconexão Concorrentes

Framework de Decisão de Interconexão

Posicionamento UALink vs. CXL

UB-Mesh da Huawei

O Que Vem a Seguir

Pontos-Chave

Referências

You Might Also Like

Malásia e Tailândia: Centros Emergentes de Data Centers de I...

O Boom de US$ 27 Bilhões em Infraestrutura de IA de Singapur...

Backup e Recuperação para AI: Protegendo Dados de Treinament...

Solicitar Orçamento_

Solicitação Recebida_