CXL 4.0 und die Interconnect-Kriege: Wie KI-Speicher die Rechenzentrumsarchitektur neu gestaltet

CXL 4.0-Spezifikation am 18. November mit PCIe 7.0, 128 GT/s, gebündelten Ports veröffentlicht. Panmnesia liefert ersten CXL 3.2 Fabric-Switch. UALink, Ultra Ethernet, Huaweis UB-Mesh konkurrieren.

CXL 4.0 und die Interconnect-Kriege: Wie KI-Speicher die Rechenzentrumsarchitektur neu gestaltet

CXL 4.0 und die Interconnect-Kriege: Wie KI-Speicher die Rechenzentrumsarchitektur neu gestaltet

12. Dezember 2025

Update Dezember 2025: Das CXL-Konsortium veröffentlichte CXL 4.0 am 18. November und verdoppelte die Bandbreite auf 128 GT/s mit PCIe 7.0 und führte gebündelte Ports für 1,5 TB/s-Verbindungen ein. Panmnesia begann mit der Musterlieferung des branchenweit ersten CXL 3.2 Fabric-Switches mit portbasiertem Routing. Währenddessen zielt UALink auf eine Bereitstellung Ende 2026 ab und Huawei hat UB-Mesh als Alternative als Open Source veröffentlicht.


Zusammenfassung

CXL 4.0 repräsentiert die nächste Generation der Speicher-Interconnect-Technologie und ermöglicht über 100 Terabyte gepoolten Speicher mit Cache-Kohärenz über die gesamte KI-Infrastruktur. Die gebündelten Ports der Spezifikation ermöglichen die Aggregation mehrerer physischer Ports zu einzelnen logischen Verbindungen mit einer Gesamtbandbreite von 1,5 TB/s. Panmnesias CXL 3.2 Fabric-Switch markiert die erste Hardware, die portbasiertes Routing für Multi-Rack-KI-Cluster implementiert. Die breitere Interconnect-Landschaft fragmentiert weiter, während UALink, Ultra Ethernet und Huaweis UB-Mesh um verschiedene Nischen konkurrieren.


Was geschah

Das CXL-Konsortium veröffentlichte die Compute Express Link 4.0-Spezifikation am 18. November 2025 auf der SC25.1 Die Spezifikation wechselt von PCIe 6.x (64 GT/s) zu PCIe 7.0 (128 GT/s) und verdoppelt die verfügbare Bandbreite bei Beibehaltung des mit CXL 3.x eingeführten 256-Byte-FLIT-Formats.2

"Die Veröffentlichung der CXL 4.0-Spezifikation setzt einen neuen Meilenstein für die Weiterentwicklung kohärenter Speicherkonnektivität und verdoppelt die Bandbreite gegenüber der vorherigen Generation mit leistungsstarken neuen Funktionen," erklärte Derek Rohde, CXL-Konsortiumspräsident und Principal Engineer bei NVIDIA.3

Vier Tage zuvor, am 12. November, kündigte das koreanische Startup Panmnesia die Musterverfügbarkeit seines PCIe 6.0/CXL 3.2 Fabric-Switches an: das erste Silizium, das portbasiertes Routing (PBR) für CXL-Fabrics implementiert.4

Die Interconnect-Landschaft fragmentiert weiter. UALink zielt auf eine Rechenzentrumsbereitstellung Ende 2026 ab. Huawei kündigte an, sein UB-Mesh-Protokoll als Open Source zu veröffentlichen, das entwickelt wurde, um PCIe, CXL, NVLink und TCP/IP durch einen einheitlichen Standard zu ersetzen.5


Warum es für die Infrastruktur wichtig ist

Speicher wird komponierbar: CXL 4.0 ermöglicht Speicher-Pooling im großen Maßstab. KI-Inferenz-Workloads, die Hunderte von Terabytes benötigen, können jetzt auf gemeinsame Speicher-Pools über Racks hinweg mit Cache-Kohärenz zugreifen, nicht nur innerhalb eines einzelnen Servers.

Bandbreite entspricht der KI-Nachfrage: Ein gebündelter CXL 4.0-Port mit x16-Links bei 128 GT/s liefert 768 GB/s in jede Richtung (1,536 TB/s Gesamtbandbreite zwischen Gerät und CPU).6 LLM-Inferenz-Serving profitiert direkt von dieser Kapazität.

Multi-Rack-KI-Cluster: Das portbasierte Routing in CXL 3.2/4.0 ermöglicht es Fabric-Switches, Tausende von Geräten über mehrere Racks hinweg zu verbinden, ohne lange Netzwerklatenz zu verursachen. Panmnesia behauptet "zweistellige Nanosekunden-Latenz" für Speicherzugriff.7

Risiko der Standardfragmentierung: Vier konkurrierende Interconnect-Ökosysteme (CXL/PCIe, UALink, Ultra Ethernet, NVLink) zwingen Infrastrukturplaner, auf Gewinner zu setzen. Heute gekaufte Ausrüstung kann 2027 Interoperabilitätsprobleme haben.


Technische Details

CXL 4.0-Spezifikation

Merkmal CXL 3.x CXL 4.0
Basisprotokoll PCIe 6.x PCIe 7.0
Übertragungsgeschwindigkeit 64 GT/s 128 GT/s
FLIT-Größe 256B 256B
Unterstützte Retimer 2 4
Link-Breitenoptionen Standard Native x2 hinzugefügt
Gebündelte Ports Nein Ja

Architektur gebündelter Ports

Die gebündelten Ports von CXL 4.0 aggregieren mehrere physische CXL-Geräteports zu einer einzelnen logischen Einheit:8

  • Host und Typ-1/2-Geräte können mehrere physische Ports kombinieren
  • Systemsoftware sieht ein einzelnes Gerät trotz mehrerer physischer Verbindungen
  • Optimiert für 256B-FLIT-Modus, eliminiert Legacy-68B-FLIT-Overhead
  • Ermöglicht 1,5+ TB/s Gesamtbandbreite pro logischer Verbindung

Panmnesia CXL 3.2 Fabric-Switch

Das erste CXL 3.2-Switch-Silizium umfasst:9

Spezifikation Detail
Protokollunterstützung PCIe Gen 6.0 + CXL 3.2 Hybrid
Datenrate 64 GT/s
Routing-Modi PBR (portbasiert) und HBR (hierarchiebasiert)
CXL-Subprotokolle CXL.cache, CXL.mem, CXL.io
Lane-Anzahl 256-Lane High Fan-out
Latenz Zweistellige Nanosekunden
Rückwärtskompatibilität Alle vorherigen PCIe/CXL-Generationen

Zielanwendungen umfassen DLRM (Deep Learning Recommendation Models), LLM-Inferenz, RAG-Workloads und MPI-basierte HPC-Simulationen.

Konkurrierende Interconnect-Standards

Standard Eigentümer Zweck Bandbreite Skalierung Zeitplan
CXL 4.0 Konsortium Speicherkohärenz 128 GT/s Multi-Rack Ende 2026-2027
NVLink 5 NVIDIA GPU-GPU 1,8 TB/s 576 GPUs Verfügbar
UALink 1.0 AMD-geführtes Konsortium Beschleuniger-Beschleuniger 200 Gb/s/Lane 1.024 Geräte Ende 2026
Ultra Ethernet UEC Scale-out-Netzwerk Ethernet-basiert 10.000+ Endpunkte 2026+
UB-Mesh Huawei Vereinheitlichter Interconnect 1+ TB/s/Gerät 1M Prozessoren Open Source

Interconnect-Entscheidungsrahmen

Wann welchen Standard verwenden:

Anwendungsfall Beste Wahl Warum
GPU-zu-GPU innerhalb des Knotens NVLink Höchste Bandbreite (1,8 TB/s), niedrigste Latenz
GPU-zu-GPU über Knoten hinweg UALink Open-Standard-Alternative zu NVLink
Speichererweiterung CXL Cache-Kohärenz mit CPU, Speicher-Pooling
Scale-out-Netzwerk Ultra Ethernet / InfiniBand Entwickelt für 10.000+ Endpunkt-Cluster
Einheitliches China-Ökosystem UB-Mesh Vermeidet westliche IP-Beschränkungen

UALink konkurriert nicht direkt mit CXL. Sie dienen unterschiedlichen Zwecken:10

  • UALink: GPU-zu-GPU-Skalierung für Beschleuniger-Cluster (Scale-up)
  • CXL: CPU-Speicher-Kohärenz und Speicher-Pooling (Speichererweiterung)
  • Ultra Ethernet: Scale-out-Netzwerk über Rechenzentren

"UALink arbeitet neben PCIe und CXL, aber nur UALink hat den Effekt, die zugewiesenen Ressourcen zu vereinheitlichen. UALink ist darauf ausgelegt, Ihre Haupt-GPU-Einheiten für GPU-zu-GPU-Skalierung zu verbinden," erklärte Michael Posner, VP of Product Management bei Synopsys.11

Huawei UB-Mesh

Huaweis alternativer Ansatz zielt darauf ab, alle bestehenden Interconnects zu ersetzen:12

  • Zielt auf 1 TB/s+ Bandbreite pro Gerät
  • ~150 ns Hop-Latenz (Verbesserung von Mikrosekunden auf Nanosekunden)
  • Synchrone Load/Store-Semantik vs. paketbasiert
  • Open-Source-Lizenz im September 2025 angekündigt
  • Skaliert auf 1 Million Prozessoren in "SuperNode"-Architektur

Die Branchenadoption bleibt angesichts geopolitischer Bedenken und der Dynamik bestehender Standards unsicher.


Was kommt als Nächstes

Ende 2026: UALink-Switches erreichen Rechenzentren; CXL 4.0-Produkte beginnen mit der Musterlieferung.

Ende 2026-2027: CXL 4.0 Multi-Rack-Systeme erreichen Produktionseinsatz.13

Q4 2026: Upscale AI zielt auf UALink-Switch-Lieferung ab.14

Laufend: Standardisierungsgremien navigieren die Koexistenz von CXL, UALink und Ultra Ethernet. Huaweis UB-Mesh sucht Adoption außerhalb westlicher Märkte.

Die Interconnect-Landschaft wird mindestens bis 2027 fragmentiert bleiben. Kein einzelner Standard adressiert alle Anwendungsfälle: Speicher-Pooling (CXL), Beschleuniger-Skalierung (UALink/NVLink) und Netzwerk-Fabric (Ultra Ethernet/InfiniBand).


Wichtige Erkenntnisse

Für Infrastrukturplaner: - CXL 4.0 ermöglicht 100+ TB Speicher-Pools mit Cache-Kohärenz über Racks hinweg - Panmnesia liefert Muster des ersten CXL 3.2 Fabric-Switches mit portbasiertem Routing - Planen Sie für Standardkoexistenz: CXL + UALink + Ultra Ethernet/InfiniBand - Bereitstellungszeitplan Ende 2026-2027 für CXL 4.0-Produktionssysteme

Für Betriebsteams: - CXL behält Rückwärtskompatibilität mit früheren Generationen - Portbasiertes Routing vereinfacht Multi-Rack-Fabric-Management - Zweistellige Nanosekunden-Latenz für Speicherzugriff über Switches - Beobachten Sie Panmnesia, XConn und andere CXL-Switch-Anbieter hinsichtlich Verfügbarkeit

Für strategische Planung: - Kein einzelner Interconnect-Standard wird "gewinnen", weil verschiedene Schichten unterschiedlichen Zwecken dienen - Speicher-Pooling wird für KI-Inferenz im großen Maßstab realisierbar - Huaweis UB-Mesh schafft ein paralleles Ökosystem hauptsächlich für den chinesischen Markt - Ausrüstungsentscheidungen in 2025-2026 werden die Interoperabilität bis 2030 beeinflussen


Referenzen


Für KI-Infrastrukturbereitstellung mit fortschrittlichen Interconnect-Architekturen kontaktieren Sie Introl.


  1. CXL Consortium. "CXL Consortium Releases the Compute Express Link 4.0 Specification." 18. November 2025. 

  2. VideoCardz. "CXL 4.0 spec moves to PCIe 7.0, doubles bandwidth over CXL 3.0." November 2025. 

  3. Business Wire. "CXL Consortium Releases the Compute Express Link 4.0 Specification Increasing Speed and Bandwidth." 18. November 2025. 

  4. Business Wire. "Panmnesia Announces Sample Availability of PCIe 6.0/CXL 3.2 Fabric Switch." 12. November 2025. 

  5. Tom's Hardware. "Huawei to open-source its UB-Mesh data center-scale interconnect soon." August 2025. 

  6. Datacenter.news. "CXL 4.0 doubles bandwidth, introduces bundled ports for data centres." November 2025. 

  7. Panmnesia. "Press Release: PCIe 6.0/CXL 3.2 Fabric Switch." November 2025. 

  8. Blocks and Files. "CXL 4.0 doubles bandwidth and stretches memory pooling to multi-rack setups." 24. November 2025. 

  9. TechPowerUp. "Panmnesia Samples Industry's First PCIe 6.0/CXL 3.2 Fabric Switch." November 2025. 

  10. Semi Engineering. "New Data Center Protocols Tackle AI." 2025. 

  11. Synopsys. "Ultra Ethernet UaLink AI Networks." 2025. 

  12. ServeTheHome. "Huawei Presents UB-Mesh Interconnect for Large AI SuperNodes at Hot Chips 2025." August 2025. 

  13. Blocks and Files. "CXL 4.0 doubles bandwidth." November 2025. 

  14. HPCwire. "Upscale AI Eyes Late 2026 for Scale-Up UALink Switch." 2. Dezember 2025. 

  15. EE Times. "CXL Adds Port Bundling to Quench AI Thirst." November 2025. 

  16. SDxCentral. "Compute Express Link Consortium debuts 4.0 spec to push past bandwidth bottlenecks." November 2025. 

  17. CXL Consortium. "CXL 4.0 White Paper." November 2025. 

Request a Quote_

Tell us about your project and we'll respond within 72 hours.

> TRANSMISSION_COMPLETE

Request Received_

Thank you for your inquiry. Our team will review your request and respond within 72 hours.

QUEUED FOR PROCESSING