CXL 4.0 und der Interconnect-Wettstreit: Wie KI-Speicher die Rechenzentrumsarchitektur neu gestaltet

CXL 4.0-Spezifikation am 18. November mit PCIe 7.0, 128 GT/s und gebündelten Ports veröffentlicht. Panmnesia liefert ersten CXL 3.2-Fabric-Switch. UALink, Ultra Ethernet und Huawei UB-Mesh konkurrieren.

CXL 4.0 und der Interconnect-Wettstreit: Wie KI-Speicher die Rechenzentrumsarchitektur neu gestaltet

CXL 4.0 und der Interconnect-Wettstreit: Wie KI-Speicher die Rechenzentrumsarchitektur neu gestaltet

12. Dezember 2025

Dezember 2025 Update: Das CXL-Konsortium veröffentlichte CXL 4.0 am 18. November mit verdoppelter Bandbreite auf 128 GT/s durch PCIe 7.0 und führte gebündelte Ports für 1,5 TB/s-Verbindungen ein. Panmnesia begann mit der Auslieferung von Mustern des branchenweit ersten CXL 3.2-Fabric-Switches mit portbasiertem Routing. Derweil peilt UALink eine Bereitstellung Ende 2026 an, und Huawei hat UB-Mesh als Alternative unter Open-Source-Lizenz gestellt.


Zusammenfassung

CXL 4.0 repräsentiert die nächste Generation der Speicher-Interconnect-Technologie und ermöglicht über 100 Terabyte gepoolten Speicher mit Cache-Kohärenz über die gesamte KI-Infrastruktur hinweg. Die Funktion der gebündelten Ports in der Spezifikation erlaubt die Aggregation mehrerer physischer Ports zu einzelnen logischen Anschlüssen mit einer Gesamtbandbreite von 1,5 TB/s. Panmnesias CXL 3.2-Fabric-Switch markiert die erste Hardware, die portbasiertes Routing für KI-Cluster über mehrere Racks implementiert. Die breitere Interconnect-Landschaft fragmentiert weiter, da UALink, Ultra Ethernet und Huaweis UB-Mesh um verschiedene Nischen konkurrieren.


Was geschah

Das CXL-Konsortium veröffentlichte die Compute Express Link 4.0-Spezifikation am 18. November 2025 auf der SC25.1 Die Spezifikation wechselt von PCIe 6.x (64 GT/s) auf PCIe 7.0 (128 GT/s) und verdoppelt damit die verfügbare Bandbreite bei Beibehaltung des mit CXL 3.x eingeführten 256-Byte-FLIT-Formats.2

„Die Veröffentlichung der CXL 4.0-Spezifikation setzt einen neuen Meilenstein für die Weiterentwicklung kohärenter Speicherkonnektivität und verdoppelt die Bandbreite gegenüber der vorherigen Generation mit leistungsstarken neuen Funktionen", erklärte Derek Rohde, Präsident des CXL-Konsortiums und Principal Engineer bei NVIDIA.3

Vier Tage zuvor, am 12. November, kündigte das koreanische Startup Panmnesia die Musterverfügbarkeit seines PCIe 6.0/CXL 3.2-Fabric-Switches an: das erste Silizium, das portbasiertes Routing (PBR) für CXL-Fabrics implementiert.4

Die Interconnect-Landschaft fragmentiert weiter. UALink zielt auf eine Rechenzentrumsbereitstellung Ende 2026. Huawei kündigte an, sein UB-Mesh-Protokoll als Open Source zu veröffentlichen, das PCIe, CXL, NVLink und TCP/IP durch einen einheitlichen Standard ersetzen soll.5


Warum es für die Infrastruktur wichtig ist

Speicher wird komponierbar: CXL 4.0 ermöglicht Speicher-Pooling im großen Maßstab. KI-Inferenz-Workloads, die Hunderte von Terabytes benötigen, können nun auf gemeinsame Speicherpools über Racks hinweg mit Cache-Kohärenz zugreifen – nicht nur innerhalb eines einzelnen Servers.

Bandbreite entspricht dem KI-Bedarf: Ein gebündelter CXL 4.0-Port mit x16-Links bei 128 GT/s liefert 768 GB/s in jede Richtung (1,536 TB/s Gesamtbandbreite zwischen Gerät und CPU).6 LLM-Inferenz-Serving profitiert direkt von dieser Kapazität.

Multi-Rack-KI-Cluster: Das portbasierte Routing in CXL 3.2/4.0 ermöglicht es Fabric-Switches, Tausende von Geräten über mehrere Racks hinweg zu verbinden, ohne lange Netzwerklatenzen in Kauf nehmen zu müssen. Panmnesia beansprucht „Latenzen im zweistelligen Nanosekundenbereich" für den Speicherzugriff.7

Risiko der Standardfragmentierung: Vier konkurrierende Interconnect-Ökosysteme (CXL/PCIe, UALink, Ultra Ethernet, NVLink) zwingen Infrastrukturplaner dazu, auf Gewinner zu setzen. Heute gekaufte Ausrüstung könnte 2027 vor Interoperabilitätsproblemen stehen.


Technische Details

CXL 4.0-Spezifikation

Merkmal CXL 3.x CXL 4.0
Basisprotokoll PCIe 6.x PCIe 7.0
Übertragungsgeschwindigkeit 64 GT/s 128 GT/s
FLIT-Größe 256B 256B
Unterstützte Retimer 2 4
Link-Breiten-Optionen Standard Native x2 hinzugefügt
Gebündelte Ports Nein Ja

Architektur der gebündelten Ports

Die gebündelten Ports von CXL 4.0 aggregieren mehrere physische CXL-Geräteports zu einer einzigen logischen Einheit:8

  • Host und Type 1/2-Geräte können mehrere physische Ports kombinieren
  • Systemsoftware sieht ein einzelnes Gerät trotz mehrerer physischer Verbindungen
  • Optimiert für 256B-Flit-Modus, eliminiert den Overhead des älteren 68B-Flit
  • Ermöglicht 1,5+ TB/s Gesamtbandbreite pro logischer Verbindung

Panmnesia CXL 3.2-Fabric-Switch

Das erste CXL 3.2-Switch-Silizium umfasst:9

Spezifikation Detail
Protokollunterstützung PCIe Gen 6.0 + CXL 3.2 Hybrid
Datenrate 64 GT/s
Routing-Modi PBR (portbasiert) und HBR (hierarchiebasiert)
CXL-Subprotokolle CXL.cache, CXL.mem, CXL.io
Lane-Anzahl 256-Lane High-Fan-Out
Latenz Zweistelliger Nanosekundenbereich
Abwärtskompatibilität Alle früheren PCIe/CXL-Generationen

Zielanwendungen umfassen DLRM (Deep Learning Recommendation Models), LLM-Inferenz, RAG-Workloads und MPI-basierte HPC-Simulationen.

Konkurrierende Interconnect-Standards

Standard Eigentümer Zweck Bandbreite Skalierung Zeitplan
CXL 4.0 Konsortium Speicherkohärenz 128 GT/s Multi-Rack Ende 2026-2027
NVLink 5 NVIDIA GPU-GPU 1,8 TB/s 576 GPUs Verfügbar
UALink 1.0 AMD-geführtes Konsortium Beschleuniger-Beschleuniger 200 Gb/s/Lane 1.024 Geräte Ende 2026
Ultra Ethernet UEC Scale-Out-Networking Ethernet-basiert 10.000+ Endpunkte 2026+
UB-Mesh Huawei Vereinheitlichter Interconnect 1+ TB/s/Gerät 1M Prozessoren Open Source

Entscheidungsrahmen für Interconnects

Wann welchen Standard verwenden:

Anwendungsfall Beste Wahl Warum
GPU-zu-GPU innerhalb eines Knotens NVLink Höchste Bandbreite (1,8 TB/s), niedrigste Latenz
GPU-zu-GPU über Knoten hinweg UALink Offener Standard als Alternative zu NVLink
Speichererweiterung CXL Cache-Kohärenz mit CPU, Speicher-Pooling
Scale-Out-Networking Ultra Ethernet / InfiniBand Für Cluster mit 10.000+ Endpunkten konzipiert
Vereinheitlichtes China-Ökosystem UB-Mesh Vermeidet westliche IP-Beschränkungen

UALink konkurriert nicht direkt mit CXL. Sie dienen unterschiedlichen Zwecken:10

  • UALink: GPU-zu-GPU-Skalierung für Beschleuniger-Cluster (Scale-Up)
  • CXL: CPU-Speicher-Kohärenz und Speicher-Pooling (Speichererweiterung)
  • Ultra Ethernet: Scale-Out-Networking über Rechenzentren hinweg

„UALink arbeitet zusammen mit PCIe und CXL, aber nur UALink hat den Effekt, die zugewiesenen Ressourcen zu vereinheitlichen. UALink ist dafür konzipiert, Ihre Haupt-GPU-Einheiten für GPU-zu-GPU-Skalierung zu verbinden", erklärte Michael Posner, VP of Product Management bei Synopsys.11

Huawei UB-Mesh

Huaweis alternativer Ansatz zielt darauf ab, alle bestehenden Interconnects zu ersetzen:12

  • Zielt auf 1 TB/s+ Bandbreite pro Gerät
  • ~150 ns Hop-Latenz (Verbesserung von Mikrosekunden auf Nanosekunden)
  • Synchrone Load/Store-Semantik vs. paketbasiert
  • Open-Source-Lizenz im September 2025 angekündigt
  • Skaliert auf 1 Million Prozessoren in „SuperNode"-Architektur

Die Branchenadoption bleibt angesichts geopolitischer Bedenken und der bestehenden Standards-Dynamik ungewiss.


Was als Nächstes kommt

Ende 2026: UALink-Switches erreichen Rechenzentren; CXL 4.0-Produkte beginnen mit der Musterproduktion.

Ende 2026-2027: CXL 4.0-Multi-Rack-Systeme erreichen die Produktionsbereitstellung.13

Q4 2026: Upscale AI plant die Lieferung von UALink-Switches.14

Laufend: Standardisierungsgremien navigieren die Koexistenz von CXL, UALink und Ultra Ethernet. Huaweis UB-Mesh sucht Adoption außerhalb westlicher Märkte.

Die Interconnect-Landschaft wird mindestens bis 2027 fragmentiert bleiben. Kein einzelner Standard adressiert alle Anwendungsfälle: Speicher-Pooling (CXL), Beschleuniger-Skalierung (UALink/NVLink) und Netzwerk-Fabric (Ultra Ethernet/InfiniBand).


Wichtigste Erkenntnisse

Für Infrastrukturplaner: - CXL 4.0 ermöglicht 100+ TB Speicherpools mit Cache-Kohärenz über Racks hinweg - Panmnesia liefert ersten CXL 3.2-Fabric-Switch mit portbasiertem Routing als Muster - Planen Sie für Standards-Koexistenz: CXL + UALink + Ultra Ethernet/InfiniBand - Bereitstellungszeitplan Ende 2026-2027 für CXL 4.0-Produktionssysteme

Für Betriebsteams: - CXL behält Abwärtskompatibilität mit früheren Generationen bei - Portbasiertes Routing vereinfacht das Multi-Rack-Fabric-Management - Latenzen im zweistelligen Nanosekundenbereich für Speicherzugriff über Switches - Beobachten Sie Panmnesia, XConn und andere CXL-Switch-Anbieter auf Verfügbarkeit

Für strategische Planung: - Kein einzelner Interconnect-Standard wird „gewinnen", da verschiedene Schichten verschiedene Zwecke erfüllen - Speicher-Pooling wird für KI-Inferenz im großen Maßstab praktikabel - Huaweis UB-Mesh schafft ein paralleles Ökosystem hauptsächlich für den chinesischen Markt - Ausrüstungsentscheidungen in 2025-2026 werden die Interoperabilität bis 2030 beeinflussen


Referenzen


Für KI-Infrastruktur-Deployment mit fortschrittlichen Interconnect-Architekturen kontaktieren Sie Introl.



  1. CXL Consortium. "CXL Consortium Releases the Compute Express Link 4.0 Specification." November 18, 2025. 

  2. VideoCardz. "CXL 4.0 spec moves to PCIe 7.0, doubles bandwidth over CXL 3.0." November 2025. 

  3. Business Wire. "CXL Consortium Releases the Compute Express Link 4.0 Specification Increasing Speed and Bandwidth." November 18, 2025. 

  4. Business Wire. "Panmnesia Announces Sample Availability of PCIe 6.0/CXL 3.2 Fabric Switch." November 12, 2025. 

  5. Tom's Hardware. "Huawei to open-source its UB-Mesh data center-scale interconnect soon." August 2025. 

  6. Datacenter.news. "CXL 4.0 doubles bandwidth, introduces bundled ports for data centres." November 2025. 

  7. Panmnesia. "Press Release: PCIe 6.0/CXL 3.2 Fabric Switch." November 2025. 

  8. Blocks and Files. "CXL 4.0 doubles bandwidth and stretches memory pooling to multi-rack setups." November 24, 2025. 

  9. TechPowerUp. "Panmnesia Samples Industry's First PCIe 6.0/CXL 3.2 Fabric Switch." November 2025. 

  10. Semi Engineering. "New Data Center Protocols Tackle AI." 2025. 

  11. Synopsys. "Ultra Ethernet UaLink AI Networks." 2025. 

  12. ServeTheHome. "Huawei Presents UB-Mesh Interconnect for Large AI SuperNodes at Hot Chips 2025." August 2025. 

  13. Blocks and Files. "CXL 4.0 doubles bandwidth." November 2025. 

  14. HPCwire. "Upscale AI Eyes Late 2026 for Scale-Up UALink Switch." December 2, 2025. 

  15. EE Times. "CXL Adds Port Bundling to Quench AI Thirst." November 2025. 

  16. SDxCentral. "Compute Express Link Consortium debuts 4.0 spec to push past bandwidth bottlenecks." November 2025. 

  17. CXL Consortium. "CXL 4.0 White Paper." November 2025. 

Angebot anfordern_

Erzählen Sie uns von Ihrem Projekt und wir antworten innerhalb von 72 Stunden.

> ÜBERTRAGUNG_ABGESCHLOSSEN

Anfrage erhalten_

Vielen Dank für Ihre Anfrage. Unser Team wird Ihre Anfrage prüfen und innerhalb von 72 Stunden antworten.

ZUR BEARBEITUNG EINGEREIHT