CXL 4.0 und die Interconnect-Kriege: Wie KI-Speicher die Rechenzentrumsarchitektur neu gestaltet

CXL 4.0-Spezifikation am 18. November mit PCIe 7.0, 128 GT/s, gebündelten Ports veröffentlicht. Panmnesia liefert ersten CXL 3.2 Fabric-Switch. UALink, Ultra Ethernet, Huaweis UB-Mesh konkurrieren.

Blake Crosley

Jan 16, 2026 6 min read Disclaimer

CXL 4.0 und die Interconnect-Kriege: Wie KI-Speicher die Rechenzentrumsarchitektur neu gestaltet

12. Dezember 2025

Update Dezember 2025: Das CXL-Konsortium veröffentlichte CXL 4.0 am 18. November und verdoppelte die Bandbreite auf 128 GT/s mit PCIe 7.0 und führte gebündelte Ports für 1,5 TB/s-Verbindungen ein. Panmnesia begann mit der Musterlieferung des branchenweit ersten CXL 3.2 Fabric-Switches mit portbasiertem Routing. Währenddessen zielt UALink auf eine Bereitstellung Ende 2026 ab und Huawei hat UB-Mesh als Alternative als Open Source veröffentlicht.

Zusammenfassung

CXL 4.0 repräsentiert die nächste Generation der Speicher-Interconnect-Technologie und ermöglicht über 100 Terabyte gepoolten Speicher mit Cache-Kohärenz über die gesamte KI-Infrastruktur. Die gebündelten Ports der Spezifikation ermöglichen die Aggregation mehrerer physischer Ports zu einzelnen logischen Verbindungen mit einer Gesamtbandbreite von 1,5 TB/s. Panmnesias CXL 3.2 Fabric-Switch markiert die erste Hardware, die portbasiertes Routing für Multi-Rack-KI-Cluster implementiert. Die breitere Interconnect-Landschaft fragmentiert weiter, während UALink, Ultra Ethernet und Huaweis UB-Mesh um verschiedene Nischen konkurrieren.

Was geschah

Das CXL-Konsortium veröffentlichte die Compute Express Link 4.0-Spezifikation am 18. November 2025 auf der SC25.¹ Die Spezifikation wechselt von PCIe 6.x (64 GT/s) zu PCIe 7.0 (128 GT/s) und verdoppelt die verfügbare Bandbreite bei Beibehaltung des mit CXL 3.x eingeführten 256-Byte-FLIT-Formats.²

"Die Veröffentlichung der CXL 4.0-Spezifikation setzt einen neuen Meilenstein für die Weiterentwicklung kohärenter Speicherkonnektivität und verdoppelt die Bandbreite gegenüber der vorherigen Generation mit leistungsstarken neuen Funktionen," erklärte Derek Rohde, CXL-Konsortiumspräsident und Principal Engineer bei NVIDIA.³

Vier Tage zuvor, am 12. November, kündigte das koreanische Startup Panmnesia die Musterverfügbarkeit seines PCIe 6.0/CXL 3.2 Fabric-Switches an: das erste Silizium, das portbasiertes Routing (PBR) für CXL-Fabrics implementiert.⁴

Die Interconnect-Landschaft fragmentiert weiter. UALink zielt auf eine Rechenzentrumsbereitstellung Ende 2026 ab. Huawei kündigte an, sein UB-Mesh-Protokoll als Open Source zu veröffentlichen, das entwickelt wurde, um PCIe, CXL, NVLink und TCP/IP durch einen einheitlichen Standard zu ersetzen.⁵

Warum es für die Infrastruktur wichtig ist

Speicher wird komponierbar: CXL 4.0 ermöglicht Speicher-Pooling im großen Maßstab. KI-Inferenz-Workloads, die Hunderte von Terabytes benötigen, können jetzt auf gemeinsame Speicher-Pools über Racks hinweg mit Cache-Kohärenz zugreifen, nicht nur innerhalb eines einzelnen Servers.

Bandbreite entspricht der KI-Nachfrage: Ein gebündelter CXL 4.0-Port mit x16-Links bei 128 GT/s liefert 768 GB/s in jede Richtung (1,536 TB/s Gesamtbandbreite zwischen Gerät und CPU).⁶ LLM-Inferenz-Serving profitiert direkt von dieser Kapazität.

Multi-Rack-KI-Cluster: Das portbasierte Routing in CXL 3.2/4.0 ermöglicht es Fabric-Switches, Tausende von Geräten über mehrere Racks hinweg zu verbinden, ohne lange Netzwerklatenz zu verursachen. Panmnesia behauptet "zweistellige Nanosekunden-Latenz" für Speicherzugriff.⁷

Risiko der Standardfragmentierung: Vier konkurrierende Interconnect-Ökosysteme (CXL/PCIe, UALink, Ultra Ethernet, NVLink) zwingen Infrastrukturplaner, auf Gewinner zu setzen. Heute gekaufte Ausrüstung kann 2027 Interoperabilitätsprobleme haben.

Technische Details

CXL 4.0-Spezifikation

Merkmal	CXL 3.x	CXL 4.0
Basisprotokoll	PCIe 6.x	PCIe 7.0
Übertragungsgeschwindigkeit	64 GT/s	128 GT/s
FLIT-Größe	256B	256B
Unterstützte Retimer	2	4
Link-Breitenoptionen	Standard	Native x2 hinzugefügt
Gebündelte Ports	Nein	Ja

Architektur gebündelter Ports

Die gebündelten Ports von CXL 4.0 aggregieren mehrere physische CXL-Geräteports zu einer einzelnen logischen Einheit:⁸

Host und Typ-1/2-Geräte können mehrere physische Ports kombinieren
Systemsoftware sieht ein einzelnes Gerät trotz mehrerer physischer Verbindungen
Optimiert für 256B-FLIT-Modus, eliminiert Legacy-68B-FLIT-Overhead
Ermöglicht 1,5+ TB/s Gesamtbandbreite pro logischer Verbindung

Panmnesia CXL 3.2 Fabric-Switch

Das erste CXL 3.2-Switch-Silizium umfasst:⁹

Spezifikation	Detail
Protokollunterstützung	PCIe Gen 6.0 + CXL 3.2 Hybrid
Datenrate	64 GT/s
Routing-Modi	PBR (portbasiert) und HBR (hierarchiebasiert)
CXL-Subprotokolle	CXL.cache, CXL.mem, CXL.io
Lane-Anzahl	256-Lane High Fan-out
Latenz	Zweistellige Nanosekunden
Rückwärtskompatibilität	Alle vorherigen PCIe/CXL-Generationen

Zielanwendungen umfassen DLRM (Deep Learning Recommendation Models), LLM-Inferenz, RAG-Workloads und MPI-basierte HPC-Simulationen.

Konkurrierende Interconnect-Standards

Standard	Eigentümer	Zweck	Bandbreite	Skalierung	Zeitplan
CXL 4.0	Konsortium	Speicherkohärenz	128 GT/s	Multi-Rack	Ende 2026-2027
NVLink 5	NVIDIA	GPU-GPU	1,8 TB/s	576 GPUs	Verfügbar
UALink 1.0	AMD-geführtes Konsortium	Beschleuniger-Beschleuniger	200 Gb/s/Lane	1.024 Geräte	Ende 2026
Ultra Ethernet	UEC	Scale-out-Netzwerk	Ethernet-basiert	10.000+ Endpunkte	2026+
UB-Mesh	Huawei	Vereinheitlichter Interconnect	1+ TB/s/Gerät	1M Prozessoren	Open Source

Interconnect-Entscheidungsrahmen

Wann welchen Standard verwenden:

Anwendungsfall	Beste Wahl	Warum
GPU-zu-GPU innerhalb des Knotens	NVLink	Höchste Bandbreite (1,8 TB/s), niedrigste Latenz
GPU-zu-GPU über Knoten hinweg	UALink	Open-Standard-Alternative zu NVLink
Speichererweiterung	CXL	Cache-Kohärenz mit CPU, Speicher-Pooling
Scale-out-Netzwerk	Ultra Ethernet / InfiniBand	Entwickelt für 10.000+ Endpunkt-Cluster
Einheitliches China-Ökosystem	UB-Mesh	Vermeidet westliche IP-Beschränkungen

UALink vs. CXL-Positionierung

UALink konkurriert nicht direkt mit CXL. Sie dienen unterschiedlichen Zwecken:¹⁰

UALink: GPU-zu-GPU-Skalierung für Beschleuniger-Cluster (Scale-up)
CXL: CPU-Speicher-Kohärenz und Speicher-Pooling (Speichererweiterung)
Ultra Ethernet: Scale-out-Netzwerk über Rechenzentren

"UALink arbeitet neben PCIe und CXL, aber nur UALink hat den Effekt, die zugewiesenen Ressourcen zu vereinheitlichen. UALink ist darauf ausgelegt, Ihre Haupt-GPU-Einheiten für GPU-zu-GPU-Skalierung zu verbinden," erklärte Michael Posner, VP of Product Management bei Synopsys.¹¹

Huawei UB-Mesh

Huaweis alternativer Ansatz zielt darauf ab, alle bestehenden Interconnects zu ersetzen:¹²

Zielt auf 1 TB/s+ Bandbreite pro Gerät
~150 ns Hop-Latenz (Verbesserung von Mikrosekunden auf Nanosekunden)
Synchrone Load/Store-Semantik vs. paketbasiert
Open-Source-Lizenz im September 2025 angekündigt
Skaliert auf 1 Million Prozessoren in "SuperNode"-Architektur

Die Branchenadoption bleibt angesichts geopolitischer Bedenken und der Dynamik bestehender Standards unsicher.

Was kommt als Nächstes

Ende 2026: UALink-Switches erreichen Rechenzentren; CXL 4.0-Produkte beginnen mit der Musterlieferung.

Ende 2026-2027: CXL 4.0 Multi-Rack-Systeme erreichen Produktionseinsatz.¹³

Q4 2026: Upscale AI zielt auf UALink-Switch-Lieferung ab.¹⁴

Laufend: Standardisierungsgremien navigieren die Koexistenz von CXL, UALink und Ultra Ethernet. Huaweis UB-Mesh sucht Adoption außerhalb westlicher Märkte.

Die Interconnect-Landschaft wird mindestens bis 2027 fragmentiert bleiben. Kein einzelner Standard adressiert alle Anwendungsfälle: Speicher-Pooling (CXL), Beschleuniger-Skalierung (UALink/NVLink) und Netzwerk-Fabric (Ultra Ethernet/InfiniBand).

Wichtige Erkenntnisse

Für Infrastrukturplaner: - CXL 4.0 ermöglicht 100+ TB Speicher-Pools mit Cache-Kohärenz über Racks hinweg - Panmnesia liefert Muster des ersten CXL 3.2 Fabric-Switches mit portbasiertem Routing - Planen Sie für Standardkoexistenz: CXL + UALink + Ultra Ethernet/InfiniBand - Bereitstellungszeitplan Ende 2026-2027 für CXL 4.0-Produktionssysteme

Für Betriebsteams: - CXL behält Rückwärtskompatibilität mit früheren Generationen - Portbasiertes Routing vereinfacht Multi-Rack-Fabric-Management - Zweistellige Nanosekunden-Latenz für Speicherzugriff über Switches - Beobachten Sie Panmnesia, XConn und andere CXL-Switch-Anbieter hinsichtlich Verfügbarkeit

Für strategische Planung: - Kein einzelner Interconnect-Standard wird "gewinnen", weil verschiedene Schichten unterschiedlichen Zwecken dienen - Speicher-Pooling wird für KI-Inferenz im großen Maßstab realisierbar - Huaweis UB-Mesh schafft ein paralleles Ökosystem hauptsächlich für den chinesischen Markt - Ausrüstungsentscheidungen in 2025-2026 werden die Interoperabilität bis 2030 beeinflussen

Referenzen

Für KI-Infrastrukturbereitstellung mit fortschrittlichen Interconnect-Architekturen kontaktieren Sie Introl.

CXL Consortium. "CXL Consortium Releases the Compute Express Link 4.0 Specification." 18. November 2025. ↩
VideoCardz. "CXL 4.0 spec moves to PCIe 7.0, doubles bandwidth over CXL 3.0." November 2025. ↩
Business Wire. "CXL Consortium Releases the Compute Express Link 4.0 Specification Increasing Speed and Bandwidth." 18. November 2025. ↩
Business Wire. "Panmnesia Announces Sample Availability of PCIe 6.0/CXL 3.2 Fabric Switch." 12. November 2025. ↩
Tom's Hardware. "Huawei to open-source its UB-Mesh data center-scale interconnect soon." August 2025. ↩
Datacenter.news. "CXL 4.0 doubles bandwidth, introduces bundled ports for data centres." November 2025. ↩
Panmnesia. "Press Release: PCIe 6.0/CXL 3.2 Fabric Switch." November 2025. ↩
Blocks and Files. "CXL 4.0 doubles bandwidth and stretches memory pooling to multi-rack setups." 24. November 2025. ↩
TechPowerUp. "Panmnesia Samples Industry's First PCIe 6.0/CXL 3.2 Fabric Switch." November 2025. ↩
Semi Engineering. "New Data Center Protocols Tackle AI." 2025. ↩
Synopsys. "Ultra Ethernet UaLink AI Networks." 2025. ↩
ServeTheHome. "Huawei Presents UB-Mesh Interconnect for Large AI SuperNodes at Hot Chips 2025." August 2025. ↩
Blocks and Files. "CXL 4.0 doubles bandwidth." November 2025. ↩
HPCwire. "Upscale AI Eyes Late 2026 for Scale-Up UALink Switch." 2. Dezember 2025. ↩
EE Times. "CXL Adds Port Bundling to Quench AI Thirst." November 2025. ↩
SDxCentral. "Compute Express Link Consortium debuts 4.0 spec to push past bandwidth bottlenecks." November 2025. ↩
CXL Consortium. "CXL 4.0 White Paper." November 2025. ↩

CXL 4.0 und die Interconnect-Kriege: Wie KI-Speicher die Rechenzentrumsarchitektur neu gestaltet

Zusammenfassung

Was geschah

Warum es für die Infrastruktur wichtig ist

Technische Details

CXL 4.0-Spezifikation

Architektur gebündelter Ports

Panmnesia CXL 3.2 Fabric-Switch

Konkurrierende Interconnect-Standards

Interconnect-Entscheidungsrahmen

UALink vs. CXL-Positionierung

Huawei UB-Mesh

Was kommt als Nächstes

Wichtige Erkenntnisse

Referenzen

You Might Also Like

Singapurs 27-Milliarden-Dollar-Boom bei KI-Infrastruktur: Ch...

Malaysia und Thailand: Aufstrebende KI-Rechenzentren in Südo...

Backup und Recovery für AI: Schutz von Trainings-Datensätzen...

Angebot anfordern_

Anfrage erhalten_