CXL 4.0 dan Perang Interkoneksi: Bagaimana Memori AI Mengubah Arsitektur Pusat Data
12 Desember 2025
Pembaruan Desember 2025: CXL Consortium merilis CXL 4.0 pada 18 November, menggandakan bandwidth menjadi 128 GT/s dengan PCIe 7.0 dan memperkenalkan bundled ports untuk koneksi 1,5 TB/s. Panmnesia mulai menyediakan sampel fabric switch CXL 3.2 pertama di industri dengan port-based routing. Sementara itu, UALink menargetkan deployment akhir 2026 dan Huawei membuka sumber UB-Mesh sebagai alternatif.
Ringkasan
CXL 4.0 merupakan generasi berikutnya dari teknologi interkoneksi memori, memungkinkan pooling memori 100+ terabyte dengan cache coherency di seluruh infrastruktur AI. Fitur bundled ports dari spesifikasi ini memungkinkan penggabungan beberapa port fisik menjadi satu attachment logis yang memberikan total bandwidth 1,5 TB/s. Fabric switch CXL 3.2 dari Panmnesia menandai hardware pertama yang mengimplementasikan port-based routing untuk cluster AI multi-rack. Lanskap interkoneksi yang lebih luas semakin terfragmentasi karena UALink, Ultra Ethernet, dan UB-Mesh dari Huawei bersaing untuk ceruk yang berbeda.
Apa yang Terjadi
CXL Consortium merilis spesifikasi Compute Express Link 4.0 pada 18 November 2025, di SC25.1 Spesifikasi ini beralih dari PCIe 6.x (64 GT/s) ke PCIe 7.0 (128 GT/s), menggandakan bandwidth yang tersedia sambil mempertahankan format FLIT 256-byte yang diperkenalkan dengan CXL 3.x.2
"Rilis spesifikasi CXL 4.0 menetapkan tonggak baru untuk memajukan konektivitas memori koheren, menggandakan bandwidth dibandingkan generasi sebelumnya dengan fitur-fitur baru yang powerful," kata Derek Rohde, Presiden CXL Consortium dan Principal Engineer di NVIDIA.3
Empat hari sebelumnya, pada 12 November, startup Korea Panmnesia mengumumkan ketersediaan sampel PCIe 6.0/CXL 3.2 Fabric Switch: silikon pertama yang mengimplementasikan port-based routing (PBR) untuk fabric CXL.4
Lanskap interkoneksi terus terfragmentasi. UALink menargetkan deployment pusat data akhir 2026. Huawei mengumumkan akan membuka sumber protokol UB-Mesh-nya, yang dirancang untuk menggantikan PCIe, CXL, NVLink, dan TCP/IP dengan standar terpadu.5
Mengapa Ini Penting untuk Infrastruktur
Memori Menjadi Composable: CXL 4.0 memungkinkan memory pooling dalam skala besar. Beban kerja inferensi AI yang membutuhkan ratusan terabyte kini dapat mengakses pool memori bersama di seluruh rack dengan cache coherency, tidak hanya dalam satu server.
Bandwidth Sesuai Permintaan AI: Bundled port CXL 4.0 dengan link x16 pada 128 GT/s memberikan 768 GB/s di setiap arah (total bandwidth 1,536 TB/s antara perangkat dan CPU).6 LLM inference serving mendapat manfaat langsung dari kapasitas ini.
Cluster AI Multi-Rack: Port-based routing di CXL 3.2/4.0 memungkinkan fabric switch untuk menghubungkan ribuan perangkat di beberapa rack tanpa mengalami latensi jaringan yang panjang. Panmnesia mengklaim "latensi dua digit nanodetik" untuk akses memori.7
Risiko Fragmentasi Standar: Empat ekosistem interkoneksi yang bersaing (CXL/PCIe, UALink, Ultra Ethernet, NVLink) memaksa perencana infrastruktur untuk bertaruh pada pemenang. Peralatan yang dibeli hari ini mungkin menghadapi tantangan interoperabilitas pada 2027.
Detail Teknis
Spesifikasi CXL 4.0
| Fitur | CXL 3.x | CXL 4.0 |
|---|---|---|
| Protokol Dasar | PCIe 6.x | PCIe 7.0 |
| Kecepatan Transfer | 64 GT/s | 128 GT/s |
| Ukuran FLIT | 256B | 256B |
| Retimer yang Didukung | 2 | 4 |
| Opsi Lebar Link | Standar | Native x2 ditambahkan |
| Bundled Ports | Tidak | Ya |
Arsitektur Bundled Ports
Bundled ports CXL 4.0 menggabungkan beberapa port perangkat CXL fisik menjadi satu entitas logis:8
- Host dan perangkat Type 1/2 dapat menggabungkan beberapa port fisik
- Software sistem melihat satu perangkat meskipun ada beberapa koneksi fisik
- Dioptimalkan untuk 256B Flit Mode, menghilangkan overhead 68B Flit legacy
- Memungkinkan total bandwidth 1,5+ TB/s per koneksi logis
Panmnesia CXL 3.2 Fabric Switch
Silikon switch CXL 3.2 pertama mencakup:9
| Spesifikasi | Detail |
|---|---|
| Dukungan Protokol | PCIe Gen 6.0 + CXL 3.2 hybrid |
| Data Rate | 64 GT/s |
| Mode Routing | PBR (port-based) dan HBR (hierarchy-based) |
| Subprotokol CXL | CXL.cache, CXL.mem, CXL.io |
| Jumlah Lane | 256-lane high fan-out |
| Latensi | Dua digit nanodetik |
| Kompatibilitas Mundur | Semua generasi PCIe/CXL sebelumnya |
Aplikasi target meliputi DLRM (Deep Learning Recommendation Models), inferensi LLM, beban kerja RAG, dan simulasi HPC berbasis MPI.
Standar Interkoneksi yang Bersaing
| Standar | Pemilik | Tujuan | Bandwidth | Skala | Timeline |
|---|---|---|---|---|---|
| CXL 4.0 | Konsorsium | Memory coherency | 128 GT/s | Multi-rack | Akhir 2026-2027 |
| NVLink 5 | NVIDIA | GPU-GPU | 1,8 TB/s | 576 GPU | Tersedia |
| UALink 1.0 | Konsorsium yang dipimpin AMD | Accelerator-accelerator | 200 Gb/s/lane | 1.024 perangkat | Akhir 2026 |
| Ultra Ethernet | UEC | Scale-out networking | Berbasis Ethernet | 10.000+ endpoint | 2026+ |
| UB-Mesh | Huawei | Unified interconnect | 1+ TB/s/perangkat | 1 juta prosesor | Open-sourced |
Kerangka Keputusan Interkoneksi
Kapan menggunakan standar mana:
| Kasus Penggunaan | Pilihan Terbaik | Alasan |
|---|---|---|
| GPU-ke-GPU dalam node | NVLink | Bandwidth tertinggi (1,8 TB/s), latensi terendah |
| GPU-ke-GPU lintas node | UALink | Alternatif standar terbuka untuk NVLink |
| Ekspansi memori | CXL | Cache coherency dengan CPU, memory pooling |
| Scale-out networking | Ultra Ethernet / InfiniBand | Dirancang untuk cluster 10.000+ endpoint |
| Ekosistem terpadu Tiongkok | UB-Mesh | Menghindari pembatasan IP Barat |
Posisi UALink vs. CXL
UALink tidak bersaing langsung dengan CXL. Keduanya melayani tujuan yang berbeda:10
- UALink: Penskalaan GPU-ke-GPU untuk cluster accelerator (scale-up)
- CXL: CPU-memory coherency dan memory pooling (ekspansi memori)
- Ultra Ethernet: Scale-out networking di seluruh pusat data
"UALink bekerja bersama PCIe dan CXL, tetapi hanya UALink yang memiliki efek menyatukan sumber daya yang dialokasikan. UALink dirancang untuk menghubungkan unit GPU utama Anda untuk penskalaan GPU-ke-GPU," jelas Michael Posner, VP of Product Management di Synopsys.11
Huawei UB-Mesh
Pendekatan alternatif Huawei bertujuan menggantikan semua interkoneksi yang ada:12
- Menargetkan bandwidth 1 TB/s+ per perangkat
- Latensi hop ~150 ns (peningkatan dari mikrodetik ke nanodetik)
- Semantik synchronous load/store vs. berbasis paket
- Lisensi open-source diumumkan September 2025
- Skala hingga 1 juta prosesor dalam arsitektur "SuperNode"
Adopsi industri masih belum pasti mengingat kekhawatiran geopolitik dan momentum standar yang ada.
Apa Selanjutnya
Akhir 2026: Switch UALink mencapai pusat data; produk CXL 4.0 mulai sampling.
Akhir 2026-2027: Sistem multi-rack CXL 4.0 mencapai deployment produksi.13
Q4 2026: Upscale AI menargetkan pengiriman switch UALink.14
Berkelanjutan: Badan standar menavigasi koeksistensi CXL, UALink, dan Ultra Ethernet. UB-Mesh Huawei mencari adopsi di luar pasar Barat.
Lanskap interkoneksi akan tetap terfragmentasi setidaknya hingga 2027. Tidak ada satu standar pun yang menangani semua kasus penggunaan: memory pooling (CXL), penskalaan accelerator (UALink/NVLink), dan network fabric (Ultra Ethernet/InfiniBand).
Poin-Poin Utama
Untuk perencana infrastruktur: - CXL 4.0 memungkinkan pool memori 100+ TB dengan cache coherency di seluruh rack - Panmnesia menyediakan sampel fabric switch CXL 3.2 pertama dengan port-based routing - Rencanakan koeksistensi standar: CXL + UALink + Ultra Ethernet/InfiniBand - Timeline deployment akhir 2026-2027 untuk sistem produksi CXL 4.0
Untuk tim operasi: - CXL mempertahankan kompatibilitas mundur dengan generasi sebelumnya - Port-based routing menyederhanakan manajemen fabric multi-rack - Latensi dua digit nanodetik untuk akses memori melalui switch - Pantau Panmnesia, XConn, dan vendor switch CXL lainnya untuk ketersediaan
Untuk perencanaan strategis: - Tidak ada satu standar interkoneksi yang akan "menang" karena layer yang berbeda melayani tujuan yang berbeda - Memory pooling menjadi layak untuk inferensi AI dalam skala besar - UB-Mesh Huawei menciptakan ekosistem paralel terutama untuk pasar Tiongkok - Keputusan peralatan di 2025-2026 akan mempengaruhi interoperabilitas hingga 2030
Referensi
Untuk deployment infrastruktur AI dengan arsitektur interkoneksi canggih, hubungi Introl.
-
CXL Consortium. "CXL Consortium Releases the Compute Express Link 4.0 Specification." November 18, 2025. ↩
-
VideoCardz. "CXL 4.0 spec moves to PCIe 7.0, doubles bandwidth over CXL 3.0." November 2025. ↩
-
Business Wire. "CXL Consortium Releases the Compute Express Link 4.0 Specification Increasing Speed and Bandwidth." November 18, 2025. ↩
-
Business Wire. "Panmnesia Announces Sample Availability of PCIe 6.0/CXL 3.2 Fabric Switch." November 12, 2025. ↩
-
Tom's Hardware. "Huawei to open-source its UB-Mesh data center-scale interconnect soon." August 2025. ↩
-
Datacenter.news. "CXL 4.0 doubles bandwidth, introduces bundled ports for data centres." November 2025. ↩
-
Panmnesia. "Press Release: PCIe 6.0/CXL 3.2 Fabric Switch." November 2025. ↩
-
Blocks and Files. "CXL 4.0 doubles bandwidth and stretches memory pooling to multi-rack setups." November 24, 2025. ↩
-
TechPowerUp. "Panmnesia Samples Industry's First PCIe 6.0/CXL 3.2 Fabric Switch." November 2025. ↩
-
Semi Engineering. "New Data Center Protocols Tackle AI." 2025. ↩
-
Synopsys. "Ultra Ethernet UaLink AI Networks." 2025. ↩
-
ServeTheHome. "Huawei Presents UB-Mesh Interconnect for Large AI SuperNodes at Hot Chips 2025." August 2025. ↩
-
Blocks and Files. "CXL 4.0 doubles bandwidth." November 2025. ↩
-
HPCwire. "Upscale AI Eyes Late 2026 for Scale-Up UALink Switch." December 2, 2025. ↩
-
EE Times. "CXL Adds Port Bundling to Quench AI Thirst." November 2025. ↩
-
SDxCentral. "Compute Express Link Consortium debuts 4.0 spec to push past bandwidth bottlenecks." November 2025. ↩
-
CXL Consortium. "CXL 4.0 White Paper." November 2025. ↩