CXL 4.0 dan Perang Interkoneksi: Bagaimana Memori AI Membentuk Ulang Arsitektur Pusat Data
12 Desember 2025
Pembaruan Desember 2025: Konsorsium CXL merilis CXL 4.0 pada 18 November, menggandakan bandwidth menjadi 128 GT/s dengan PCIe 7.0 dan memperkenalkan port bundel untuk koneksi 1,5 TB/s. Panmnesia mulai menyediakan sampel switch fabric CXL 3.2 pertama di industri dengan routing berbasis port. Sementara itu, UALink menargetkan penerapan akhir 2026 dan Huawei merilis UB-Mesh sebagai open source sebagai alternatif.
Ringkasan
CXL 4.0 mewakili generasi berikutnya teknologi interkoneksi memori, memungkinkan lebih dari 100 terabyte memori terpadu dengan koherensi cache di seluruh infrastruktur AI. Fitur port bundel dari spesifikasi ini memungkinkan agregasi beberapa port fisik menjadi koneksi logis tunggal yang memberikan bandwidth total 1,5 TB/s. Switch fabric CXL 3.2 dari Panmnesia menandai perangkat keras pertama yang mengimplementasikan routing berbasis port untuk kluster AI multi-rack. Lanskap interkoneksi yang lebih luas terus terfragmentasi seiring UALink, Ultra Ethernet, dan UB-Mesh dari Huawei bersaing untuk ceruk yang berbeda.
Apa yang Terjadi
Konsorsium CXL merilis spesifikasi Compute Express Link 4.0 pada 18 November 2025, di SC25.1 Spesifikasi ini beralih dari PCIe 6.x (64 GT/s) ke PCIe 7.0 (128 GT/s), menggandakan bandwidth yang tersedia sambil mempertahankan format FLIT 256-byte yang diperkenalkan dengan CXL 3.x.2
"Rilis spesifikasi CXL 4.0 menetapkan tonggak baru untuk memajukan konektivitas memori koheren, menggandakan bandwidth dibandingkan generasi sebelumnya dengan fitur-fitur baru yang kuat," kata Derek Rohde, Presiden Konsorsium CXL dan Principal Engineer di NVIDIA.3
Empat hari sebelumnya, pada 12 November, startup Korea Panmnesia mengumumkan ketersediaan sampel Switch Fabric PCIe 6.0/CXL 3.2: silikon pertama yang mengimplementasikan routing berbasis port (PBR) untuk fabric CXL.4
Lanskap interkoneksi terus terfragmentasi. UALink menargetkan penerapan pusat data akhir 2026. Huawei mengumumkan akan merilis protokol UB-Mesh sebagai open source, yang dirancang untuk menggantikan PCIe, CXL, NVLink, dan TCP/IP dengan standar terpadu.5
Mengapa Ini Penting untuk Infrastruktur
Memori Menjadi Dapat Dikomposisi: CXL 4.0 memungkinkan pooling memori dalam skala besar. Beban kerja inferensi AI yang membutuhkan ratusan terabyte sekarang dapat mengakses pool memori bersama di seluruh rack dengan koherensi cache, bukan hanya dalam satu server.
Bandwidth Sesuai Permintaan AI: Port bundel CXL 4.0 dengan link x16 pada 128 GT/s memberikan 768 GB/s di setiap arah (1,536 TB/s bandwidth total antara perangkat dan CPU).6 Penyajian inferensi LLM mendapat manfaat langsung dari kapasitas ini.
Kluster AI Multi-Rack: Routing berbasis port di CXL 3.2/4.0 memungkinkan switch fabric menghubungkan ribuan perangkat di beberapa rack tanpa menimbulkan latensi jaringan yang panjang. Panmnesia mengklaim "latensi nanodetik dua digit" untuk akses memori.7
Risiko Fragmentasi Standar: Empat ekosistem interkoneksi yang bersaing (CXL/PCIe, UALink, Ultra Ethernet, NVLink) memaksa perencana infrastruktur untuk bertaruh pada pemenang. Peralatan yang dibeli hari ini mungkin menghadapi tantangan interoperabilitas pada 2027.
Detail Teknis
Spesifikasi CXL 4.0
| Fitur | CXL 3.x | CXL 4.0 |
|---|---|---|
| Protokol Dasar | PCIe 6.x | PCIe 7.0 |
| Kecepatan Transfer | 64 GT/s | 128 GT/s |
| Ukuran FLIT | 256B | 256B |
| Retimer yang Didukung | 2 | 4 |
| Opsi Lebar Link | Standar | Native x2 ditambahkan |
| Port Bundel | Tidak | Ya |
Arsitektur Port Bundel
Port bundel CXL 4.0 mengagregasi beberapa port perangkat CXL fisik menjadi satu entitas logis:8
- Host dan perangkat Tipe 1/2 dapat menggabungkan beberapa port fisik
- Perangkat lunak sistem melihat satu perangkat meskipun ada beberapa koneksi fisik
- Dioptimalkan untuk Mode FLIT 256B, menghilangkan overhead FLIT warisan 68B
- Memungkinkan 1,5+ TB/s bandwidth total per koneksi logis
Switch Fabric CXL 3.2 Panmnesia
Silikon switch CXL 3.2 pertama mencakup:9
| Spesifikasi | Detail |
|---|---|
| Dukungan Protokol | Hybrid PCIe Gen 6.0 + CXL 3.2 |
| Kecepatan Data | 64 GT/s |
| Mode Routing | PBR (berbasis port) dan HBR (berbasis hierarki) |
| Subprotokol CXL | CXL.cache, CXL.mem, CXL.io |
| Jumlah Lane | 256-lane fan-out tinggi |
| Latensi | Nanodetik dua digit |
| Kompatibilitas Mundur | Semua generasi PCIe/CXL sebelumnya |
Aplikasi target termasuk DLRM (Model Rekomendasi Deep Learning), inferensi LLM, beban kerja RAG, dan simulasi HPC berbasis MPI.
Standar Interkoneksi Pesaing
| Standar | Pemilik | Tujuan | Bandwidth | Skala | Jadwal |
|---|---|---|---|---|---|
| CXL 4.0 | Konsorsium | Koherensi memori | 128 GT/s | Multi-rack | Akhir 2026-2027 |
| NVLink 5 | NVIDIA | GPU-GPU | 1,8 TB/s | 576 GPU | Tersedia |
| UALink 1.0 | Konsorsium dipimpin AMD | Akselerator-akselerator | 200 Gb/s/lane | 1.024 perangkat | Akhir 2026 |
| Ultra Ethernet | UEC | Jaringan scale-out | Berbasis Ethernet | 10.000+ endpoint | 2026+ |
| UB-Mesh | Huawei | Interkoneksi terpadu | 1+ TB/s/perangkat | 1M prosesor | Open source |
Kerangka Keputusan Interkoneksi
Kapan menggunakan standar mana:
| Kasus Penggunaan | Pilihan Terbaik | Mengapa |
|---|---|---|
| GPU-ke-GPU dalam node | NVLink | Bandwidth tertinggi (1,8 TB/s), latensi terendah |
| GPU-ke-GPU antar node | UALink | Alternatif standar terbuka untuk NVLink |
| Ekspansi memori | CXL | Koherensi cache dengan CPU, pooling memori |
| Jaringan scale-out | Ultra Ethernet / InfiniBand | Dirancang untuk kluster 10.000+ endpoint |
| Ekosistem terpadu China | UB-Mesh | Menghindari pembatasan IP Barat |
Posisi UALink vs. CXL
UALink tidak bersaing langsung dengan CXL. Mereka melayani tujuan berbeda:10
- UALink: Penskalaan GPU-ke-GPU untuk kluster akselerator (scale-up)
- CXL: Koherensi CPU-memori dan pooling memori (ekspansi memori)
- Ultra Ethernet: Jaringan scale-out di seluruh pusat data
"UALink bekerja bersama PCIe dan CXL, tetapi hanya UALink yang memiliki efek menyatukan sumber daya yang dialokasikan. UALink dirancang untuk menghubungkan unit GPU utama Anda untuk penskalaan GPU-ke-GPU," jelas Michael Posner, VP of Product Management di Synopsys.11
UB-Mesh Huawei
Pendekatan alternatif Huawei bertujuan untuk menggantikan semua interkoneksi yang ada:12
- Menargetkan bandwidth 1 TB/s+ per perangkat
- ~150 ns latensi per hop (peningkatan dari mikrodetik ke nanodetik)
- Semantik load/store sinkron vs. berbasis paket
- Lisensi open source diumumkan September 2025
- Menskalakan hingga 1 juta prosesor dalam arsitektur "SuperNode"
Adopsi industri tetap tidak pasti mengingat kekhawatiran geopolitik dan momentum standar yang ada.
Apa Selanjutnya
Akhir 2026: Switch UALink mencapai pusat data; produk CXL 4.0 mulai sampling.
Akhir 2026-2027: Sistem multi-rack CXL 4.0 mencapai penerapan produksi.13
Q4 2026: Upscale AI menargetkan pengiriman switch UALink.14
Berlangsung: Badan standar menavigasi koeksistensi CXL, UALink, dan Ultra Ethernet. UB-Mesh Huawei mencari adopsi di luar pasar Barat.
Lanskap interkoneksi akan tetap terfragmentasi setidaknya hingga 2027. Tidak ada standar tunggal yang menangani semua kasus penggunaan: pooling memori (CXL), penskalaan akselerator (UALink/NVLink), dan fabric jaringan (Ultra Ethernet/InfiniBand).
Poin Penting
Untuk perencana infrastruktur: - CXL 4.0 memungkinkan pool memori 100+ TB dengan koherensi cache antar rack - Panmnesia menyediakan sampel switch fabric CXL 3.2 pertama dengan routing berbasis port - Rencanakan koeksistensi standar: CXL + UALink + Ultra Ethernet/InfiniBand - Jadwal penerapan akhir 2026-2027 untuk sistem produksi CXL 4.0
Untuk tim operasi: - CXL mempertahankan kompatibilitas mundur dengan generasi sebelumnya - Routing berbasis port menyederhanakan manajemen fabric multi-rack - Latensi nanodetik dua digit untuk akses memori melalui switch - Pantau Panmnesia, XConn, dan vendor switch CXL lainnya untuk ketersediaan
Untuk perencanaan strategis: - Tidak ada standar interkoneksi tunggal yang akan "menang" karena lapisan berbeda melayani tujuan berbeda - Pooling memori menjadi layak untuk inferensi AI dalam skala besar - UB-Mesh Huawei menciptakan ekosistem paralel terutama untuk pasar China - Keputusan peralatan di 2025-2026 akan memengaruhi interoperabilitas hingga 2030
Referensi
Untuk penerapan infrastruktur AI dengan arsitektur interkoneksi canggih, hubungi Introl.
-
CXL Consortium. "CXL Consortium Releases the Compute Express Link 4.0 Specification." 18 November 2025. ↩
-
VideoCardz. "CXL 4.0 spec moves to PCIe 7.0, doubles bandwidth over CXL 3.0." November 2025. ↩
-
Business Wire. "CXL Consortium Releases the Compute Express Link 4.0 Specification Increasing Speed and Bandwidth." 18 November 2025. ↩
-
Business Wire. "Panmnesia Announces Sample Availability of PCIe 6.0/CXL 3.2 Fabric Switch." 12 November 2025. ↩
-
Tom's Hardware. "Huawei to open-source its UB-Mesh data center-scale interconnect soon." Agustus 2025. ↩
-
Datacenter.news. "CXL 4.0 doubles bandwidth, introduces bundled ports for data centres." November 2025. ↩
-
Panmnesia. "Press Release: PCIe 6.0/CXL 3.2 Fabric Switch." November 2025. ↩
-
Blocks and Files. "CXL 4.0 doubles bandwidth and stretches memory pooling to multi-rack setups." 24 November 2025. ↩
-
TechPowerUp. "Panmnesia Samples Industry's First PCIe 6.0/CXL 3.2 Fabric Switch." November 2025. ↩
-
Semi Engineering. "New Data Center Protocols Tackle AI." 2025. ↩
-
Synopsys. "Ultra Ethernet UaLink AI Networks." 2025. ↩
-
ServeTheHome. "Huawei Presents UB-Mesh Interconnect for Large AI SuperNodes at Hot Chips 2025." Agustus 2025. ↩
-
Blocks and Files. "CXL 4.0 doubles bandwidth." November 2025. ↩
-
HPCwire. "Upscale AI Eyes Late 2026 for Scale-Up UALink Switch." 2 Desember 2025. ↩
-
EE Times. "CXL Adds Port Bundling to Quench AI Thirst." November 2025. ↩
-
SDxCentral. "Compute Express Link Consortium debuts 4.0 spec to push past bandwidth bottlenecks." November 2025. ↩
-
CXL Consortium. "CXL 4.0 White Paper." November 2025. ↩