CXL 4.0 dan Perang Interkoneksi: Bagaimana Memori AI Membentuk Ulang Arsitektur Pusat Data

Spesifikasi CXL 4.0 dirilis 18 November dengan PCIe 7.0, 128 GT/s, port bundel. Panmnesia mengirimkan switch fabric CXL 3.2 pertama. UALink, Ultra Ethernet, UB-Mesh Huawei bersaing.

CXL 4.0 dan Perang Interkoneksi: Bagaimana Memori AI Membentuk Ulang Arsitektur Pusat Data

CXL 4.0 dan Perang Interkoneksi: Bagaimana Memori AI Membentuk Ulang Arsitektur Pusat Data

12 Desember 2025

Pembaruan Desember 2025: Konsorsium CXL merilis CXL 4.0 pada 18 November, menggandakan bandwidth menjadi 128 GT/s dengan PCIe 7.0 dan memperkenalkan port bundel untuk koneksi 1,5 TB/s. Panmnesia mulai menyediakan sampel switch fabric CXL 3.2 pertama di industri dengan routing berbasis port. Sementara itu, UALink menargetkan penerapan akhir 2026 dan Huawei merilis UB-Mesh sebagai open source sebagai alternatif.


Ringkasan

CXL 4.0 mewakili generasi berikutnya teknologi interkoneksi memori, memungkinkan lebih dari 100 terabyte memori terpadu dengan koherensi cache di seluruh infrastruktur AI. Fitur port bundel dari spesifikasi ini memungkinkan agregasi beberapa port fisik menjadi koneksi logis tunggal yang memberikan bandwidth total 1,5 TB/s. Switch fabric CXL 3.2 dari Panmnesia menandai perangkat keras pertama yang mengimplementasikan routing berbasis port untuk kluster AI multi-rack. Lanskap interkoneksi yang lebih luas terus terfragmentasi seiring UALink, Ultra Ethernet, dan UB-Mesh dari Huawei bersaing untuk ceruk yang berbeda.


Apa yang Terjadi

Konsorsium CXL merilis spesifikasi Compute Express Link 4.0 pada 18 November 2025, di SC25.1 Spesifikasi ini beralih dari PCIe 6.x (64 GT/s) ke PCIe 7.0 (128 GT/s), menggandakan bandwidth yang tersedia sambil mempertahankan format FLIT 256-byte yang diperkenalkan dengan CXL 3.x.2

"Rilis spesifikasi CXL 4.0 menetapkan tonggak baru untuk memajukan konektivitas memori koheren, menggandakan bandwidth dibandingkan generasi sebelumnya dengan fitur-fitur baru yang kuat," kata Derek Rohde, Presiden Konsorsium CXL dan Principal Engineer di NVIDIA.3

Empat hari sebelumnya, pada 12 November, startup Korea Panmnesia mengumumkan ketersediaan sampel Switch Fabric PCIe 6.0/CXL 3.2: silikon pertama yang mengimplementasikan routing berbasis port (PBR) untuk fabric CXL.4

Lanskap interkoneksi terus terfragmentasi. UALink menargetkan penerapan pusat data akhir 2026. Huawei mengumumkan akan merilis protokol UB-Mesh sebagai open source, yang dirancang untuk menggantikan PCIe, CXL, NVLink, dan TCP/IP dengan standar terpadu.5


Mengapa Ini Penting untuk Infrastruktur

Memori Menjadi Dapat Dikomposisi: CXL 4.0 memungkinkan pooling memori dalam skala besar. Beban kerja inferensi AI yang membutuhkan ratusan terabyte sekarang dapat mengakses pool memori bersama di seluruh rack dengan koherensi cache, bukan hanya dalam satu server.

Bandwidth Sesuai Permintaan AI: Port bundel CXL 4.0 dengan link x16 pada 128 GT/s memberikan 768 GB/s di setiap arah (1,536 TB/s bandwidth total antara perangkat dan CPU).6 Penyajian inferensi LLM mendapat manfaat langsung dari kapasitas ini.

Kluster AI Multi-Rack: Routing berbasis port di CXL 3.2/4.0 memungkinkan switch fabric menghubungkan ribuan perangkat di beberapa rack tanpa menimbulkan latensi jaringan yang panjang. Panmnesia mengklaim "latensi nanodetik dua digit" untuk akses memori.7

Risiko Fragmentasi Standar: Empat ekosistem interkoneksi yang bersaing (CXL/PCIe, UALink, Ultra Ethernet, NVLink) memaksa perencana infrastruktur untuk bertaruh pada pemenang. Peralatan yang dibeli hari ini mungkin menghadapi tantangan interoperabilitas pada 2027.


Detail Teknis

Spesifikasi CXL 4.0

Fitur CXL 3.x CXL 4.0
Protokol Dasar PCIe 6.x PCIe 7.0
Kecepatan Transfer 64 GT/s 128 GT/s
Ukuran FLIT 256B 256B
Retimer yang Didukung 2 4
Opsi Lebar Link Standar Native x2 ditambahkan
Port Bundel Tidak Ya

Arsitektur Port Bundel

Port bundel CXL 4.0 mengagregasi beberapa port perangkat CXL fisik menjadi satu entitas logis:8

  • Host dan perangkat Tipe 1/2 dapat menggabungkan beberapa port fisik
  • Perangkat lunak sistem melihat satu perangkat meskipun ada beberapa koneksi fisik
  • Dioptimalkan untuk Mode FLIT 256B, menghilangkan overhead FLIT warisan 68B
  • Memungkinkan 1,5+ TB/s bandwidth total per koneksi logis

Switch Fabric CXL 3.2 Panmnesia

Silikon switch CXL 3.2 pertama mencakup:9

Spesifikasi Detail
Dukungan Protokol Hybrid PCIe Gen 6.0 + CXL 3.2
Kecepatan Data 64 GT/s
Mode Routing PBR (berbasis port) dan HBR (berbasis hierarki)
Subprotokol CXL CXL.cache, CXL.mem, CXL.io
Jumlah Lane 256-lane fan-out tinggi
Latensi Nanodetik dua digit
Kompatibilitas Mundur Semua generasi PCIe/CXL sebelumnya

Aplikasi target termasuk DLRM (Model Rekomendasi Deep Learning), inferensi LLM, beban kerja RAG, dan simulasi HPC berbasis MPI.

Standar Interkoneksi Pesaing

Standar Pemilik Tujuan Bandwidth Skala Jadwal
CXL 4.0 Konsorsium Koherensi memori 128 GT/s Multi-rack Akhir 2026-2027
NVLink 5 NVIDIA GPU-GPU 1,8 TB/s 576 GPU Tersedia
UALink 1.0 Konsorsium dipimpin AMD Akselerator-akselerator 200 Gb/s/lane 1.024 perangkat Akhir 2026
Ultra Ethernet UEC Jaringan scale-out Berbasis Ethernet 10.000+ endpoint 2026+
UB-Mesh Huawei Interkoneksi terpadu 1+ TB/s/perangkat 1M prosesor Open source

Kerangka Keputusan Interkoneksi

Kapan menggunakan standar mana:

Kasus Penggunaan Pilihan Terbaik Mengapa
GPU-ke-GPU dalam node NVLink Bandwidth tertinggi (1,8 TB/s), latensi terendah
GPU-ke-GPU antar node UALink Alternatif standar terbuka untuk NVLink
Ekspansi memori CXL Koherensi cache dengan CPU, pooling memori
Jaringan scale-out Ultra Ethernet / InfiniBand Dirancang untuk kluster 10.000+ endpoint
Ekosistem terpadu China UB-Mesh Menghindari pembatasan IP Barat

UALink tidak bersaing langsung dengan CXL. Mereka melayani tujuan berbeda:10

  • UALink: Penskalaan GPU-ke-GPU untuk kluster akselerator (scale-up)
  • CXL: Koherensi CPU-memori dan pooling memori (ekspansi memori)
  • Ultra Ethernet: Jaringan scale-out di seluruh pusat data

"UALink bekerja bersama PCIe dan CXL, tetapi hanya UALink yang memiliki efek menyatukan sumber daya yang dialokasikan. UALink dirancang untuk menghubungkan unit GPU utama Anda untuk penskalaan GPU-ke-GPU," jelas Michael Posner, VP of Product Management di Synopsys.11

UB-Mesh Huawei

Pendekatan alternatif Huawei bertujuan untuk menggantikan semua interkoneksi yang ada:12

  • Menargetkan bandwidth 1 TB/s+ per perangkat
  • ~150 ns latensi per hop (peningkatan dari mikrodetik ke nanodetik)
  • Semantik load/store sinkron vs. berbasis paket
  • Lisensi open source diumumkan September 2025
  • Menskalakan hingga 1 juta prosesor dalam arsitektur "SuperNode"

Adopsi industri tetap tidak pasti mengingat kekhawatiran geopolitik dan momentum standar yang ada.


Apa Selanjutnya

Akhir 2026: Switch UALink mencapai pusat data; produk CXL 4.0 mulai sampling.

Akhir 2026-2027: Sistem multi-rack CXL 4.0 mencapai penerapan produksi.13

Q4 2026: Upscale AI menargetkan pengiriman switch UALink.14

Berlangsung: Badan standar menavigasi koeksistensi CXL, UALink, dan Ultra Ethernet. UB-Mesh Huawei mencari adopsi di luar pasar Barat.

Lanskap interkoneksi akan tetap terfragmentasi setidaknya hingga 2027. Tidak ada standar tunggal yang menangani semua kasus penggunaan: pooling memori (CXL), penskalaan akselerator (UALink/NVLink), dan fabric jaringan (Ultra Ethernet/InfiniBand).


Poin Penting

Untuk perencana infrastruktur: - CXL 4.0 memungkinkan pool memori 100+ TB dengan koherensi cache antar rack - Panmnesia menyediakan sampel switch fabric CXL 3.2 pertama dengan routing berbasis port - Rencanakan koeksistensi standar: CXL + UALink + Ultra Ethernet/InfiniBand - Jadwal penerapan akhir 2026-2027 untuk sistem produksi CXL 4.0

Untuk tim operasi: - CXL mempertahankan kompatibilitas mundur dengan generasi sebelumnya - Routing berbasis port menyederhanakan manajemen fabric multi-rack - Latensi nanodetik dua digit untuk akses memori melalui switch - Pantau Panmnesia, XConn, dan vendor switch CXL lainnya untuk ketersediaan

Untuk perencanaan strategis: - Tidak ada standar interkoneksi tunggal yang akan "menang" karena lapisan berbeda melayani tujuan berbeda - Pooling memori menjadi layak untuk inferensi AI dalam skala besar - UB-Mesh Huawei menciptakan ekosistem paralel terutama untuk pasar China - Keputusan peralatan di 2025-2026 akan memengaruhi interoperabilitas hingga 2030


Referensi


Untuk penerapan infrastruktur AI dengan arsitektur interkoneksi canggih, hubungi Introl.


  1. CXL Consortium. "CXL Consortium Releases the Compute Express Link 4.0 Specification." 18 November 2025. 

  2. VideoCardz. "CXL 4.0 spec moves to PCIe 7.0, doubles bandwidth over CXL 3.0." November 2025. 

  3. Business Wire. "CXL Consortium Releases the Compute Express Link 4.0 Specification Increasing Speed and Bandwidth." 18 November 2025. 

  4. Business Wire. "Panmnesia Announces Sample Availability of PCIe 6.0/CXL 3.2 Fabric Switch." 12 November 2025. 

  5. Tom's Hardware. "Huawei to open-source its UB-Mesh data center-scale interconnect soon." Agustus 2025. 

  6. Datacenter.news. "CXL 4.0 doubles bandwidth, introduces bundled ports for data centres." November 2025. 

  7. Panmnesia. "Press Release: PCIe 6.0/CXL 3.2 Fabric Switch." November 2025. 

  8. Blocks and Files. "CXL 4.0 doubles bandwidth and stretches memory pooling to multi-rack setups." 24 November 2025. 

  9. TechPowerUp. "Panmnesia Samples Industry's First PCIe 6.0/CXL 3.2 Fabric Switch." November 2025. 

  10. Semi Engineering. "New Data Center Protocols Tackle AI." 2025. 

  11. Synopsys. "Ultra Ethernet UaLink AI Networks." 2025. 

  12. ServeTheHome. "Huawei Presents UB-Mesh Interconnect for Large AI SuperNodes at Hot Chips 2025." Agustus 2025. 

  13. Blocks and Files. "CXL 4.0 doubles bandwidth." November 2025. 

  14. HPCwire. "Upscale AI Eyes Late 2026 for Scale-Up UALink Switch." 2 Desember 2025. 

  15. EE Times. "CXL Adds Port Bundling to Quench AI Thirst." November 2025. 

  16. SDxCentral. "Compute Express Link Consortium debuts 4.0 spec to push past bandwidth bottlenecks." November 2025. 

  17. CXL Consortium. "CXL 4.0 White Paper." November 2025. 

Request a Quote_

Tell us about your project and we'll respond within 72 hours.

> TRANSMISSION_COMPLETE

Request Received_

Thank you for your inquiry. Our team will review your request and respond within 72 hours.

QUEUED FOR PROCESSING