CXL 4.0과 인터커넥트 전쟁: AI 메모리가 데이터센터 아키텍처를 재편하는 방법
2025년 12월 12일
2025년 12월 업데이트: CXL 컨소시엄이 11월 18일 CXL 4.0을 발표했습니다. PCIe 7.0과 함께 대역폭이 128 GT/s로 두 배 증가하고, 번들 포트를 통해 1.5 TB/s 연결이 가능해졌습니다. Panmnesia는 포트 기반 라우팅을 지원하는 업계 최초의 CXL 3.2 패브릭 스위치 샘플 출하를 시작했습니다. 한편 UALink는 2026년 말 배포를 목표로 하고 있으며, Huawei는 UB-Mesh를 대안으로 오픈소스화했습니다.
요약
CXL 4.0은 차세대 메모리 인터커넥트 기술로, AI 인프라 전반에 걸쳐 캐시 일관성을 갖춘 100+ 테라바이트 규모의 풀링된 메모리를 지원합니다. 이 사양의 번들 포트 기능은 여러 물리적 포트를 단일 논리적 연결로 집계하여 총 1.5 TB/s의 대역폭을 제공합니다. Panmnesia의 CXL 3.2 패브릭 스위치는 멀티 랙 AI 클러스터를 위한 포트 기반 라우팅을 구현한 최초의 하드웨어입니다. 더 넓은 인터커넥트 환경은 UALink, Ultra Ethernet, Huawei의 UB-Mesh가 각기 다른 영역에서 경쟁하면서 더욱 파편화되고 있습니다.
무슨 일이 있었나
CXL 컨소시엄은 2025년 11월 18일 SC25에서 Compute Express Link 4.0 사양을 발표했습니다.1 이 사양은 PCIe 6.x(64 GT/s)에서 PCIe 7.0(128 GT/s)으로 전환하여 CXL 3.x에서 도입된 256바이트 FLIT 형식을 유지하면서 사용 가능한 대역폭을 두 배로 늘렸습니다.2
"CXL 4.0 사양의 발표는 일관된 메모리 연결성 발전에 새로운 이정표를 세웁니다. 강력한 새 기능과 함께 이전 세대 대비 대역폭이 두 배로 증가했습니다"라고 CXL 컨소시엄 회장이자 NVIDIA 수석 엔지니어인 Derek Rohde가 밝혔습니다.3
4일 전인 11월 12일, 한국 스타트업 Panmnesia는 PCIe 6.0/CXL 3.2 패브릭 스위치의 샘플 출하를 발표했습니다. 이는 CXL 패브릭용 포트 기반 라우팅(PBR)을 구현한 최초의 실리콘입니다.4
인터커넥트 환경은 계속 파편화되고 있습니다. UALink는 2026년 말 데이터센터 배포를 목표로 합니다. Huawei는 PCIe, CXL, NVLink, TCP/IP를 통합 표준으로 대체하도록 설계된 UB-Mesh 프로토콜을 오픈소스화할 것이라고 발표했습니다.5
인프라에 미치는 영향
메모리의 조합형 구성: CXL 4.0은 대규모 메모리 풀링을 가능하게 합니다. 수백 테라바이트가 필요한 AI 추론 워크로드는 이제 단일 서버 내부뿐만 아니라 랙 전체에 걸쳐 캐시 일관성을 갖춘 공유 메모리 풀에 접근할 수 있습니다.
AI 수요에 맞는 대역폭: 128 GT/s의 x16 링크를 가진 CXL 4.0 번들 포트는 각 방향으로 768 GB/s(장치와 CPU 간 총 1.536 TB/s 대역폭)를 제공합니다.6 LLM 추론 서빙이 이 용량으로부터 직접적인 혜택을 받습니다.
멀티 랙 AI 클러스터: CXL 3.2/4.0의 포트 기반 라우팅은 패브릭 스위치가 긴 네트워크 지연 없이 여러 랙에 걸쳐 수천 개의 장치를 상호 연결할 수 있게 합니다. Panmnesia는 메모리 접근에 "두 자릿수 나노초 지연시간"을 주장합니다.7
표준 파편화 위험: 네 가지 경쟁 인터커넥트 생태계(CXL/PCIe, UALink, Ultra Ethernet, NVLink)로 인해 인프라 기획자들은 승자에 베팅해야 합니다. 오늘 구매한 장비가 2027년에 상호운용성 문제에 직면할 수 있습니다.
기술 세부사항
CXL 4.0 사양
| 기능 | CXL 3.x | CXL 4.0 |
|---|---|---|
| 기반 프로토콜 | PCIe 6.x | PCIe 7.0 |
| 전송 속도 | 64 GT/s | 128 GT/s |
| FLIT 크기 | 256B | 256B |
| 지원 리타이머 | 2 | 4 |
| 링크 폭 옵션 | 표준 | 네이티브 x2 추가 |
| 번들 포트 | 아니오 | 예 |
번들 포트 아키텍처
CXL 4.0의 번들 포트는 여러 물리적 CXL 장치 포트를 단일 논리적 엔티티로 집계합니다:8
- 호스트와 Type 1/2 장치가 여러 물리적 포트를 결합할 수 있음
- 여러 물리적 연결에도 불구하고 시스템 소프트웨어는 단일 장치로 인식
- 256B Flit 모드에 최적화되어 레거시 68B Flit 오버헤드 제거
- 논리적 연결당 1.5+ TB/s 총 대역폭 지원
Panmnesia CXL 3.2 패브릭 스위치
최초의 CXL 3.2 스위치 실리콘 포함 사항:9
| 사양 | 세부사항 |
|---|---|
| 프로토콜 지원 | PCIe Gen 6.0 + CXL 3.2 하이브리드 |
| 데이터 속도 | 64 GT/s |
| 라우팅 모드 | PBR(포트 기반) 및 HBR(계층 기반) |
| CXL 서브프로토콜 | CXL.cache, CXL.mem, CXL.io |
| 레인 수 | 256레인 고 팬아웃 |
| 지연시간 | 두 자릿수 나노초 |
| 하위 호환성 | 모든 이전 PCIe/CXL 세대 |
대상 애플리케이션에는 DLRM(딥러닝 추천 모델), LLM 추론, RAG 워크로드, MPI 기반 HPC 시뮬레이션이 포함됩니다.
경쟁 인터커넥트 표준
| 표준 | 소유자 | 목적 | 대역폭 | 규모 | 일정 |
|---|---|---|---|---|---|
| CXL 4.0 | 컨소시엄 | 메모리 일관성 | 128 GT/s | 멀티 랙 | 2026년 말-2027년 |
| NVLink 5 | NVIDIA | GPU-GPU | 1.8 TB/s | 576 GPU | 출시됨 |
| UALink 1.0 | AMD 주도 컨소시엄 | 가속기-가속기 | 200 Gb/s/레인 | 1,024 장치 | 2026년 말 |
| Ultra Ethernet | UEC | 스케일아웃 네트워킹 | 이더넷 기반 | 만 단위 엔드포인트 | 2026년+ |
| UB-Mesh | Huawei | 통합 인터커넥트 | 장치당 1+ TB/s | 100만 프로세서 | 오픈소스화 |
인터커넥트 결정 프레임워크
어떤 표준을 언제 사용할 것인가:
| 사용 사례 | 최적 선택 | 이유 |
|---|---|---|
| 노드 내 GPU-GPU | NVLink | 최고 대역폭(1.8 TB/s), 최저 지연시간 |
| 노드 간 GPU-GPU | UALink | NVLink의 오픈 표준 대안 |
| 메모리 확장 | CXL | CPU와의 캐시 일관성, 메모리 풀링 |
| 스케일아웃 네트워킹 | Ultra Ethernet / InfiniBand | 만 단위 이상 엔드포인트 클러스터용 설계 |
| 통합 중국 생태계 | UB-Mesh | 서방 IP 제한 회피 |
UALink vs. CXL 포지셔닝
UALink는 CXL과 직접 경쟁하지 않습니다. 서로 다른 목적을 가지고 있습니다:10
- UALink: 가속기 클러스터를 위한 GPU-GPU 스케일링(스케일업)
- CXL: CPU-메모리 일관성 및 메모리 풀링(메모리 확장)
- Ultra Ethernet: 데이터센터 전반의 스케일아웃 네트워킹
"UALink는 PCIe 및 CXL과 함께 작동하지만, 할당된 리소스를 통합하는 효과는 UALink만이 가지고 있습니다. UALink는 GPU-GPU 스케일링을 위해 주요 GPU 유닛을 연결하도록 설계되었습니다"라고 Synopsys의 제품 관리 부사장 Michael Posner가 설명했습니다.11
Huawei UB-Mesh
Huawei의 대안적 접근 방식은 모든 기존 인터커넥트를 대체하는 것을 목표로 합니다:12
- 장치당 1 TB/s+ 대역폭 목표
- ~150 ns 홉 지연시간(마이크로초에서 나노초로 개선)
- 패킷 기반 대비 동기식 로드/스토어 시맨틱스
- 2025년 9월 오픈소스 라이선스 발표
- "SuperNode" 아키텍처로 100만 프로세서까지 확장
지정학적 우려와 기존 표준의 모멘텀을 고려할 때 업계 채택은 불확실합니다.
향후 전망
2026년 말: UALink 스위치가 데이터센터에 도달; CXL 4.0 제품 샘플링 시작.
2026년 말-2027년: CXL 4.0 멀티 랙 시스템이 프로덕션 배포에 도달.13
2026년 4분기: Upscale AI가 UALink 스위치 출하 목표.14
진행 중: 표준 기관들이 CXL, UALink, Ultra Ethernet의 공존을 조율. Huawei의 UB-Mesh는 서방 시장 외 지역에서 채택을 모색.
인터커넥트 환경은 최소 2027년까지 파편화된 상태를 유지할 것입니다. 메모리 풀링(CXL), 가속기 스케일링(UALink/NVLink), 네트워크 패브릭(Ultra Ethernet/InfiniBand) 등 모든 사용 사례를 단일 표준이 해결하지는 못합니다.
핵심 시사점
인프라 기획자용: - CXL 4.0은 랙 전체에 걸쳐 캐시 일관성을 갖춘 100+ TB 메모리 풀 지원 - Panmnesia가 포트 기반 라우팅을 갖춘 최초의 CXL 3.2 패브릭 스위치 샘플링 - 표준 공존 계획: CXL + UALink + Ultra Ethernet/InfiniBand - CXL 4.0 프로덕션 시스템 배포 일정은 2026년 말-2027년
운영팀용: - CXL은 이전 세대와의 하위 호환성 유지 - 포트 기반 라우팅으로 멀티 랙 패브릭 관리 단순화 - 스위치를 통한 메모리 접근에 두 자릿수 나노초 지연시간 - Panmnesia, XConn 및 기타 CXL 스위치 벤더의 가용성 모니터링
전략 기획용: - 서로 다른 계층이 다른 목적을 수행하므로 단일 인터커넥트 표준이 "승리"하지 않을 것 - AI 추론에서 메모리 풀링이 대규모로 실현 가능해짐 - Huawei의 UB-Mesh가 주로 중국 시장을 위한 병렬 생태계 구축 - 2025-2026년 장비 결정이 2030년까지 상호운용성에 영향
참고문헌
고급 인터커넥트 아키텍처를 활용한 AI 인프라 배포에 대해서는 Introl에 문의하세요.
-
CXL Consortium. "CXL Consortium Releases the Compute Express Link 4.0 Specification." November 18, 2025. ↩
-
VideoCardz. "CXL 4.0 spec moves to PCIe 7.0, doubles bandwidth over CXL 3.0." November 2025. ↩
-
Business Wire. "CXL Consortium Releases the Compute Express Link 4.0 Specification Increasing Speed and Bandwidth." November 18, 2025. ↩
-
Business Wire. "Panmnesia Announces Sample Availability of PCIe 6.0/CXL 3.2 Fabric Switch." November 12, 2025. ↩
-
Tom's Hardware. "Huawei to open-source its UB-Mesh data center-scale interconnect soon." August 2025. ↩
-
Datacenter.news. "CXL 4.0 doubles bandwidth, introduces bundled ports for data centres." November 2025. ↩
-
Panmnesia. "Press Release: PCIe 6.0/CXL 3.2 Fabric Switch." November 2025. ↩
-
Blocks and Files. "CXL 4.0 doubles bandwidth and stretches memory pooling to multi-rack setups." November 24, 2025. ↩
-
TechPowerUp. "Panmnesia Samples Industry's First PCIe 6.0/CXL 3.2 Fabric Switch." November 2025. ↩
-
Semi Engineering. "New Data Center Protocols Tackle AI." 2025. ↩
-
Synopsys. "Ultra Ethernet UaLink AI Networks." 2025. ↩
-
ServeTheHome. "Huawei Presents UB-Mesh Interconnect for Large AI SuperNodes at Hot Chips 2025." August 2025. ↩
-
Blocks and Files. "CXL 4.0 doubles bandwidth." November 2025. ↩
-
HPCwire. "Upscale AI Eyes Late 2026 for Scale-Up UALink Switch." December 2, 2025. ↩
-
EE Times. "CXL Adds Port Bundling to Quench AI Thirst." November 2025. ↩
-
SDxCentral. "Compute Express Link Consortium debuts 4.0 spec to push past bandwidth bottlenecks." November 2025. ↩
-
CXL Consortium. "CXL 4.0 White Paper." November 2025. ↩