CXL 4.0과 인터커넥트 전쟁: AI 메모리가 데이터 센터 아키텍처를 재편하는 방법
2025년 12월 12일
2025년 12월 업데이트: CXL 컨소시엄은 11월 18일 CXL 4.0을 출시하여 PCIe 7.0으로 대역폭을 128 GT/s로 두 배로 늘리고 1.5 TB/s 연결을 위한 번들 포트를 도입했습니다. Panmnesia는 포트 기반 라우팅을 갖춘 업계 최초의 CXL 3.2 패브릭 스위치 샘플 제공을 시작했습니다. 한편 UALink는 2026년 말 배포를 목표로 하고 Huawei는 대안으로 UB-Mesh를 오픈소스로 공개했습니다.
요약
CXL 4.0은 차세대 메모리 인터커넥트 기술을 대표하며, AI 인프라 전반에 걸쳐 캐시 일관성을 유지하면서 100테라바이트 이상의 풀링된 메모리를 가능하게 합니다. 사양의 번들 포트 기능은 여러 물리적 포트를 총 1.5 TB/s 대역폭을 제공하는 단일 논리적 연결로 집계할 수 있게 합니다. Panmnesia의 CXL 3.2 패브릭 스위치는 멀티 랙 AI 클러스터를 위한 포트 기반 라우팅을 구현한 최초의 하드웨어입니다. UALink, Ultra Ethernet, Huawei의 UB-Mesh가 서로 다른 틈새 시장을 두고 경쟁하면서 더 넓은 인터커넥트 환경은 계속 분열되고 있습니다.
무슨 일이 일어났나
CXL 컨소시엄은 2025년 11월 18일 SC25에서 Compute Express Link 4.0 사양을 출시했습니다.1 이 사양은 PCIe 6.x(64 GT/s)에서 PCIe 7.0(128 GT/s)으로 전환하여 CXL 3.x에서 도입된 256바이트 FLIT 형식을 유지하면서 가용 대역폭을 두 배로 늘립니다.2
"CXL 4.0 사양의 출시는 일관성 있는 메모리 연결성 발전의 새로운 이정표를 세우며, 강력한 새 기능과 함께 이전 세대 대비 대역폭을 두 배로 늘렸습니다"라고 CXL 컨소시엄 회장이자 NVIDIA의 수석 엔지니어인 Derek Rohde가 말했습니다.3
4일 전인 11월 12일, 한국 스타트업 Panmnesia는 PCIe 6.0/CXL 3.2 패브릭 스위치의 샘플 가용성을 발표했습니다: CXL 패브릭용 포트 기반 라우팅(PBR)을 구현한 최초의 실리콘입니다.4
인터커넥트 환경은 계속 분열되고 있습니다. UALink는 2026년 말 데이터 센터 배포를 목표로 합니다. Huawei는 PCIe, CXL, NVLink, TCP/IP를 통합 표준으로 대체하도록 설계된 UB-Mesh 프로토콜을 오픈소스로 공개할 것이라고 발표했습니다.5
인프라에 왜 중요한가
메모리가 구성 가능해짐: CXL 4.0은 대규모 메모리 풀링을 가능하게 합니다. 수백 테라바이트가 필요한 AI 추론 워크로드는 이제 단일 서버 내에서만이 아니라 캐시 일관성을 가지고 랙 전반에 걸쳐 공유 메모리 풀에 액세스할 수 있습니다.
대역폭이 AI 수요에 부합: 128 GT/s에서 x16 링크를 가진 CXL 4.0 번들 포트는 각 방향으로 768 GB/s(장치와 CPU 간 총 대역폭 1.536 TB/s)를 제공합니다.6 LLM 추론 서빙은 이 용량으로부터 직접적인 이점을 얻습니다.
멀티 랙 AI 클러스터: CXL 3.2/4.0의 포트 기반 라우팅은 패브릭 스위치가 긴 네트워크 지연 없이 여러 랙에 걸쳐 수천 개의 장치를 상호 연결할 수 있게 합니다. Panmnesia는 메모리 액세스에 대해 "두 자릿수 나노초 지연"을 주장합니다.7
표준 분열 위험: 네 개의 경쟁하는 인터커넥트 생태계(CXL/PCIe, UALink, Ultra Ethernet, NVLink)는 인프라 계획자들에게 승자에 베팅하도록 강요합니다. 오늘 구매한 장비는 2027년에 상호 운용성 문제에 직면할 수 있습니다.
기술 세부 사항
CXL 4.0 사양
| 기능 | CXL 3.x | CXL 4.0 |
|---|---|---|
| 기본 프로토콜 | PCIe 6.x | PCIe 7.0 |
| 전송 속도 | 64 GT/s | 128 GT/s |
| FLIT 크기 | 256B | 256B |
| 지원 리타이머 | 2 | 4 |
| 링크 폭 옵션 | 표준 | 네이티브 x2 추가 |
| 번들 포트 | 아니오 | 예 |
번들 포트 아키텍처
CXL 4.0의 번들 포트는 여러 물리적 CXL 장치 포트를 단일 논리적 엔티티로 집계합니다:8
- 호스트 및 Type 1/2 장치는 여러 물리적 포트를 결합할 수 있음
- 시스템 소프트웨어는 여러 물리적 연결에도 불구하고 단일 장치로 인식
- 256B FLIT 모드에 최적화되어 레거시 68B FLIT 오버헤드 제거
- 논리적 연결당 1.5+ TB/s 총 대역폭 가능
Panmnesia CXL 3.2 패브릭 스위치
최초의 CXL 3.2 스위치 실리콘에는 다음이 포함됩니다:9
| 사양 | 세부 사항 |
|---|---|
| 프로토콜 지원 | PCIe Gen 6.0 + CXL 3.2 하이브리드 |
| 데이터 속도 | 64 GT/s |
| 라우팅 모드 | PBR(포트 기반) 및 HBR(계층 기반) |
| CXL 서브프로토콜 | CXL.cache, CXL.mem, CXL.io |
| 레인 수 | 256레인 고 팬아웃 |
| 지연 | 두 자릿수 나노초 |
| 하위 호환성 | 모든 이전 PCIe/CXL 세대 |
대상 애플리케이션에는 DLRM(딥 러닝 추천 모델), LLM 추론, RAG 워크로드, MPI 기반 HPC 시뮬레이션이 포함됩니다.
경쟁 인터커넥트 표준
| 표준 | 소유자 | 목적 | 대역폭 | 규모 | 일정 |
|---|---|---|---|---|---|
| CXL 4.0 | 컨소시엄 | 메모리 일관성 | 128 GT/s | 멀티 랙 | 2026년 말-2027년 |
| NVLink 5 | NVIDIA | GPU-GPU | 1.8 TB/s | 576 GPU | 사용 가능 |
| UALink 1.0 | AMD 주도 컨소시엄 | 가속기-가속기 | 200 Gb/s/레인 | 1,024 장치 | 2026년 말 |
| Ultra Ethernet | UEC | 스케일아웃 네트워킹 | 이더넷 기반 | 10,000+ 엔드포인트 | 2026년 이후 |
| UB-Mesh | Huawei | 통합 인터커넥트 | 1+ TB/s/장치 | 100만 프로세서 | 오픈소스화 |
인터커넥트 결정 프레임워크
어떤 표준을 언제 사용할지:
| 사용 사례 | 최선의 선택 | 이유 |
|---|---|---|
| 노드 내 GPU-GPU | NVLink | 최고 대역폭(1.8 TB/s), 최저 지연 |
| 노드 간 GPU-GPU | UALink | NVLink에 대한 개방형 표준 대안 |
| 메모리 확장 | CXL | CPU와의 캐시 일관성, 메모리 풀링 |
| 스케일아웃 네트워킹 | Ultra Ethernet / InfiniBand | 10,000+ 엔드포인트 클러스터용 설계 |
| 중국 통합 생태계 | UB-Mesh | 서양 IP 제한 회피 |
UALink vs. CXL 포지셔닝
UALink는 CXL과 직접 경쟁하지 않습니다. 서로 다른 목적을 수행합니다:10
- UALink: 가속기 클러스터를 위한 GPU-GPU 스케일링(스케일업)
- CXL: CPU-메모리 일관성 및 메모리 풀링(메모리 확장)
- Ultra Ethernet: 데이터 센터 간 스케일아웃 네트워킹
"UALink는 PCIe 및 CXL과 함께 작동하지만, 할당된 리소스를 통합하는 효과를 가진 것은 UALink뿐입니다. UALink는 GPU-GPU 스케일링을 위해 주요 GPU 유닛을 연결하도록 설계되었습니다"라고 Synopsys의 제품 관리 VP인 Michael Posner가 설명했습니다.11
Huawei UB-Mesh
Huawei의 대안적 접근 방식은 모든 기존 인터커넥트를 대체하는 것을 목표로 합니다:12
- 장치당 1 TB/s+ 대역폭 목표
- ~150 ns 홉 지연(마이크로초에서 나노초로 개선)
- 패킷 기반 대비 동기식 로드/스토어 시맨틱
- 2025년 9월 오픈소스 라이선스 발표
- "SuperNode" 아키텍처에서 100만 프로세서로 확장
지정학적 우려와 기존 표준의 모멘텀을 고려할 때 산업 채택은 불확실합니다.
다음 단계
2026년 말: UALink 스위치가 데이터 센터에 도달; CXL 4.0 제품 샘플링 시작.
2026년 말-2027년: CXL 4.0 멀티 랙 시스템이 프로덕션 배포에 도달.13
2026년 Q4: Upscale AI가 UALink 스위치 납품 목표.14
진행 중: 표준 기관들이 CXL, UALink, Ultra Ethernet의 공존을 조율. Huawei의 UB-Mesh는 서양 시장 외 채택을 모색.
인터커넥트 환경은 적어도 2027년까지 분열된 상태로 유지될 것입니다. 단일 표준이 모든 사용 사례를 해결하지 못합니다: 메모리 풀링(CXL), 가속기 스케일링(UALink/NVLink), 네트워크 패브릭(Ultra Ethernet/InfiniBand).
핵심 요점
인프라 계획자용: - CXL 4.0은 랙 간 캐시 일관성을 가진 100+ TB 메모리 풀 가능 - Panmnesia가 포트 기반 라우팅을 갖춘 최초의 CXL 3.2 패브릭 스위치 샘플링 - 표준 공존 계획: CXL + UALink + Ultra Ethernet/InfiniBand - CXL 4.0 프로덕션 시스템 배포 일정 2026년 말-2027년
운영 팀용: - CXL은 이전 세대와의 하위 호환성 유지 - 포트 기반 라우팅이 멀티 랙 패브릭 관리 단순화 - 스위치를 통한 메모리 액세스에 두 자릿수 나노초 지연 - Panmnesia, XConn 및 기타 CXL 스위치 공급업체 가용성 모니터링
전략적 계획용: - 서로 다른 레이어가 서로 다른 목적을 수행하므로 단일 인터커넥트 표준이 "이기지" 않을 것 - 메모리 풀링이 대규모 AI 추론에 실현 가능해짐 - Huawei의 UB-Mesh가 주로 중국 시장을 위한 병렬 생태계 생성 - 2025-2026년 장비 결정이 2030년까지 상호 운용성에 영향
참고 문헌
고급 인터커넥트 아키텍처를 통한 AI 인프라 배포에 대해서는 Introl에 문의하세요.
-
CXL Consortium. "CXL Consortium Releases the Compute Express Link 4.0 Specification." 2025년 11월 18일. ↩
-
VideoCardz. "CXL 4.0 spec moves to PCIe 7.0, doubles bandwidth over CXL 3.0." 2025년 11월. ↩
-
Business Wire. "CXL Consortium Releases the Compute Express Link 4.0 Specification Increasing Speed and Bandwidth." 2025년 11월 18일. ↩
-
Business Wire. "Panmnesia Announces Sample Availability of PCIe 6.0/CXL 3.2 Fabric Switch." 2025년 11월 12일. ↩
-
Tom's Hardware. "Huawei to open-source its UB-Mesh data center-scale interconnect soon." 2025년 8월. ↩
-
Datacenter.news. "CXL 4.0 doubles bandwidth, introduces bundled ports for data centres." 2025년 11월. ↩
-
Panmnesia. "Press Release: PCIe 6.0/CXL 3.2 Fabric Switch." 2025년 11월. ↩
-
Blocks and Files. "CXL 4.0 doubles bandwidth and stretches memory pooling to multi-rack setups." 2025년 11월 24일. ↩
-
TechPowerUp. "Panmnesia Samples Industry's First PCIe 6.0/CXL 3.2 Fabric Switch." 2025년 11월. ↩
-
Semi Engineering. "New Data Center Protocols Tackle AI." 2025년. ↩
-
Synopsys. "Ultra Ethernet UaLink AI Networks." 2025년. ↩
-
ServeTheHome. "Huawei Presents UB-Mesh Interconnect for Large AI SuperNodes at Hot Chips 2025." 2025년 8월. ↩
-
Blocks and Files. "CXL 4.0 doubles bandwidth." 2025년 11월. ↩
-
HPCwire. "Upscale AI Eyes Late 2026 for Scale-Up UALink Switch." 2025년 12월 2일. ↩
-
EE Times. "CXL Adds Port Bundling to Quench AI Thirst." 2025년 11월. ↩
-
SDxCentral. "Compute Express Link Consortium debuts 4.0 spec to push past bandwidth bottlenecks." 2025년 11월. ↩
-
CXL Consortium. "CXL 4.0 White Paper." 2025년 11월. ↩