CXL 4.0 та війни інтерконектів: як пам'ять для ШІ змінює архітектуру дата-центрів

Специфікацію CXL 4.0 випущено 18 листопада з PCIe 7.0, 128 GT/s, об'єднаними портами. Panmnesia поставляє перший комутатор фабрики CXL 3.2. UALink, Ultra Ethernet, Huawei UB-Mesh конкурують.

CXL 4.0 та війни інтерконектів: як пам'ять для ШІ змінює архітектуру дата-центрів

CXL 4.0 та війни інтерконектів: як пам'ять для ШІ змінює архітектуру дата-центрів

12 грудня 2025 року

Оновлення за грудень 2025: Консорціум CXL випустив CXL 4.0 18 листопада, подвоївши пропускну здатність до 128 GT/s із PCIe 7.0 та запровадивши об'єднані порти для з'єднань на 1,5 ТБ/с. Panmnesia почала постачати зразки першого в галузі комутатора фабрики CXL 3.2 з портовою маршрутизацією. Тим часом UALink планує розгортання наприкінці 2026 року, а Huawei відкрила вихідний код UB-Mesh як альтернативу.


Коротко

CXL 4.0 представляє нове покоління технології інтерконекту пам'яті, що забезпечує понад 100 терабайт об'єднаної пам'яті з когерентністю кешу в інфраструктурі ШІ. Функція об'єднаних портів специфікації дозволяє агрегувати кілька фізичних портів в єдине логічне підключення із загальною пропускною здатністю 1,5 ТБ/с. Комутатор фабрики CXL 3.2 від Panmnesia є першим апаратним рішенням, що реалізує портову маршрутизацію для багатостійкових кластерів ШІ. Ширший ландшафт інтерконектів продовжує фрагментуватися, оскільки UALink, Ultra Ethernet та UB-Mesh від Huawei конкурують за різні ніші.


Що сталося

Консорціум CXL випустив специфікацію Compute Express Link 4.0 18 листопада 2025 року на SC25.1 Специфікація переходить з PCIe 6.x (64 GT/s) на PCIe 7.0 (128 GT/s), подвоюючи доступну пропускну здатність, зберігаючи при цьому формат 256-байтового FLIT, запроваджений у CXL 3.x.2

«Випуск специфікації CXL 4.0 встановлює нову віху в розвитку когерентного підключення пам'яті, подвоюючи пропускну здатність порівняно з попереднім поколінням із потужними новими функціями», — заявив Дерек Роуд, президент Консорціуму CXL та головний інженер NVIDIA.3

Чотирма днями раніше, 12 листопада, корейський стартап Panmnesia оголосив про доступність зразків свого комутатора фабрики PCIe 6.0/CXL 3.2: першого кремнію, що реалізує портову маршрутизацію (PBR) для фабрик CXL.4

Ландшафт інтерконектів продовжує фрагментуватися. UALink націлений на розгортання в дата-центрах наприкінці 2026 року. Huawei оголосила, що відкриє вихідний код свого протоколу UB-Mesh, розробленого для заміни PCIe, CXL, NVLink та TCP/IP єдиним стандартом.5


Чому це важливо для інфраструктури

Пам'ять стає компонованою: CXL 4.0 забезпечує масштабне об'єднання пам'яті. Робочі навантаження інференсу ШІ, що потребують сотень терабайт, тепер можуть отримувати доступ до спільних пулів пам'яті між стійками з когерентністю кешу, а не лише в межах одного сервера.

Пропускна здатність відповідає вимогам ШІ: Об'єднаний порт CXL 4.0 з лінками x16 на 128 GT/s забезпечує 768 ГБ/с у кожному напрямку (загальна пропускна здатність 1,536 ТБ/с між пристроєм і CPU).6 Обслуговування інференсу LLM безпосередньо виграє від цієї потужності.

Багатостійкові кластери ШІ: Портова маршрутизація в CXL 3.2/4.0 дозволяє комутаторам фабрики з'єднувати тисячі пристроїв між кількома стійками без тривалої мережевої затримки. Panmnesia заявляє про «двозначні наносекундні затримки» для доступу до пам'яті.7

Ризик фрагментації стандартів: Чотири конкуруючі екосистеми інтерконектів (CXL/PCIe, UALink, Ultra Ethernet, NVLink) змушують планувальників інфраструктури робити ставки на переможців. Обладнання, придбане сьогодні, може зіткнутися з проблемами сумісності у 2027 році.


Технічні деталі

Специфікація CXL 4.0

Функція CXL 3.x CXL 4.0
Базовий протокол PCIe 6.x PCIe 7.0
Швидкість передачі 64 GT/s 128 GT/s
Розмір FLIT 256B 256B
Підтримувані ретаймери 2 4
Варіанти ширини лінка Стандартні Додано нативний x2
Об'єднані порти Ні Так

Архітектура об'єднаних портів

Об'єднані порти CXL 4.0 агрегують кілька фізичних портів пристрою CXL в єдину логічну сутність:8

  • Хост і пристрої Type 1/2 можуть комбінувати кілька фізичних портів
  • Системне програмне забезпечення бачить єдиний пристрій, незважаючи на кілька фізичних з'єднань
  • Оптимізовано для режиму 256B Flit, що усуває накладні витрати застарілого 68B Flit
  • Забезпечує загальну пропускну здатність 1,5+ ТБ/с на логічне з'єднання

Комутатор фабрики Panmnesia CXL 3.2

Перший кремній комутатора CXL 3.2 включає:9

Специфікація Деталі
Підтримка протоколу Гібрид PCIe Gen 6.0 + CXL 3.2
Швидкість передачі даних 64 GT/s
Режими маршрутизації PBR (портова) та HBR (ієрархічна)
Субпротоколи CXL CXL.cache, CXL.mem, CXL.io
Кількість ліній 256 ліній з високим fan-out
Затримка Двозначні наносекунди
Зворотна сумісність Усі попередні покоління PCIe/CXL

Цільові застосування включають DLRM (Deep Learning Recommendation Models), інференс LLM, робочі навантаження RAG та HPC-симуляції на базі MPI.

Конкуруючі стандарти інтерконектів

Стандарт Власник Призначення Пропускна здатність Масштаб Терміни
CXL 4.0 Консорціум Когерентність пам'яті 128 GT/s Багатостійковий Кінець 2026-2027
NVLink 5 NVIDIA GPU-GPU 1,8 ТБ/с 576 GPU Доступний
UALink 1.0 Консорціум на чолі з AMD Прискорювач-прискорювач 200 Гб/с/лінія 1 024 пристрої Кінець 2026
Ultra Ethernet UEC Масштабована мережа На базі Ethernet 10 000+ кінцевих точок 2026+
UB-Mesh Huawei Уніфікований інтерконект 1+ ТБ/с/пристрій 1 млн процесорів Відкритий код

Система прийняття рішень щодо інтерконектів

Коли який стандарт використовувати:

Випадок використання Найкращий вибір Чому
GPU-GPU в межах вузла NVLink Найвища пропускна здатність (1,8 ТБ/с), найнижча затримка
GPU-GPU між вузлами UALink Відкрита альтернатива NVLink
Розширення пам'яті CXL Когерентність кешу з CPU, об'єднання пам'яті
Масштабована мережа Ultra Ethernet / InfiniBand Розроблено для кластерів з 10 000+ кінцевих точок
Уніфікована екосистема Китаю UB-Mesh Уникає обмежень західної інтелектуальної власності

UALink не конкурує безпосередньо з CXL. Вони служать різним цілям:10

  • UALink: Масштабування GPU-GPU для кластерів прискорювачів (scale-up)
  • CXL: Когерентність пам'яті CPU та об'єднання пам'яті (розширення пам'яті)
  • Ultra Ethernet: Масштабована мережа по дата-центрах

«UALink працює разом з PCIe та CXL, але лише UALink має ефект об'єднання виділених ресурсів. UALink розроблений для з'єднання ваших основних GPU-блоків для масштабування GPU-GPU», — пояснив Майкл Познер, віцепрезидент з управління продуктами в Synopsys.11

Huawei UB-Mesh

Альтернативний підхід Huawei спрямований на заміну всіх існуючих інтерконектів:12

  • Цільова пропускна здатність 1+ ТБ/с на пристрій
  • Затримка ~150 нс на хоп (покращення з мікросекунд до наносекунд)
  • Синхронна семантика load/store замість пакетної
  • Ліцензія з відкритим кодом оголошена у вересні 2025
  • Масштабується до 1 мільйона процесорів в архітектурі «SuperNode»

Галузеве впровадження залишається невизначеним через геополітичні занепокоєння та інерцію існуючих стандартів.


Що далі

Кінець 2026: Комутатори UALink потрапляють до дата-центрів; продукти CXL 4.0 починають поставки зразків.

Кінець 2026-2027: Багатостійкові системи CXL 4.0 досягають виробничого розгортання.13

4 квартал 2026: Upscale AI планує поставку комутатора UALink.14

Постійно: Органи стандартизації вирішують питання співіснування CXL, UALink та Ultra Ethernet. UB-Mesh від Huawei шукає впровадження за межами західних ринків.

Ландшафт інтерконектів залишатиметься фрагментованим щонайменше до 2027 року. Жоден окремий стандарт не охоплює всі випадки використання: об'єднання пам'яті (CXL), масштабування прискорювачів (UALink/NVLink) та мережева фабрика (Ultra Ethernet/InfiniBand).


Ключові висновки

Для планувальників інфраструктури: - CXL 4.0 забезпечує пули пам'яті понад 100 ТБ з когерентністю кешу між стійками - Panmnesia постачає зразки першого комутатора фабрики CXL 3.2 з портовою маршрутизацією - Плануйте співіснування стандартів: CXL + UALink + Ultra Ethernet/InfiniBand - Терміни розгортання виробничих систем CXL 4.0 — кінець 2026-2027

Для операційних команд: - CXL підтримує зворотну сумісність з попередніми поколіннями - Портова маршрутизація спрощує управління багатостійковою фабрикою - Двозначні наносекундні затримки для доступу до пам'яті через комутатори - Слідкуйте за Panmnesia, XConn та іншими постачальниками комутаторів CXL щодо доступності

Для стратегічного планування: - Жоден окремий стандарт інтерконекту не «переможе», оскільки різні рівні служать різним цілям - Об'єднання пам'яті стає життєздатним для масштабного інференсу ШІ - UB-Mesh від Huawei створює паралельну екосистему переважно для ринку Китаю - Рішення щодо обладнання у 2025-2026 вплинуть на сумісність до 2030 року


Посилання


Для розгортання інфраструктури ШІ з передовими архітектурами інтерконектів зверніться до Introl.



  1. CXL Consortium. "CXL Consortium Releases the Compute Express Link 4.0 Specification." November 18, 2025. 

  2. VideoCardz. "CXL 4.0 spec moves to PCIe 7.0, doubles bandwidth over CXL 3.0." November 2025. 

  3. Business Wire. "CXL Consortium Releases the Compute Express Link 4.0 Specification Increasing Speed and Bandwidth." November 18, 2025. 

  4. Business Wire. "Panmnesia Announces Sample Availability of PCIe 6.0/CXL 3.2 Fabric Switch." November 12, 2025. 

  5. Tom's Hardware. "Huawei to open-source its UB-Mesh data center-scale interconnect soon." August 2025. 

  6. Datacenter.news. "CXL 4.0 doubles bandwidth, introduces bundled ports for data centres." November 2025. 

  7. Panmnesia. "Press Release: PCIe 6.0/CXL 3.2 Fabric Switch." November 2025. 

  8. Blocks and Files. "CXL 4.0 doubles bandwidth and stretches memory pooling to multi-rack setups." November 24, 2025. 

  9. TechPowerUp. "Panmnesia Samples Industry's First PCIe 6.0/CXL 3.2 Fabric Switch." November 2025. 

  10. Semi Engineering. "New Data Center Protocols Tackle AI." 2025. 

  11. Synopsys. "Ultra Ethernet UaLink AI Networks." 2025. 

  12. ServeTheHome. "Huawei Presents UB-Mesh Interconnect for Large AI SuperNodes at Hot Chips 2025." August 2025. 

  13. Blocks and Files. "CXL 4.0 doubles bandwidth." November 2025. 

  14. HPCwire. "Upscale AI Eyes Late 2026 for Scale-Up UALink Switch." December 2, 2025. 

  15. EE Times. "CXL Adds Port Bundling to Quench AI Thirst." November 2025. 

  16. SDxCentral. "Compute Express Link Consortium debuts 4.0 spec to push past bandwidth bottlenecks." November 2025. 

  17. CXL Consortium. "CXL 4.0 White Paper." November 2025. 

Запросити пропозицію_

Розкажіть про ваш проект і ми відповімо протягом 72 годин.

> ПЕРЕДАЧА_ЗАВЕРШЕНА

Запит отримано_

Дякуємо за ваш запит. Наша команда розгляне його та відповість протягом 72 годин.

В ЧЕРЗІ НА ОБРОБКУ