Процесори для ІІ-інфраструктури: AMD EPYC, Intel Xeon та NVIDIA Grace

Частка серверних процесорів AMD досягла 27,8% у Q3 2025, прогнозується 40%+ до кінця року — Intel на рекордно низькому рівні 72,2%. ARM-процесори тепер складають 13,2% продажів серверів, а NVIDIA Grace Blackwell забезпечує 50% зростання. EPYC...

Процесори для ІІ-інфраструктури: AMD EPYC, Intel Xeon та NVIDIA Grace

Процесори для ІІ-інфраструктури: AMD EPYC, Intel Xeon та NVIDIA Grace

Оновлено 11 грудня 2025 року

Оновлення за грудень 2025: Частка серверних процесорів AMD досягла 27,8% у Q3 2025, прогнозується понад 40% до кінця року — Intel на рекордно низькому рівні 72,2%. ARM-процесори тепер складають 13,2% продажів серверів, а комбінація NVIDIA Grace Blackwell забезпечує 50% зростання обсягу ARM серверних процесорів. EPYC 9005 Turin поставляється з до 192 ядрами (Zen 5c) та 512 МБ кешу L3. Intel Xeon 6 Granite Rapids зосереджується на прискоренні ІІ-інференсу.

Частка AMD на ринку серверних процесорів досягла 27,8% у Q3 2025, з прогнозом перевищення 40% до кінця року та потенційного досягнення 50% у 2026 році.¹ Частка Intel впала до 72,2% — найнижчий показник серверних процесорів в історії компанії.² ARM-процесори тепер складають 13,2% загальних продажів серверів, а комбінація NVIDIA Grace Blackwell забезпечує 50% зростання обсягу ARM серверних процесорів.³ Ландшафт процесорів для ІІ-інфраструктури змінюється швидше, ніж будь-коли за останні два десятиліття.

GPU домінують у навчанні та інференсі ІІ, але CPU залишаються необхідними для оркестрації, попередньої обробки даних, обслуговування запитів інференсу та керування площиною управління. Вибір процесора впливає на пропускну здатність пам'яті, підключення вводу/виводу, енергоефективність та загальну вартість системи. Організації, що розгортають ІІ у масштабі, повинні оцінювати вибір CPU так само ретельно, як і закупівлю GPU.

AMD EPYC 9005 Turin: лідер щільності

AMD запустила серію EPYC 9005 (кодова назва Turin) 10 жовтня 2024 року, що представляє п'яте покоління серверних процесорів EPYC, побудованих на архітектурі Zen 5.⁴ AMD позиціонує їх як найкращий серверний процесор у світі для корпоративних, ІІ та хмарних навантажень.⁵

Turin пропонує дві конфігурації ядер. Стандартні моделі Zen 5 досягають 128 ядер на сокет, виготовлених за 4-нм техпроцесом TSMC.⁶ Щільні варіанти Zen 5c забезпечують 192 ядра на сокет за 3-нм техпроцесом TSMC.⁷ Флагманський EPYC 9965 надає 192 ядра та 384 потоки з TDP 500 Вт.⁸

Основні характеристики охоплюють весь модельний ряд:

SKU Ядра Кеш L3 TDP Ціна
EPYC 9965 192 (Zen 5c) 384 МБ 500 Вт $14 813
EPYC 9755 128 (Zen 5) 512 МБ 500 Вт $12 984
EPYC 9575F 64 (Zen 5) 512 МБ 400 Вт $10 176
EPYC 9015 8 (Zen 5) 32 МБ 155 Вт $527

Архітектура використовує до 16 CCD (Core Compute Dies) у стандартних моделях та до 12 CCD у щільних конфігураціях у поєднанні з центральним чипом вводу/виводу.⁹ Стандартні CCD містять по вісім ядер Zen 5, тоді як щільні CCD вміщують 16 ядер Zen 5c.¹⁰

Підтримка пам'яті досягає DDR5-6000 з ECC через 12 каналів, порівняно з DDR5-4800 у попередньому поколінні.¹¹ Підключення PCIe забезпечує до 128 ліній Gen5 з підтримкою CXL 1.0 для пристроїв Type 1, 2 та 3.¹² Сокет SP5 зберігає сумісність із системами Genoa та Bergamo.¹³

Процесори Turin забезпечують 17% приріст IPC порівняно з попереднім поколінням з повними 512-бітними шляхами даних AVX-512.¹⁴ Покращення безпосередньо впливають на попередню обробку даних та обслуговування інференсу, які є типовими для ІІ-інфраструктури.

Бізнес AMD у сфері центрів обробки даних згенерував $3,7 мільярда квартального доходу, зростання на 57% рік до року.¹⁵ Зростання відображає продажі як процесорів EPYC, так і GPU Instinct, оскільки AMD нарощує частку в обох категоріях.

Intel Xeon 6 Granite Rapids: перевага в ІІ-інференсі

Intel анонсувала серію Xeon 6 Granite Rapids 6900P з моделями від 72 до 128 ядер — вперше перевищивши кількість ядер AMD з 2017 року.¹⁶ Процесори використовують архітектуру P-ядер Intel Redwood Cove на техпроцесі Intel 3.¹⁷

Моделі Granite Rapids-AP (Advanced Performance) використовують платформу Avenue City з більшим сокетом LGA 7529.¹⁸ Більший сокет дозволяє використовувати 128 ядер з підтримкою 12-канальної пам'яті DDR5 та до 192 ліній PCIe 5.0 у двосокетних конфігураціях.¹⁹ Кеш L3 досягає вражаючих 504 мегабайтів у топових SKU.²⁰

Пропускна здатність пам'яті є ключовим диференціатором. Granite Rapids UCC підтримує DDR5 на частоті 6,4 ГГц стандартно та пам'ять multiplexed rank (MRDIMM) на частоті 8,8 ГГц.²¹ Вищі швидкості пам'яті корисні для навантажень ІІ-інференсу, обмежених пам'яттю.

Архітектура вводу/виводу забезпечує 136 ліній PCIe 5.0 — порівняно з 128 в Emerald Rapids — з підтримкою CXL 2.0 Type 3 та до 6 з'єднань UPI для масштабування багатосокетних систем.²²

Виразна перевага Intel полягає в Advanced Matrix Extensions (AMX), які прискорюють навантаження ІІ-інференсу.²³ Матричний рушій підтримує прискорення AMX FP16 на процесорах Xeon 6500P та 6700P.²⁴ Intel заявляє про 5,5-кратну продуктивність ІІ-інференсу в ResNet50 порівняно з конкуруючим 96-ядерним флагманом AMD Genoa.²⁵

Бенчмарк-тестування підтверджує перевагу AMX. Phoronix задокументував значні переваги продуктивності ІІ з AMX на Granite Rapids, показавши суттєві покращення пропускної здатності інференсу порівняно з непришвидшеним виконанням x86.²⁶

Процесори Granite Rapids-D орієнтовані на периферійні обчислення та мережеві застосування з доступністю у 2025 році.²⁷ Початкові моделі досягають 42 ядер з очікуванням 72-ядерних варіантів пізніше цього року.²⁸ SoC-варіанти інтегрують Intel Ethernet з 3,2-кратним покращенням продуктивності RAN AI на ядро.²⁹

Проблеми з ринковою часткою Intel зберігаються, незважаючи на конкурентоспроможне обладнання. Компанія утримує 72,2% серверних процесорів за одиницями, але продовжує втрачати частку квартал за кварталом.³⁰ Частка доходу розповідає іншу історію — AMD захоплює 37,2% при вимірюванні в доларах, а не в одиницях, що відображає успіх AMD у сегментах з вищими цінами.³¹

NVIDIA Grace: ARM входить у центри обробки даних

NVIDIA Grace представляє перший CPU компанії для центрів обробки даних, побудований на ядрах ARM Neoverse V2 спеціально для навантажень ІІ та високопродуктивних обчислень.³² Архітектура поєднується з GPU NVIDIA для створення тісно пов'язаних систем, які усувають традиційні вузькі місця комунікації CPU-GPU.

CPU Grace має 72 високопродуктивних ядра ARM Neoverse V2 з 4×128-бітними векторними модулями SVE2 на ядро.³³ Ієрархія кешу включає 64 КБ кешу L1 для інструкцій та даних, 1 МБ L2 на ядро та 117 МБ спільного L3.³⁴ Пам'ять досягає 480 ГБ корисної LPDDR5X з пропускною здатністю 546 ГБ/с при TDP 250 Вт.³⁵

Grace CPU Superchip поєднує два CPU Grace, з'єднаних через NVLink-C2C, забезпечуючи 144 ядра ARM з пропускною здатністю пам'яті до 1 ТБ/с.³⁶ З'єднання досягає пропускної здатності 900 ГБ/с між двома CPU на одному модулі з до 960 ГБ пам'яті LPDDR5X.³⁷

NVIDIA заявляє, що Grace забезпечує 2-кратну продуктивність на ват, 2-кратну щільність упаковки та найвищу пропускну здатність пам'яті порівняно з сучасними серверами x86.³⁸ Переваги ефективності накопичуються у розгортаннях ІІ з обмеженим енергоспоживанням.

Конфігурація GB200 NVL72 з'єднує 36 CPU Grace з 72 GPU Blackwell у рішенні рівня стійки з рідинним охолодженням.³⁹ Система забезпечує 30-кратний приріст швидкості інференсу в реальному часі для великих мовних моделей з трильйоном параметрів порівняно з попередніми поколіннями.⁴⁰

Grace повністю інтегрується з програмною екосистемою ARM. NVIDIA HPC SDK та всі компоненти CUDA надають нативні інсталятори та контейнери для ARM.⁴¹ Мікросервіси NVIDIA NIM та контейнери NGC оптимізовані для ARM.⁴² Усі основні дистрибутиви Linux працюють без модифікацій.⁴³

Імпульс ARM у центрах обробки даних поширюється за межі NVIDIA. ARM Holdings прогнозує збільшення своєї частки ринку CPU центрів обробки даних приблизно з 15% у 2024 році до 50% до кінця 2025 року.⁴⁴ Прогноз відображає агресивне зростання хмарних нативних ARM-інстансів та впровадження NVIDIA Grace.

Суперчіп GB10 Grace Blackwell переносить архітектуру у настільні форм-фактори для розробників ІІ, дослідників та периферійних обчислень.⁴⁵ Система-в-пакеті поєднує ARM CPU з можливостями GPU Blackwell, забезпечуючи локальну розробку ІІ, яка раніше вимагала доступу до центру обробки даних.

Вибір CPU для конкретних навантажень

Вибір CPU для ІІ-інфраструктури залежить від конкретної ролі в архітектурі розгортання. Різні навантаження віддають перевагу різним характеристикам процесора.

Площина управління та оркестрація виграють від високої кількості ядер та обсягу пам'яті. Площини управління Kubernetes, планувальники завдань та системи моніторингу масштабуються з доступними ядрами. 192-ядерна щільність AMD EPYC забезпечує запас для консолідації. Канали пам'яті та ємність важливіші за продуктивність на ядро для цих навантажень.

Конвеєри попередньої обробки даних перетворюють сирі дані у формати, готові для навчання. Ці навантаження часто масштабуються з пропускною здатністю пам'яті, а не з обчисленнями. Підтримка Intel MRDIMM на 8,8 ГГц забезпечує переваги пропускної здатності. Етап попередньої обробки часто виконується на виділених системах лише з CPU, які живлять кластери GPU.

Обслуговування інференсу представляє найсильніший аргумент для оцінки CPU. Хоча GPU обробляють виконання моделі, CPU керують маршрутизацією запитів, токенізацією та складанням відповідей. Прискорення Intel AMX забезпечує інференс на CPU для менших моделей, потенційно усуваючи потребу в GPU для відповідних навантажень. Перевага продуктивності ResNet50 у 5,5 разів демонструє ціннісну пропозицію.

Хост-системи GPU потребують процесорів, які не стають вузькими місцями. Кількість ліній PCIe визначає, скільки GPU можна підключити до кожного сокета CPU. 128 ліній Gen5 EPYC та 136 ліній Granite Rapids обидва підтримують восьми-GPU конфігурації. Пропускна здатність пам'яті впливає на швидкість переміщення даних до пам'яті GPU для навчальних пакетів.

Периферійний інференс віддає перевагу енергоефективності та інтегрованому вводу/виводу. Granite Rapids-D інтегрує підключення Ethernet для мережевих інференс-пристроїв. Архітектура ARM Grace забезпечує профіль ефективності, який вимагають периферійні розгортання.

Міркування щодо планування інфраструктури

Динаміка ринку CPU сприяє оцінці кількох постачальників. Стабільне зростання частки AMD створює конкурентний тиск, який приносить користь покупцям. Відповідь Intel з Granite Rapids демонструє продовження інновацій, незважаючи на ринкові виклики. NVIDIA Grace пропонує диференціацію для GPU-орієнтованих архітектур.

Архітектура пам'яті все більше диференціює платформи. Підтримка CXL дозволяє розширення пам'яті за межі ємності сокета. Швидкості DDR5 продовжують зростати з кожним поколінням. Організації, що планують інфраструктуру на кілька років, повинні оцінювати дорожні карти пам'яті разом із специфікаціями CPU.

Енергоефективність визначає щільність розгортання в об'єктах з обмеженнями. Заява Grace про 2-кратну продуктивність на ват заслуговує валідації для конкретних навантажень. Перевага в енергоспоживанні накопичується у великих розгортаннях, де обмеження об'єктів стримують зростання.

Вимоги до програмної екосистеми звужують вибір для деяких організацій. Сумісність x86 залишається необхідною для застарілих навантажень. Впровадження ARM вимагає валідації застосунків та потенційно перекомпіляції. Інтеграція CUDA з Grace спрощує перехід для GPU-орієнтованих розгортань.

Розрахунки загальної вартості володіння повинні включати не лише ціну процесора, але й вартість системи, енергоспоживання та ліцензування. Вигідне ціноутворення AMD на верхньому рівні — 192-ядерний 9965 за $14 813 — поступається пропозиціям Intel. Однак прискорення Intel AMX може зменшити вимоги до GPU для інференсу, впливаючи на ширше рівняння витрат.

CPU залишається основою ІІ-інфраструктури, навіть коли GPU привертають увагу. Організації, які оцінюють вибір CPU з такою ж ретельністю, як і закупівлю GPU, будують більш збалансовані та ефективні системи. Конкурентна динаміка серед AMD, Intel та NVIDIA гарантує, що ретельна оцінка приносить значні переваги для інфраструктури.

Ключові висновки

Для закупівлі серверів: - AMD EPYC Turin 9965: 192 ядра (Zen 5c), 384 МБ L3, TDP 500 Вт за $14 813; вигідне ціноутворення порівняно з Intel на верхньому рівні - Intel Xeon 6900P: 128 ядер (Granite Rapids), 504 МБ L3, прискорення AMX FP16, підтримка MRDIMM на 8,8 ГГц - NVIDIA Grace: 72 ядра ARM, 480 ГБ LPDDR5X з пропускною здатністю 546 ГБ/с, TDP 250 Вт; заявлена 2-кратна продуктивність/ват

Для планування навантажень: - Площина управління/оркестрація: віддає перевагу високій кількості ядер (192-ядерна щільність AMD); ємність пам'яті важливіша за швидкість на ядро - Попередня обробка даних: масштабується з пропускною здатністю пам'яті; Intel MRDIMM 8,8 ГГц забезпечує перевагу - Обслуговування інференсу: Intel AMX забезпечує 5,5-кратну продуктивність ResNet50 порівняно з AMD; може усунути потребу в GPU для менших моделей - Хост-системи GPU: кількість ліній PCIe (AMD 128, Intel 136 Gen5) визначає підключення GPU

Запросити пропозицію_

Розкажіть про ваш проект і ми відповімо протягом 72 годин.

> ПЕРЕДАЧА_ЗАВЕРШЕНА

Запит отримано_

Дякуємо за ваш запит. Наша команда розгляне його та відповість протягом 72 годин.

В ЧЕРЗІ НА ОБРОБКУ