NVIDIA Vera Rubin руйнує стандарти GPU з 600-кіловатними стійками та пам'яттю на мільйон токенів

NVIDIA Vera Rubin підштовхує дата-центри до стійок потужністю 600кВт до 2027 року, забезпечуючи збільшення продуктивності у 7,5 разів та вимагаючи повної трансформації інфраструктури.

Blake Crosley

Sep 25, 2025 9 min read Disclaimer

NVIDIA Vera Rubin руйнує стандарти GPU з 600-кіловатними стійками та пам'яттю на мільйон токенів

Генеральний директор NVIDIA Дженсен Хуанг скинув справжню бомбу на GTC 2025, змусивши команди інфраструктури хапатися за калькулятори: платформа Vera Rubin підніме потужність стійок центрів обробки даних до 600 кіловат до 2027 року.¹ Це оголошення знаменує фундаментальний зсув у роботі центрів обробки даних, змушуючи повністю переосмислити системи подачі електроенергії, охолодження та фізичної інфраструктури, яка залишалася практично незмінною десятиліттями.

Платформа Vera Rubin представляє найамбітніший стрибок NVIDIA на сьогодні. Ця багатокомпонентна система поєднує кастомний CPU Vera, GPU наступного покоління Rubin та спеціалізований прискорювач Rubin CPX (Context Processing eXtension), розроблений спеціально для AI-робочих навантажень з мільйоном токенів.² На відміну від поступових покращень, типових для поколінь GPU, варіант Vera Rubin NVL144 CPX забезпечує в 7,5 разів вищу продуктивність AI порівняно з поточними системами Blackwell GB300, при цьому фундаментально змінюючи спосіб упакування, охолодження та розгортання GPU.³

[caption id="" align="alignnone" width="2522"] Специфікації платформи NVIDIA Vera Rubin NVL144, що показують 3,6 ексафлопс продуктивності FP4 інференсу та покращення в 3,3 рази порівняно з GB300 NVL72, очікується в другій половині 2026 року. [/caption]

Архітектурна революція починається з кастомного кремнію.

[caption id="" align="alignnone" width="2520"] Повна дорожня карта NVIDIA від Blackwell до Feynman, що показує еволюцію від архітектури стійок Oberon до Kyber з підтримкою споживання електроенергії до 600 кВт. [/caption]

CPU Vera знаменує відхід NVIDIA від готових ARM-дизайнів, оснащений 88 кастомними ARM ядрами з одночасною багатопотоковістю, що забезпечує 176 логічних процесорів.⁵ NVIDIA називає кастомні ядра "Olympus", і дизайн забезпечує вдвічі вищу продуктивність порівняно з CPU Grace, що використовується в поточних системах Blackwell.⁶ Кожен CPU Vera підключається до GPU Rubin через інтерфейс NVLink C2C з пропускною здатністю 1,8 ТБ/с, забезпечуючи безпрецедентну пропускну здатність між обчислювальними елементами.⁷

Стандартний GPU Rubin розсуває межі з 288 ГБ пам'яті HBM4 на пакет, зберігаючи ту ж ємність, що й Blackwell Ultra B300, але збільшуючи пропускну здатність пам'яті з 8 ТБ/с до 13 ТБ/с.⁸ Кожен пакет Rubin містить два GPU-кристали, обмежені розміром фотошаблону, хоча NVIDIA змінила свою методологію підрахунку - те, що Blackwell називав одним GPU (два кристали), Rubin називає двома GPU.⁹ Ця зміна відображає зростаючу складність мультикристальних архітектур і допомагає клієнтам краще розуміти фактичні обчислювальні ресурси в кожній системі.

Найінноваційнішим елементом є Rubin CPX - спеціально створений прискорювач для обробки масивних контекстів. Монолітний дизайн забезпечує 30 петафлопс обчислень NVFP4 з 128 ГБ економічно ефективної пам'яті GDDR7, спеціально оптимізованої для механізмів уваги в трансформерних моделях.¹⁰ CPX досягає в 3 рази швидших можливостей уваги порівняно з системами GB300 NVL72, дозволяючи AI-моделям обробляти контексти з мільйоном токенів - еквівалент години відео чи цілих кодових баз - без погіршення продуктивності.¹¹

Розгортання вимагає повної модернізації інфраструктури.

Стандартна система Vera Rubin NVL144, запланована до надходження в другій половині 2026 року, підтримує сумісність з існуючою інфраструктурою GB200/GB300, використовуючи звичну архітектуру стійок Oberon.¹² Система упаковує 144 GPU-кристали (72 пакети), 36 CPU Vera і забезпечує 3,6 екзафлопс продуктивності FP4 інференсу - покращення в 3,3 рази порівняно з Blackwell Ultra.¹³ Споживання електроенергії залишається керованим на рівні приблизно 120-130 кВт на стійку, подібно до поточних розгортань.

Варіант Vera Rubin NVL144 CPX підвищує продуктивність ще більше, інтегруючи 144 GPU Rubin CPX поряд з 144 стандартними GPU Rubin та 36 CPU Vera для забезпечення восьми екзафлопс обчислень NVFP4 - це покращення в 7,5 разів порівняно з GB300 NVL72 - з 100 ТБ високошвидкісної пам'яті та 1,7 ПБ/с пропускної здатності пам'яті в одній стійці.¹⁴

Все змінюється з Rubin Ultra та архітектурою стійок Kyber у 2027 році. Система NVL576 втискає 576 GPU-кристалів в одну стійку, споживаючи 600 кВт електроенергії - в п'ять разів більше поточних систем.¹⁵ Дизайн Kyber повертає обчислювальні блейди на 90 градусів у вертикальну орієнтацію, упаковуючи чотири поди по 18 блейдів кожен у стійку.¹⁶ Кожен блейд розміщує вісім GPU Rubin Ultra поряд з CPU Vera, досягаючи щільності, яка здавалася неможливою ще кілька років тому.

[caption id="" align="alignnone" width="2522"] Поточна система NVIDIA Blackwell з 72 GPU, що забезпечує 1,1 екзафлопс [/caption]

[caption id="" align="alignnone" width="2524"] Майбутня система NVIDIA Rubin з масштабуванням до 576 GPU та 15 екзафлопс в одній стійці 600 кВт [/caption]

Охолодження цих систем вимагає повного рідинного занурення без вентиляторів - відхід від поточних систем, які досі використовують повітряне охолодження для допоміжних компонентів.¹⁷ CoolIT Systems та Accelsius вже продемонстрували рішення охолодження, здатні обробляти стійки потужністю 250 кВт з температурою вхідної води 40°C, підтверджуючи технологічний шлях до розгортань на 600 кВт.¹⁸ Стійка Kyber включає спеціальний бічний блок для інфраструктури живлення та охолодження, фактично вимагаючи два місця для стійок для кожної системи на 600 кВт.¹⁹

Еволюція архітектури живлення дозволяє обчислення мегаватного масштабу.

Перехід NVIDIA на розподіл електроенергії 800 В постійного струму вирішує фундаментальні фізичні обмеження поточної інфраструктури. Традиційний розподіл 54В всередині стійки потребував би 64U силових полиць для систем масштабу Kyber, не залишаючи місця для фактичних обчислень.²⁰ Архітектура 800В усуває перетворення AC/DC на рівні стійки, покращує наскрізну ефективність до 5% та зменшує витрати на обслуговування до 70%.²¹

Нова інфраструктура живлення підтримує стійки від 100 кВт до понад 1 МВт, використовуючи ту ж магістраль, і забезпечує масштабованість, необхідну для майбутніх поколінь.²² Компанії, що розгортають Vera Rubin, повинні планувати масивні електричні модернізації - одна стійка NVL576 споживає стільки ж електроенергії, як 400 типових будинків. Центри обробки даних, що планують розгортання на 2027 рік, повинні розпочати модернізацію інфраструктури зараз, включаючи підключення до електромережі промислового масштабу та потенційну власну генерацію.

Прирости продуктивності виправдовують інвестиції в інфраструктуру.

Варіант Vera Rubin NVL144 CPX демонструє потенціал платформи з її вісьмома екзафлопсами обчислень NVFP4, поряд з 100 ТБ високошвидкісної пам'яті та 1,7 ПБ/с пропускної здатності пам'яті, все в одній стійці.²⁴ NVIDIA стверджує, що організації можуть досягти 30x-50x повернення інвестицій, що перетворюється на $5 мільярдів доходу з капітальних інвестицій у $100 мільйонів.²⁵

Ранні користувачі включають німецький Центр суперкомп'ютерів Лейбніца, який розгортає суперкомп'ютер Blue Lion з Vera Rubin для досягнення в 30 разів більшої обчислювальної потужності порівняно з їхньою поточною системою.²⁶ Система Doudna Національної лабораторії Лоуренса Берклі також працюватиме на Vera Rubin, поєднуючи моделювання, дані та AI в одну платформу для наукових обчислень.²⁷

Спеціалізація Rubin CPX для обробки контексту вирішує критичне вузьке місце в поточних AI-системах. Компанії як Cursor, Runway та Magic вже досліджують, як CPX може прискорити помічників з кодування та додатки генерації відео, які вимагають одночасної обробки мільйонів токенів.²⁸ Здатність підтримувати цілі кодові бази чи години відео в активній пам'яті фундаментально змінює те, чого можуть досягти AI-додатки.

Інфраструктурні виклики створюють ринкові можливості.

Стрибок до стійок 600 кВт розкриває суворі реалії про поточні можливості центрів обробки даних. Більшість об'єктів борються зі стійками 40 кВт; навіть найсучасніші AI центри обробки даних рідко перевищують 120 кВт. Перехід вимагає не лише нових систем охолодження, а повного перепроєктування об'єктів, від бетонних підлог, здатних витримувати масивні вагові навантаження, до електричних підстанцій, розмірених для промислових операцій.

"Питання залишається в тому, скільки існуючих центрів обробки даних зможуть підтримати таку щільну конфігурацію," зазначає The Register, підкреслюючи, що кастомна природа стійок Kyber означає, що об'єктам потрібна спеціально побудована інфраструктура.²⁹ Розробки на незабудованих землях у регіонах з надлишком відновлюваної чи ядерної енергії - Скандинавія, Квебек та ОАЕ - ймовірно, очолять впровадження.³⁰

Часові рамки дають індустрії час для дихання, але вимагають негайних дій. Організації, що планують AI-інфраструктуру на 2027 рік і далі, повинні приймати рішення зараз щодо розташування об'єктів, закупівлі електроенергії та архітектури охолодження. Триричний час випередження відображає складність розгортання інфраструктури, яка працює на межі фізично можливого.

Шлях за межі Vera Rubin

Дорожня карта NVIDIA простягається за межі Vera Rubin до архітектури Feynman у 2028 році, ймовірно, штовхаючи до стійок на мегават.³¹ Генеральний директор Vertiv Джордано Альбертаці припускає, що досягнення щільності мегаватного масштабу потребуватиме "подальшої революції в рідинному охолодженні та парадигматичної зміни на стороні живлення."³² Траєкторія здається неминучою - AI робочі навантаження вимагають експоненційного збільшення щільності обчислень, а економіка сприяє концентрації над розподілом.

Зсув від поступових покращень до революційних змін в GPU-інфраструктурі відображає ширшу трансформацію AI. Так само як великі мовні моделі стрибнули з мільярдів до трильйонів параметрів, інфраструктура, що їх підтримує, повинна зробити подібні стрибки. Vera Rubin представляє не лише швидші GPU, а фундаментальне переосмислення того, як працює обчислювальна інфраструктура.

Висновок

Платформа Vera Rubin від NVIDIA змушує індустрію центрів обробки даних зіткнутися з незручними істинами про обмеження інфраструктури, водночас пропонуючи безпрецедентні обчислювальні можливості. Стійки на 600 кВт 2027 року представляють більше, ніж просто вище споживання електроенергії - вони знаменують повну трансформацію в тому, як будується, охолоджується та експлуатується AI-інфраструктура. Організації, які почнуть планувати зараз, партнеруючи з досвідченими спеціалістами з інфраструктури, які розуміють складності розгортань наступного покоління, будуть найкраще позиціоновані для використання революційних можливостей, що їх надає Vera Rubin.

Прибуття платформи у 2026-2027 роках дає індустрії час підготуватися, але годинник цокає. Центри обробки даних, що проєктуються сьогодні, повинні передбачати завтрашні вимоги, і Vera Rubin ясно показує, що завтра вимагає радикальних відходів від звичайного мислення. Компанії, які приймуть цю трансформацію, живитимуть наступне покоління AI-прорив від мовних моделей з мільйоном токенів до систем генерації відео в реальному часі, які сьогодні здаються науковою фантастикою.

Посилання

¹ The Register. "Nvidia's Vera Rubin CPU, GPUs chart course for 600kW racks." March 19, 2025. https://www.theregister.com/2025/03/19/nvidia_charts_course_for_600kw.

² NVIDIA Newsroom. "NVIDIA Unveils Rubin CPX: A New Class of GPU Designed for Massive-Context Inference." 2025. https://nvidianews.nvidia.com/news/nvidia-unveils-rubin-cpx-a-new-class-of-gpu-designed-for-massive-context-inference.

³ Ibid.

⁴ Data Center Dynamics. "GTC: Nvidia's Jensen Huang, Ian Buck, and Charlie Boyle on the future of data center rack density." March 21, 2025. https://www.datacenterdynamics.com/en/analysis/nvidia-gtc-jensen-huang-data-center-rack-density/.

⁵ TechPowerUp. "NVIDIA Unveils Vera CPU and Rubin Ultra AI GPU, Announces Feynman Architecture." 2025. https://www.techpowerup.com/334334/nvidia-unveils-vera-cpu-and-rubin-ultra-ai-gpu-announces-feynman-architecture.

⁶ CNBC. "Nvidia announces Blackwell Ultra and Vera Rubin AI chips." March 18, 2025. https://www.cnbc.com/2025/03/18/nvidia-announces-blackwell-ultra-and-vera-rubin-ai-chips-.html.

⁷ Yahoo Finance. "Nvidia debuts next-generation Vera Rubin superchip at GTC 2025." March 18, 2025. https://finance.yahoo.com/news/nvidia-debuts-next-generation-vera-rubin-superchip-at-gtc-2025-184305222.html.

⁸ Next Platform. "Nvidia Draws GPU System Roadmap Out To 2028." June 5, 2025. https://www.nextplatform.com/2025/03/19/nvidia-draws-gpu-system-roadmap-out-to-2028/.

⁹ SemiAnalysis. "NVIDIA GTC 2025 – Built For Reasoning, Vera Rubin, Kyber, CPO, Dynamo Inference, Jensen Math, Feynman." August 4, 2025. https://semianalysis.com/2025/03/19/nvidia-gtc-2025-built-for-reasoning-vera-rubin-kyber-cpo-dynamo-inference-jensen-math-feynman/.

¹⁰ NVIDIA Newsroom. "NVIDIA Unveils Rubin CPX: A New Class of GPU Designed for Massive-Context Inference."

¹¹ Ibid.

¹² Tom's Hardware. "Nvidia announces Rubin GPUs in 2026, Rubin Ultra in 2027, Feynman also added to roadmap." March 18, 2025. https://www.tomshardware.com/pc-components/gpus/nvidia-announces-rubin-gpus-in-2026-rubin-ultra-in-2027-feynam-after.

¹³ The New Stack. "NVIDIA Unveils Next-Gen Rubin and Feynman Architectures, Pushing AI Power Limits." April 14, 2025. https://thenewstack.io/nvidia-unveils-next-gen-rubin-and-feynman-architectures-pushing-ai-power-limits/.

¹⁴ NVIDIA Newsroom. "NVIDIA Unveils Rubin CPX: A New Class of GPU Designed for Massive-Context Inference."

¹⁵ Data Center Dynamics. "Nvidia's Rubin Ultra NVL576 rack expected to be 600kW, coming second half of 2027." March 18, 2025. https://www.datacenterdynamics.com/en/news/nvidias-rubin-ultra-nvl576-rack-expected-to-be-600kw-coming-second-half-of-2027/.

¹⁶ Tom's Hardware. "Nvidia shows off Rubin Ultra with 600,000-Watt Kyber racks and infrastructure, coming in 2027." March 19, 2025. https://www.tomshardware.com/pc-components/gpus/nvidia-shows-off-rubin-ultra-with-600-000-watt-kyber-racks-and-infrastructure-coming-in-2027.

¹⁷ Data Center Dynamics. "GTC: Nvidia's Jensen Huang, Ian Buck, and Charlie Boyle on the future of data center rack density."

¹⁸ Data Center Frontier. "CoolIT and Accelsius Push Data Center Liquid Cooling Limits Amid Soaring Rack Densities." 2025. https://www.datacenterfrontier.com/cooling/article/55281394/coolit-and-accelsius-push-data-center-liquid-cooling-limits-amid-soaring-rack-densities.

¹⁹ Data Center Dynamics. "GTC: Nvidia's Jensen Huang, Ian Buck, and Charlie Boyle on the future of data center rack density."

²⁰ NVIDIA Technical Blog. "NVIDIA 800 VDC Architecture Will Power the Next Generation of AI Factories." May 20, 2025. https://developer.nvidia.com/blog/nvidia-800-v-hvdc-architecture-will-power-the-next-generation-of-ai-factories/.

²¹ Ibid.

²² Ibid.

²⁴ NVIDIA Newsroom. "NVIDIA Unveils Rubin CPX: A New Class of GPU Designed for Massive-Context Inference."

²⁵ Ibid.

²⁶ NVIDIA Blog. "Blue Lion Supercomputer Will Run on NVIDIA Vera Rubin." June 10, 2025. https://blogs.nvidia.com/blog/blue-lion-vera-rubin/.

²⁷ Ibid.

²⁸ NVIDIA Newsroom. "NVIDIA Unveils Rubin CPX: A New Class of GPU Designed for Massive-Context Inference."

²⁹ The Register. "Nvidia's Vera Rubin CPU, GPUs chart course for 600kW racks."

³⁰ Global Data Center Hub. "Nvidia's 600kW Racks Are Here (Is Your Infrastructure Ready?)." March 23, 2025. https://www.globaldatacenterhub.com/p/issue-8-nvidias-600kw-racks-are-hereis.

³¹ TechPowerUp. "NVIDIA Unveils Vera CPU and Rubin Ultra AI GPU, Announces Feynman Architecture."

³² Data Center Dynamics. "GTC: Nvidia's Jensen Huang, Ian Buck, and Charlie Boyle on the future of data center rack density."

Архітектурна революція починається з кастомного кремнію.

Розгортання вимагає повної модернізації інфраструктури.

Еволюція архітектури живлення дозволяє обчислення мегаватного масштабу.

Прирости продуктивності виправдовують інвестиції в інфраструктуру.

Інфраструктурні виклики створюють ринкові можливості.

Шлях за межі Vera Rubin

Висновок

Посилання

You Might Also Like

ДБЖ та розподіл електроенергії для ШІ: проєктування стійкої ...

Модернізація застарілих дата-центрів для ШІ: посібник з інте...

xAI Colossus досягає 2 ГВт: 555 000 GPU, $18 млрд, найбільши...

Запросити пропозицію_

Запит отримано_