NVIDIA Vera Rubin, 600킬로와트 랙과 백만 토큰 메모리로 GPU의 틀을 깨다

NVIDIA Vera Rubin은 2027년까지 데이터센터를 600kW 랙으로 발전시켜 7.5배의 성능 향상을 제공하면서 완전한 인프라 혁신을 요구합니다.

Blake Crosley

Sep 25, 2025 8 min read Disclaimer

NVIDIA Vera Rubin, 600킬로와트 랙과 백만 토큰 메모리로 GPU의 틀을 깨다

NVIDIA CEO Jensen Huang은 GTC 2025에서 폭탄 발언을 던져 인프라 팀들이 계산기를 찾아 헤매게 만들었습니다: Vera Rubin 플랫폼이 2027년까지 데이터 센터 랙을 600킬로와트까지 밀어붙일 것이라고 발표한 것입니다.¹ 이 발표는 데이터 센터 운영 방식의 근본적 변화를 의미하며, 수십 년간 본질적으로 변하지 않았던 전력 공급, 냉각 시스템, 물리적 인프라에 대한 완전한 재검토를 강요하고 있습니다.

Vera Rubin 플랫폼은 NVIDIA의 가장 야심찬 도약을 대표합니다. 이 다중 구성요소 시스템은 맞춤형 Vera CPU, 차세대 Rubin GPU, 그리고 백만 토큰 AI 워크로드를 위해 특별히 설계된 전용 Rubin CPX(Context Processing eXtension) 가속기를 결합합니다.² GPU 세대의 전형적인 점진적 개선과 달리, Vera Rubin NVL144 CPX 변형은 현재 Blackwell GB300 시스템 대비 7.5배의 AI 성능을 제공하면서 GPU의 패키징, 냉각 및 배포 방식을 근본적으로 변화시킵니다.³

[caption id="" align="alignnone" width="2522"] 3.6 exaflops의 FP4 추론 성능과 GB300 NVL72 대비 3.3배 향상을 보여주는 NVIDIA Vera Rubin NVL144 플랫폼 사양, 2026년 하반기 출시 예정. [/caption]

아키텍처 혁신은 맞춤형 실리콘부터 시작됩니다.

[caption id="" align="alignnone" width="2520"] Blackwell부터 Feynman까지의 NVIDIA 전체 로드맵, Oberon에서 Kyber 랙 아키텍처로의 진화와 최대 600kW 전력 소비 지원을 보여줍니다. [/caption]

Vera CPU는 기성품 ARM 설계에서 벗어나는 NVIDIA의 출발점을 나타내며, 동시 멀티스레딩을 지원하는 88개의 맞춤형 ARM 코어를 특징으로 하여 176개의 논리 프로세서를 가능하게 합니다.⁵ NVIDIA는 이 맞춤형 코어를 "Olympus"라고 부르며, 이 설계는 현재 Blackwell 시스템에 사용되는 Grace CPU의 2배 성능을 제공합니다.⁶ 각 Vera CPU는 1.8 TB/s NVLink C2C 인터페이스를 통해 Rubin GPU에 연결되어 컴퓨팅 요소 간 전례 없는 대역폭을 가능하게 합니다.⁷

표준 Rubin GPU는 패키지당 288GB의 HBM4 메모리로 한계를 밀어내며, Blackwell Ultra B300과 동일한 용량을 유지하면서 메모리 대역폭을 8 TB/s에서 13 TB/s로 증가시켰습니다.⁸ 각 Rubin 패키지는 2개의 레티클 제한 GPU 다이를 포함하지만, NVIDIA는 계산 방법론을 변경했습니다—Blackwell이 하나의 GPU(2개 다이)라고 부른 것을 Rubin은 2개의 GPU라고 합니다.⁹ 이 변화는 멀티 다이 아키텍처의 증가하는 복잡성을 반영하며 고객이 각 시스템의 실제 컴퓨팅 리소스를 더 잘 이해할 수 있도록 돕습니다.

가장 혁신적인 요소는 대규모 컨텍스트 처리를 위해 특별히 구축된 가속기인 Rubin CPX 형태로 등장합니다. 모놀리식 설계는 트랜스포머 모델의 어텐션 메커니즘에 특별히 최적화된 128GB의 비용 효율적인 GDDR7 메모리와 함께 30 petaFLOPs의 NVFP4 컴퓨팅을 제공합니다.¹⁰ CPX는 GB300 NVL72 시스템 대비 3배 빠른 어텐션 기능을 달성하여 AI 모델이 성능 저하 없이 백만 토큰 컨텍스트—1시간 분량의 비디오나 전체 코드베이스에 해당—를 처리할 수 있게 합니다.¹¹

배포에는 완전한 인프라 개편이 필요합니다.

2026년 하반기 출시 예정인 표준 Vera Rubin NVL144 시스템은 기존 GB200/GB300 인프라와의 호환성을 유지하며 친숙한 Oberon 랙 아키텍처를 활용합니다.¹² 이 시스템은 144개의 GPU 다이(72개 패키지), 36개의 Vera CPU를 포장하고 3.6 exaFLOPS의 FP4 추론 성능을 제공합니다—Blackwell Ultra 대비 3.3배 향상입니다.¹³ 전력 소비는 현재 배포와 유사한 랙당 약 120-130kW로 관리 가능한 수준을 유지합니다.

Vera Rubin NVL144 CPX 변형은 성능을 더욱 끌어올려 144개의 표준 Rubin GPU와 36개의 Vera CPU와 함께 144개의 Rubin CPX GPU를 통합하여 단일 랙에서 8 exaFLOPs의 NVFP4 컴퓨팅—GB300 NVL72 대비 7.5배 향상—과 100TB의 고속 메모리, 1.7 PB/s의 메모리 대역폭을 제공합니다.¹⁴

2027년 Rubin Ultra와 Kyber 랙 아키텍처로 모든 것이 바뀝니다. NVL576 시스템은 단일 랙에 576개의 GPU 다이를 밀어넣어 600kW의 전력을 소비합니다—현재 시스템의 5배입니다.¹⁵ Kyber 설계는 컴퓨팅 블레이드를 수직 방향으로 90도 회전시켜 랙 내에 18개 블레이드씩 4개 포드를 포장합니다.¹⁶ 각 블레이드는 Vera CPU와 함께 8개의 Rubin Ultra GPU를 수용하여 불과 몇 년 전만 해도 불가능해 보였던 밀도를 달성합니다.

[caption id="" align="alignnone" width="2522"] 72개 GPU로 1.1 exaflops를 제공하는 현재 NVIDIA Blackwell 시스템 [/caption]

[caption id="" align="alignnone" width="2524"] 단일 600kW 랙에서 576개 GPU와 15 exaflops로 확장되는 미래 NVIDIA Rubin 시스템 [/caption]

이러한 시스템의 냉각에는 팬이 전혀 없는 완전한 액체 침수가 필요합니다—보조 구성요소에 대해 여전히 일부 공기 냉각을 사용하는 현재 시스템에서의 탈피입니다.¹⁷ CoolIT Systems와 Accelsius는 이미 40°C 유입 수온으로 250kW 랙을 처리할 수 있는 냉각 솔루션을 실증하여 600kW 배포로의 기술 경로를 검증했습니다.¹⁸ Kyber 랙은 전력 및 냉각 인프라를 위한 전용 사이드카를 포함하여 각 600kW 시스템에 대해 실질적으로 두 개의 랙 공간이 필요합니다.¹⁹

전력 아키텍처 진화가 메가와트급 컴퓨팅을 가능하게 합니다.

800 VDC 전력 분배로의 NVIDIA 전환은 현재 인프라의 근본적인 물리학적 한계를 해결합니다. 기존 54V 랙 내 분배는 Kyber급 시스템에 64U의 전력 선반이 필요하여 실제 컴퓨팅을 위한 공간이 남지 않습니다.²⁰ 800V 아키텍처는 랙 수준의 AC/DC 변환을 제거하고, 엔드 투 엔드 효율성을 최대 5% 개선하며, 유지보수 비용을 최대 70% 절감합니다.²¹

새로운 전력 인프라는 100kW에서 1MW 이상에 이르는 랙을 동일한 백본으로 지원하며 미래 세대에 필요한 확장성을 제공합니다.²² Vera Rubin을 배포하는 회사들은 대규모 전기 업그레이드를 계획해야 합니다—단일 NVL576 랙이 일반적인 가정 400채만큼의 전력을 소비합니다. 2027년 배포를 계획하는 데이터 센터는 유틸리티급 전력 연결과 잠재적으로 현장 발전을 포함한 인프라 업그레이드를 지금 시작해야 합니다.

성능 향상이 인프라 투자를 정당화합니다.

Vera Rubin NVL144 CPX 변형은 단일 랙에서 8 exaFLOPS의 NVFP4 컴퓨팅과 함께 100TB의 고속 메모리, 1.7 PB/s의 메모리 대역폭으로 플랫폼의 잠재력을 보여줍니다.²⁴ NVIDIA는 조직들이 30배에서 50배의 투자 수익률을 달성할 수 있어 1억 달러의 자본 투자에서 50억 달러의 수익을 얻을 수 있다고 주장합니다.²⁵

초기 도입자로는 현재 시스템보다 30배 더 많은 컴퓨팅 파워를 달성하기 위해 Vera Rubin으로 Blue Lion 슈퍼컴퓨터를 배포하는 독일의 Leibniz Supercomputing Centre가 있습니다.²⁶ Lawrence Berkeley National Lab의 Doudna 시스템도 Vera Rubin에서 실행되어 시뮬레이션, 데이터, AI를 과학 컴퓨팅용 단일 플랫폼으로 결합할 예정입니다.²⁷

컨텍스트 처리에 특화된 Rubin CPX는 현재 AI 시스템의 중요한 병목 현상을 해결합니다. Cursor, Runway, Magic과 같은 회사들은 이미 CPX가 수백만 토큰을 동시에 처리해야 하는 코딩 어시스턴트와 비디오 생성 애플리케이션을 어떻게 가속화할 수 있는지 탐구하고 있습니다.²⁸ 전체 코드베이스나 수 시간의 비디오를 액티브 메모리에 유지할 수 있는 능력은 AI 애플리케이션이 달성할 수 있는 것을 근본적으로 변화시킵니다.

인프라 도전이 시장 기회를 창출합니다.

600kW 랙으로의 도약은 현재 데이터 센터 역량에 대한 가혹한 현실을 노출시킵니다. 대부분의 시설이 40kW 랙으로도 어려움을 겪고 있으며, 최첨단 AI 데이터 센터조차 120kW를 거의 넘지 못합니다. 이러한 전환에는 새로운 냉각 시스템뿐만 아니라 대규모 중량 하중을 지원할 수 있는 콘크리트 바닥부터 산업 운영 규모의 전기 변전소까지 완전한 시설 재설계가 필요합니다.

"기존 데이터 센터 시설 중 얼마나 많은 곳이 이러한 고밀도 구성을 지원할 수 있을지 의문이 남습니다"라고 The Register가 언급하며, Kyber 랙의 맞춤 제작 특성으로 인해 시설에 전용 인프라가 필요함을 강조합니다.²⁹ 잉여 재생 에너지나 원자력 에너지가 있는 지역—스칸디나비아, 퀘벡, UAE—의 그린필드 개발이 도입을 주도할 가능성이 높습니다.³⁰

타임라인은 업계에 여유를 주지만 즉각적인 행동을 요구합니다. 2027년 이후 AI 인프라를 계획하는 조직들은 시설 위치, 전력 조달, 냉각 아키텍처에 대한 결정을 지금 내려야 합니다. 3년의 리드타임은 물리적으로 가능한 것의 경계에서 작동하는 인프라 배포의 복잡성을 반영합니다.

Vera Rubin 너머의 길

NVIDIA의 로드맵은 Vera Rubin을 넘어 2028년의 Feynman 아키텍처까지 확장되어 1메가와트 랙을 향해 나아갈 것 같습니다.³¹ Vertiv CEO Giordano Albertazzi는 MW급 밀도를 달성하려면 "액체 냉각의 추가적인 혁신과 전력 측면에서의 패러다임 변화"가 필요할 것이라고 제안합니다.³² 궤적은 불가피해 보입니다—AI 워크로드가 컴퓨팅 밀도의 기하급수적 증가를 요구하고, 경제성은 분산보다 집중을 선호합니다.

GPU 인프라의 점진적 개선에서 혁명적 변화로의 전환은 더 넓은 AI 변환을 반영합니다. 대규모 언어 모델이 수십억에서 수조 개의 매개변수로 뛰어오른 것처럼, 이를 지원하는 인프라도 유사한 도약을 해야 합니다. Vera Rubin은 단순히 더 빠른 GPU가 아니라 컴퓨팅 인프라 작동 방식에 대한 근본적인 재고를 나타냅니다.

결론

NVIDIA의 Vera Rubin 플랫폼은 데이터 센터 업계가 인프라 한계에 대한 불편한 진실과 직면하도록 강요하면서 전례 없는 계산 역량을 제공합니다. 2027년의 600kW 랙은 단순한 높은 전력 소비 이상을 나타냅니다—AI 인프라가 구축, 냉각, 운영되는 방식의 완전한 변환을 의미합니다. 지금부터 계획을 시작하고, 차세대 배포의 복잡성을 이해하는 경험 있는 인프라 전문가들과 파트너십을 맺는 조직들이 Vera Rubin이 가능하게 하는 혁명적 역량을 활용하기에 가장 좋은 위치에 있을 것입니다.

2026-2027년 플랫폼 출시는 업계에 준비할 시간을 주지만 시간은 흘러가고 있습니다. 오늘 설계되는 데이터 센터는 내일의 요구사항을 예상해야 하며, Vera Rubin은 내일이 기존 사고방식에서 급진적인 탈피를 요구한다는 것을 분명히 합니다. 이러한 변환을 받아들이는 회사들은 백만 토큰 언어 모델부터 오늘날 공상과학처럼 보이는 실시간 비디오 생성 시스템까지 차세대 AI 돌파구에 동력을 제공할 것입니다.

참고문헌

¹ The Register. "Nvidia's Vera Rubin CPU, GPUs chart course for 600kW racks." March 19, 2025. https://www.theregister.com/2025/03/19/nvidia_charts_course_for_600kw.

² NVIDIA Newsroom. "NVIDIA Unveils Rubin CPX: A New Class of GPU Designed for Massive-Context Inference." 2025. https://nvidianews.nvidia.com/news/nvidia-unveils-rubin-cpx-a-new-class-of-gpu-designed-for-massive-context-inference.

³ Ibid.

⁴ Data Center Dynamics. "GTC: Nvidia's Jensen Huang, Ian Buck, and Charlie Boyle on the future of data center rack density." March 21, 2025. https://www.datacenterdynamics.com/en/analysis/nvidia-gtc-jensen-huang-data-center-rack-density/.

⁵ TechPowerUp. "NVIDIA Unveils Vera CPU and Rubin Ultra AI GPU, Announces Feynman Architecture." 2025. https://www.techpowerup.com/334334/nvidia-unveils-vera-cpu-and-rubin-ultra-ai-gpu-announces-feynman-architecture.

⁶ CNBC. "Nvidia announces Blackwell Ultra and Vera Rubin AI chips." March 18, 2025. https://www.cnbc.com/2025/03/18/nvidia-announces-blackwell-ultra-and-vera-rubin-ai-chips-.html.

⁷ Yahoo Finance. "Nvidia debuts next-generation Vera Rubin superchip at GTC 2025." March 18, 2025. https://finance.yahoo.com/news/nvidia-debuts-next-generation-vera-rubin-superchip-at-gtc-2025-184305222.html.

⁸ Next Platform. "Nvidia Draws GPU System Roadmap Out To 2028." June 5, 2025. https://www.nextplatform.com/2025/03/19/nvidia-draws-gpu-system-roadmap-out-to-2028/.

⁹ SemiAnalysis. "NVIDIA GTC 2025 – Built For Reasoning, Vera Rubin, Kyber, CPO, Dynamo Inference, Jensen Math, Feynman." August 4, 2025. https://semianalysis.com/2025/03/19/nvidia-gtc-2025-built-for-reasoning-vera-rubin-kyber-cpo-dynamo-inference-jensen-math-feynman/.

¹⁰ NVIDIA Newsroom. "NVIDIA Unveils Rubin CPX: A New Class of GPU Designed for Massive-Context Inference."

¹¹ Ibid.

¹² Tom's Hardware. "Nvidia announces Rubin GPUs in 2026, Rubin Ultra in 2027, Feynman also added to roadmap." March 18, 2025. https://www.tomshardware.com/pc-components/gpus/nvidia-announces-rubin-gpus-in-2026-rubin-ultra-in-2027-feynam-after.

¹³ The New Stack. "NVIDIA Unveils Next-Gen Rubin and Feynman Architectures, Pushing AI Power Limits." April 14, 2025. https://thenewstack.io/nvidia-unveils-next-gen-rubin-and-feynman-architectures-pushing-ai-power-limits/.

¹⁴ NVIDIA Newsroom. "NVIDIA Unveils Rubin CPX: A New Class of GPU Designed for Massive-Context Inference."

¹⁵ Data Center Dynamics. "Nvidia's Rubin Ultra NVL576 rack expected to be 600kW, coming second half of 2027." March 18, 2025. https://www.datacenterdynamics.com/en/news/nvidias-rubin-ultra-nvl576-rack-expected-to-be-600kw-coming-second-half-of-2027/.

¹⁶ Tom's Hardware. "Nvidia shows off Rubin Ultra with 600,000-Watt Kyber racks and infrastructure, coming in 2027." March 19, 2025. https://www.tomshardware.com/pc-components/gpus/nvidia-shows-off-rubin-ultra-with-600-000-watt-kyber-racks-and-infrastructure-coming-in-2027.

¹⁷ Data Center Dynamics. "GTC: Nvidia's Jensen Huang, Ian Buck, and Charlie Boyle on the future of data center rack density."

¹⁸ Data Center Frontier. "CoolIT and Accelsius Push Data Center Liquid Cooling Limits Amid Soaring Rack Densities." 2025. https://www.datacenterfrontier.com/cooling/article/55281394/coolit-and-accelsius-push-data-center-liquid-cooling-limits-amid-soaring-rack-densities.

¹⁹ Data Center Dynamics. "GTC: Nvidia's Jensen Huang, Ian Buck, and Charlie Boyle on the future of data center rack density."

²⁰ NVIDIA Technical Blog. "NVIDIA 800 VDC Architecture Will Power the Next Generation of AI Factories." May 20, 2025. https://developer.nvidia.com/blog/nvidia-800-v-hvdc-architecture-will-power-the-next-generation-of-ai-factories/.

²¹ Ibid.

²² Ibid.

²⁴ NVIDIA Newsroom. "NVIDIA Unveils Rubin CPX: A New Class of GPU Designed for Massive-Context Inference."

²⁵ Ibid.

²⁶ NVIDIA Blog. "Blue Lion Supercomputer Will Run on NVIDIA Vera Rubin." June 10, 2025. https://blogs.nvidia.com/blog/blue-lion-vera-rubin/.

²⁷ Ibid.

²⁸ NVIDIA Newsroom. "NVIDIA Unveils Rubin CPX: A New Class of GPU Designed for Massive-Context Inference."

²⁹ The Register. "Nvidia's Vera Rubin CPU, GPUs chart course for 600kW racks."

³⁰ Global Data Center Hub. "Nvidia's 600kW Racks Are Here (Is Your Infrastructure Ready?)." March 23, 2025. https://www.globaldatacenterhub.com/p/issue-8-nvidias-600kw-racks-are-hereis.

³¹ TechPowerUp. "NVIDIA Unveils Vera CPU and Rubin Ultra AI GPU, Announces Feynman Architecture."

³² Data Center Dynamics. "GTC: Nvidia's Jensen Huang, Ian Buck, and Charlie Boyle on the future of data center rack density."

아키텍처 혁신은 맞춤형 실리콘부터 시작됩니다.

배포에는 완전한 인프라 개편이 필요합니다.

전력 아키텍처 진화가 메가와트급 컴퓨팅을 가능하게 합니다.

성능 향상이 인프라 투자를 정당화합니다.

인프라 도전이 시장 기회를 창출합니다.

Vera Rubin 너머의 길

결론

참고문헌

You Might Also Like

AI를 위한 UPS 및 전력 분배: 복원력 있는 2N+1 인프라 설계

AI를 위한 레거시 데이터센터 개조: 액체 냉각 통합 가이드

xAI Colossus 2GW 달성: 55만 5천 GPU, 180억 달러, 세계 최대 AI 시설

견적 요청_

요청이 접수되었습니다_