NVIDIA Vera Rubin 打破GPU常规，配备600千瓦机架和百万token内存

NVIDIA Vera Rubin推动数据中心到2027年达到600kW机架，提供7.5倍性能提升，同时要求完整的基础设施转型。

Blake Crosley

Sep 25, 2025 3 min read Disclaimer

NVIDIA Vera Rubin 打破GPU常规，配备600千瓦机架和百万token内存

NVIDIA CEO Jensen Huang在GTC 2025上抛出重磅炸弹，让基础设施团队纷纷拿起计算器：Vera Rubin平台将在2027年将数据中心机架功耗推至600千瓦。¹此次发布标志着数据中心运营方式的根本性转变，迫使业界完全重新思考几十年来本质上未曾改变的供电、冷却系统和物理基础设施。

Vera Rubin平台代表了NVIDIA迄今为止最雄心勃勃的飞跃。这个多组件系统结合了定制的Vera CPU、下一代Rubin GPU，以及专门为百万token AI工作负载设计的专用Rubin CPX（Context Processing eXtension）加速器。²与GPU代际的渐进式改进不同，Vera Rubin NVL144 CPX变体比当前的Blackwell GB300系统提供了7.5倍的AI性能，同时在根本上改变了GPU的封装、冷却和部署方式。³

[caption id="" align="alignnone" width="2522"] NVIDIA Vera Rubin NVL144平台规格显示3.6 exaflops的FP4推理性能，比GB300 NVL72提升3.3倍，将于2026年下半年发布。[/caption]

架构革命始于定制芯片

[caption id="" align="alignnone" width="2520"] NVIDIA从Blackwell到Feynman的完整路线图，显示了从Oberon到Kyber机架架构的演进，支持高达600kW的功耗。[/caption]

Vera CPU标志着NVIDIA脱离现成ARM设计的转向，搭载88个定制ARM核心和同步多线程技术，实现176个逻辑处理器。⁵NVIDIA将这些定制核心称为"Olympus"，其设计提供了比当前Blackwell系统中使用的Grace CPU两倍的性能。⁶每个Vera CPU通过1.8 TB/s的NVLink C2C接口连接Rubin GPU，实现计算元件之间前所未有的带宽。⁷

标准Rubin GPU通过每个封装288GB的HBM4内存突破界限，保持与Blackwell Ultra B300相同的容量，但将内存带宽从8 TB/s提升至13 TB/s。⁸每个Rubin封装包含两个光罩限制的GPU芯片，尽管NVIDIA已改变其计数方法——Blackwell称为一个GPU（两个芯片），Rubin称为两个GPU。⁹这一变化反映了多芯片架构日益增长的复杂性，并帮助客户更好地理解每个系统中的实际计算资源。

最具创新性的元素以Rubin CPX的形式出现，这是专为大规模上下文处理而构建的专用加速器。单片设计提供30 petaFLOPs的NVFP4计算性能，配备128GB成本效益的GDDR7内存，专门针对transformer模型中的注意力机制进行优化。¹⁰CPX相比GB300 NVL72系统实现了3倍更快的注意力能力，使AI模型能够处理百万token上下文——相当于一小时视频或整个代码库——而不会出现性能下降。¹¹

部署需要完整的基础设施改造

计划于2026年下半年发布的标准Vera Rubin NVL144系统保持与现有GB200/GB300基础设施的兼容性，利用熟悉的Oberon机架架构。¹²该系统集成144个GPU芯片（72个封装）、36个Vera CPU，提供3.6 exaFLOPS的FP4推理性能——比Blackwell Ultra提升3.3倍。¹³功耗保持在大约120-130kW每机架的可控水平，与当前部署相似。

Vera Rubin NVL144 CPX变体进一步提升性能，集成144个Rubin CPX GPU、144个标准Rubin GPU和36个Vera CPU，在单个机架中提供8 exaFLOPs的NVFP4计算——比GB300 NVL72提升7.5倍——拥有100TB高速内存和1.7 PB/s内存带宽。¹⁴

2027年Rubin Ultra和Kyber机架架构的出现将彻底改变一切。NVL576系统将576个GPU芯片塞进单个机架，消耗600kW功率——是当前系统的五倍。¹⁵Kyber设计将计算刀片旋转90度至垂直方向，将4个18刀片组成的单元装入机架中。¹⁶每个刀片容纳8个Rubin Ultra GPU和Vera CPU，实现了几年前似乎不可能的密度。

[caption id="" align="alignnone" width="2522"] 当前NVIDIA Blackwell系统搭载72个GPU，提供1.1 exaflops性能[/caption]

[caption id="" align="alignnone" width="2524"] 未来NVIDIA Rubin系统扩展到576个GPU，在单个600kW机架中提供15 exaflops性能[/caption]

冷却这些系统需要完全液体浸没且零风扇——偏离了当前仍为辅助组件使用部分风冷的系统。¹⁷CoolIT Systems和Accelsius已经展示了能够在40°C入水温度下处理250kW机架的冷却解决方案，验证了通向600kW部署的技术路径。¹⁸Kyber机架包含专用的电源和冷却基础设施边车，实际上每个600kW系统需要两个机架占用空间。¹⁹

电源架构演进实现兆瓦级计算

NVIDIA向800 VDC配电的过渡解决了当前基础设施的基本物理限制。传统的54V机架内配电对于Kyber规模系统需要64U的电源架，没有为实际计算留下空间。²⁰800V架构消除了机架级AC/DC转换，将端到端效率提高多达5%，维护成本降低多达70%。²¹

新的电源基础设施支持从100kW到超过1MW的机架，使用相同的骨干架构，并为未来代际提供所需的可扩展性。²²部署Vera Rubin的公司必须规划大规模的电气升级——单个NVL576机架的用电量相当于400个典型家庭。计划2027年部署的数据中心应立即开始基础设施升级，包括公用事业规模的电力连接和潜在的现场发电。

性能提升证明基础设施投资的合理性

Vera Rubin NVL144 CPX变体展示了该平台的潜力，在单个机架中提供8 exaFLOPS的NVFP4计算，以及100TB高速内存和1.7 PB/s内存带宽。²⁴NVIDIA声称组织可实现30倍至50倍的投资回报，从1亿美元的资本投资中获得50亿美元的收入。²⁵

早期采用者包括德国的Leibniz超算中心，正在部署搭载Vera Rubin的Blue Lion超级计算机，实现比其当前系统30倍的计算能力。²⁶Lawrence Berkeley国家实验室的Doudna系统也将运行Vera Rubin，将模拟、数据和AI整合到科学计算的单一平台中。²⁷

Rubin CPX对上下文处理的专业化解决了当前AI系统的关键瓶颈。Cursor、Runway和Magic等公司已经在探索CPX如何加速需要同时处理数百万token的编程助手和视频生成应用。²⁸将整个代码库或数小时视频保持在活动内存中的能力从根本上改变了AI应用所能实现的功能。

基础设施挑战创造市场机遇

向600kW机架的飞跃暴露了当前数据中心能力的严酷现实。大多数设施在40kW机架方面都有困难；即使是最先进的AI数据中心也很少超过120kW。这一转变不仅需要新的冷却系统，还需要完整的设施重新设计，从能够支撑大规模重量负载的混凝土地板到为工业运营规模设计的变电站。

"问题仍然是有多少现有数据中心设施能够支持如此密集的配置，"The Register指出，强调Kyber机架的定制化性质意味着设施需要专门构建的基础设施。²⁹拥有剩余可再生能源或核能的地区——斯堪的纳维亚、魁北克和UAE——的绿地开发项目可能引领采用。³⁰

时间表给行业提供了喘息空间，但需要立即行动。规划2027年及以后AI基础设施的组织必须现在就做出关于设施位置、电力采购和冷却架构的决策。三年的提前期反映了部署在物理可能性边缘运行的基础设施的复杂性。

Vera Rubin之后的道路

NVIDIA的路线图延伸到Vera Rubin之后的2028年Feynman架构，可能推向1兆瓦机架。³¹Vertiv CEO Giordano Albertazzi建议实现MW级密度将需要"液体冷却的进一步革命，以及电源侧的范式变化。"³²这一轨迹似乎不可避免——AI工作负载需要计算密度的指数级增长，而经济性有利于集中而非分散。

从渐进式改进到GPU基础设施革命性变化的转变反映了更广泛的AI转型。正如大型语言模型从数十亿参数跃升到万亿参数，支撑它们的基础设施也必须实现类似的飞跃。Vera Rubin代表的不仅是更快的GPU，而是对计算基础设施工作方式的根本性重新思考。

结论

NVIDIA的Vera Rubin平台迫使数据中心行业面对关于基础设施限制的不舒服真相，同时提供前所未有的计算能力。2027年的600kW机架不仅仅代表更高的功耗——它们标志着AI基础设施构建、冷却和运营方式的完全转型。现在开始规划，与理解下一代部署复杂性的经验丰富的基础设施专家合作的组织，将最好地定位以利用Vera Rubin带来的革命性能力。

该平台在2026-2027年的到来给行业提供了准备时间，但时间正在流逝。今天设计的数据中心必须预见明天的需求，而Vera Rubin清楚地表明明天需要从传统思维的根本性偏离。拥抱这一转型的公司将驱动下一代AI突破，从百万token语言模型到今天看来像科幻小说的实时视频生成系统。

参考文献

¹ The Register. "Nvidia's Vera Rubin CPU, GPUs chart course for 600kW racks." March 19, 2025. https://www.theregister.com/2025/03/19/nvidia_charts_course_for_600kw.

² NVIDIA Newsroom. "NVIDIA Unveils Rubin CPX: A New Class of GPU Designed for Massive-Context Inference." 2025. https://nvidianews.nvidia.com/news/nvidia-unveils-rubin-cpx-a-new-class-of-gpu-designed-for-massive-context-inference.

³ Ibid.

⁴ Data Center Dynamics. "GTC: Nvidia's Jensen Huang, Ian Buck, and Charlie Boyle on the future of data center rack density." March 21, 2025. https://www.datacenterdynamics.com/en/analysis/nvidia-gtc-jensen-huang-data-center-rack-density/.

⁵ TechPowerUp. "NVIDIA Unveils Vera CPU and Rubin Ultra AI GPU, Announces Feynman Architecture." 2025. https://www.techpowerup.com/334334/nvidia-unveils-vera-cpu-and-rubin-ultra-ai-gpu-announces-feynman-architecture.

⁶ CNBC. "Nvidia announces Blackwell Ultra and Vera Rubin AI chips." March 18, 2025. https://www.cnbc.com/2025/03/18/nvidia-announces-blackwell-ultra-and-vera-rubin-ai-chips-.html.

⁷ Yahoo Finance. "Nvidia debuts next-generation Vera Rubin superchip at GTC 2025." March 18, 2025. https://finance.yahoo.com/news/nvidia-debuts-next-generation-vera-rubin-superchip-at-gtc-2025-184305222.html.

⁸ Next Platform. "Nvidia Draws GPU System Roadmap Out To 2028." June 5, 2025. https://www.nextplatform.com/2025/03/19/nvidia-draws-gpu-system-roadmap-out-to-2028/.

⁹ SemiAnalysis. "NVIDIA GTC 2025 – Built For Reasoning, Vera Rubin, Kyber, CPO, Dynamo Inference, Jensen Math, Feynman." August 4, 2025. https://semianalysis.com/2025/03/19/nvidia-gtc-2025-built-for-reasoning-vera-rubin-kyber-cpo-dynamo-inference-jensen-math-feynman/.

¹⁰ NVIDIA Newsroom. "NVIDIA Unveils Rubin CPX: A New Class of GPU Designed for Massive-Context Inference."

¹¹ Ibid.

¹² Tom's Hardware. "Nvidia announces Rubin GPUs in 2026, Rubin Ultra in 2027, Feynman also added to roadmap." March 18, 2025. https://www.tomshardware.com/pc-components/gpus/nvidia-announces-rubin-gpus-in-2026-rubin-ultra-in-2027-feynam-after.

¹³ The New Stack. "NVIDIA Unveils Next-Gen Rubin and Feynman Architectures, Pushing AI Power Limits." April 14, 2025. https://thenewstack.io/nvidia-unveils-next-gen-rubin-and-feynman-architectures-pushing-ai-power-limits/.

¹⁴ NVIDIA Newsroom. "NVIDIA Unveils Rubin CPX: A New Class of GPU Designed for Massive-Context Inference."

¹⁵ Data Center Dynamics. "Nvidia's Rubin Ultra NVL576 rack expected to be 600kW, coming second half of 2027." March 18, 2025. https://www.datacenterdynamics.com/en/news/nvidias-rubin-ultra-nvl576-rack-expected-to-be-600kw-coming-second-half-of-2027/.

¹⁶ Tom's Hardware. "Nvidia shows off Rubin Ultra with 600,000-Watt Kyber racks and infrastructure, coming in 2027." March 19, 2025. https://www.tomshardware.com/pc-components/gpus/nvidia-shows-off-rubin-ultra-with-600-000-watt-kyber-racks-and-infrastructure-coming-in-2027.

¹⁷ Data Center Dynamics. "GTC: Nvidia's Jensen Huang, Ian Buck, and Charlie Boyle on the future of data center rack density."

¹⁸ Data Center Frontier. "CoolIT and Accelsius Push Data Center Liquid Cooling Limits Amid Soaring Rack Densities." 2025. https://www.datacenterfrontier.com/cooling/article/55281394/coolit-and-accelsius-push-data-center-liquid-cooling-limits-amid-soaring-rack-densities.

¹⁹ Data Center Dynamics. "GTC: Nvidia's Jensen Huang, Ian Buck, and Charlie Boyle on the future of data center rack density."

²⁰ NVIDIA Technical Blog. "NVIDIA 800 VDC Architecture Will Power the Next Generation of AI Factories." May 20, 2025. https://developer.nvidia.com/blog/nvidia-800-v-hvdc-architecture-will-power-the-next-generation-of-ai-factories/.

²¹ Ibid.

²² Ibid.

²⁴ NVIDIA Newsroom. "NVIDIA Unveils Rubin CPX: A New Class of GPU Designed for Massive-Context Inference."

²⁵ Ibid.

²⁶ NVIDIA Blog. "Blue Lion Supercomputer Will Run on NVIDIA Vera Rubin." June 10, 2025. https://blogs.nvidia.com/blog/blue-lion-vera-rubin/.

²⁷ Ibid.

²⁸ NVIDIA Newsroom. "NVIDIA Unveils Rubin CPX: A New Class of GPU Designed for Massive-Context Inference."

²⁹ The Register. "Nvidia's Vera Rubin CPU, GPUs chart course for 600kW racks."

³⁰ Global Data Center Hub. "Nvidia's 600kW Racks Are Here (Is Your Infrastructure Ready?)." March 23, 2025. https://www.globaldatacenterhub.com/p/issue-8-nvidias-600kw-racks-are-hereis.

³¹ TechPowerUp. "NVIDIA Unveils Vera CPU and Rubin Ultra AI GPU, Announces Feynman Architecture."

³² Data Center Dynamics. "GTC: Nvidia's Jensen Huang, Ian Buck, and Charlie Boyle on the future of data center rack density."

架构革命始于定制芯片

部署需要完整的基础设施改造

电源架构演进实现兆瓦级计算

性能提升证明基础设施投资的合理性

基础设施挑战创造市场机遇

Vera Rubin之后的道路

结论

参考文献

You Might Also Like

AI 的 UPS 与配电系统：设计弹性 2N+1 基础设施

改造传统数据中心以支持AI：液冷集成指南

xAI Colossus达到2吉瓦：55.5万GPU，180亿美元，全球最大AI设施

申请报价_

请求已收到_