NVIDIA Vera Rubin rompe o padrão das GPUs com racks de 600 quilowatts e memórias de milhões de tokens

A NVIDIA Vera Rubin impulsiona data centers para racks de 600kW até 2027, entregando ganhos de performance de 7,5x enquanto exige transformação completa da infraestrutura.

NVIDIA Vera Rubin rompe o padrão das GPUs com racks de 600 quilowatts e memórias de milhões de tokens

O CEO da NVIDIA, Jensen Huang, soltou uma bomba no GTC 2025, fazendo as equipes de infraestrutura correrem para suas calculadoras: a plataforma Vera Rubin levará os racks dos data centers a 600 quilowatts até 2027.¹ O anúncio marca uma mudança fundamental na forma como os data centers operam, forçando uma reformulação completa dos sistemas de fornecimento de energia, resfriamento e infraestrutura física que permaneceram essencialmente inalterados por décadas.

A plataforma Vera Rubin representa o salto mais ambicioso da NVIDIA até agora. Este sistema de múltiplos componentes combina a CPU personalizada Vera, a GPU Rubin de próxima geração e o acelerador especializado Rubin CPX (Context Processing eXtension), projetado especificamente para cargas de trabalho de AI com milhões de tokens.² Diferentemente das melhorias incrementais típicas das gerações de GPU, a variante Vera Rubin NVL144 CPX oferece 7,5x o desempenho de AI dos sistemas Blackwell GB300 atuais, enquanto muda fundamentalmente como as GPUs são empacotadas, resfriadas e implantadas.³

[caption id="" align="alignnone" width="2522"] Especificações da plataforma NVIDIA Vera Rubin NVL144 mostrando 3,6 exaflops de desempenho de inferência FP4 e melhoria de 3,3x sobre GB300 NVL72, chegando no segundo semestre de 2026. Especificações da plataforma NVIDIA Vera Rubin NVL144 mostrando 3,6 exaflops de desempenho de inferência FP4 e melhoria de 3,3x sobre GB300 NVL72, chegando no segundo semestre de 2026. [/caption]

A revolução da arquitetura começa com silício personalizado.

[caption id="" align="alignnone" width="2520"] Roadmap completo da NVIDIA do Blackwell ao Feynman, mostrando a evolução das arquiteturas de rack Oberon para Kyber suportando até 600kW de consumo de energia. Roadmap completo da NVIDIA do Blackwell ao Feynman, mostrando a evolução das arquiteturas de rack Oberon para Kyber suportando até 600kW de consumo de energia. [/caption]

A CPU Vera marca o afastamento da NVIDIA dos designs ARM prontos para uso, apresentando 88 núcleos ARM personalizados com simultaneous multithreading, que habilita 176 processadores lógicos.⁵ A NVIDIA chama os núcleos personalizados de "Olympus", e o design oferece duas vezes o desempenho da CPU Grace usada nos sistemas Blackwell atuais.⁶ Cada CPU Vera se conecta às GPUs Rubin através de uma interface NVLink C2C de 1,8 TB/s, permitindo largura de banda sem precedentes entre os elementos de computação.⁷

A GPU Rubin padrão empurra os limites com 288GB de memória HBM4 por pacote, mantendo a mesma capacidade do Blackwell Ultra B300, mas aumentando de 8 TB/s para 13 TB/s de largura de banda de memória.⁸ Cada pacote Rubin contém dois dies de GPU limitados por retículo, embora a NVIDIA tenha mudado sua metodologia de contagem—o que o Blackwell chamava de uma GPU (dois dies), o Rubin chama de duas GPUs.⁹ A mudança reflete a complexidade crescente das arquiteturas multi-die e ajuda os clientes a entender melhor os recursos de computação reais em cada sistema.

O elemento mais inovador chega na forma do Rubin CPX, um acelerador construído especificamente para processamento de contexto massivo. O design monolítico oferece 30 petaFLOPs de computação NVFP4 com 128GB de memória GDDR7 eficiente em custo, especificamente otimizada para mecanismos de atenção em modelos transformer.¹⁰ O CPX alcança capacidades de atenção 3x mais rápidas comparado aos sistemas GB300 NVL72, permitindo que modelos de AI processem contextos de milhões de tokens—equivalente a uma hora de vídeo ou bases de código inteiras—sem degradação de desempenho.¹¹

A implantação exige uma reforma completa da infraestrutura.

O sistema padrão Vera Rubin NVL144, programado para chegar no segundo semestre de 2026, mantém compatibilidade com a infraestrutura GB200/GB300 existente, utilizando a familiar arquitetura de rack Oberon.¹² O sistema empacota 144 dies de GPU (72 pacotes), 36 CPUs Vera, e oferece 3,6 exaFLOPS de desempenho de inferência FP4—uma melhoria de 3,3x sobre o Blackwell Ultra.¹³ O consumo de energia permanece gerenciável em aproximadamente 120-130kW por rack, similar às implantações atuais.

A variante Vera Rubin NVL144 CPX leva o desempenho ainda mais longe, integrando 144 GPUs Rubin CPX junto com 144 GPUs Rubin padrão e 36 CPUs Vera para entregar oito exaFLOPs de computação NVFP4—essa melhoria de 7,5x sobre GB300 NVL72—com 100TB de memória de alta velocidade e 1,7 PB/s de largura de banda de memória em um único rack.¹⁴

Tudo muda com o Rubin Ultra e a arquitetura de rack Kyber em 2027. O sistema NVL576 empacota 576 dies de GPU em um único rack, consumindo 600kW de energia—cinco vezes os sistemas atuais.¹⁵ O design Kyber rotaciona os blades de computação em 90 graus para uma orientação vertical, empacotando quatro pods de 18 blades cada no rack.¹⁶ Cada blade abriga oito GPUs Rubin Ultra junto com CPUs Vera, alcançando densidades que pareciam impossíveis há poucos anos.

[caption id="" align="alignnone" width="2522"] Sistema NVIDIA Blackwell atual com 72 GPUs entregando 1,1 exaflops Sistema NVIDIA Blackwell atual com 72 GPUs entregando 1,1 exaflops [/caption]

[caption id="" align="alignnone" width="2524"] Sistema NVIDIA Rubin futuro escalando para 576 GPUs e 15 exaflops em um único rack de 600kW Sistema NVIDIA Rubin futuro escalando para 576 GPUs e 15 exaflops em um único rack de 600kW [/caption]

Resfriar esses sistemas requer imersão líquida completa com zero ventiladores—um afastamento dos sistemas atuais que ainda usam algum resfriamento a ar para componentes auxiliares.¹⁷ A CoolIT Systems e Accelsius já demonstraram soluções de resfriamento capazes de lidar com racks de 250kW com temperaturas de entrada de água de 40°C, validando o caminho tecnológico em direção às implantações de 600kW.¹⁸ O rack Kyber inclui um sidecar dedicado para infraestrutura de energia e resfriamento, efetivamente requerendo duas pegadas de rack para cada sistema de 600kW.¹⁹

A evolução da arquitetura de energia permite computação de escala megawatt.

A transição da NVIDIA para distribuição de energia 800 VDC aborda limitações fundamentais de física da infraestrutura atual. A distribuição tradicional 54V no rack exigiria 64U de prateleiras de energia para sistemas de escala Kyber, não deixando espaço para computação real.²⁰ A arquitetura 800V elimina a conversão AC/DC no nível do rack, melhora a eficiência de ponta a ponta em até 5%, e reduz os custos de manutenção em até 70%.²¹

A nova infraestrutura de energia suporta racks variando de 100kW a mais de 1MW, usando a mesma espinha dorsal, e fornece a escalabilidade necessária para gerações futuras.²² Empresas implantando Vera Rubin devem planejar atualizações elétricas massivas—um único rack NVL576 consome tanta energia quanto 400 residências típicas. Data centers planejando implantações para 2027 devem começar atualizações de infraestrutura agora, incluindo conexões de energia em escala de concessionária e potencialmente geração no local.

Os ganhos de desempenho justificam o investimento em infraestrutura.

A variante Vera Rubin NVL144 CPX demonstra o potencial da plataforma com seus oito exaFLOPS de computação NVFP4, junto com 100TB de memória de alta velocidade e 1,7 PB/s de largura de banda de memória, tudo em um único rack.²⁴ A NVIDIA alega que organizações podem alcançar 30x a 50x retorno sobre investimento, traduzindo-se em $5 bilhões em receita a partir de um investimento de capital de $100 milhões.²⁵

Adotantes iniciais incluem o Centro de Supercomputação Leibniz da Alemanha, que está implantando o supercomputador Blue Lion com Vera Rubin para alcançar 30 vezes mais poder de computação que seu sistema atual.²⁶ O sistema Doudna do Lawrence Berkeley National Lab também rodará no Vera Rubin, combinando simulação, dados e AI em uma única plataforma para computação científica.²⁷

A especialização do Rubin CPX para processamento de contexto aborda um gargalo crítico nos sistemas de AI atuais. Empresas como Cursor, Runway e Magic já estão explorando como o CPX pode acelerar assistentes de codificação e aplicações de geração de vídeo que requerem processamento de milhões de tokens simultaneamente.²⁸ A capacidade de manter bases de código inteiras ou horas de vídeo na memória ativa muda fundamentalmente o que aplicações de AI podem alcançar.

Desafios de infraestrutura criam oportunidades de mercado.

O salto para racks de 600kW expõe realidades duras sobre as capacidades atuais dos data centers. A maioria das instalações luta com racks de 40kW; até mesmo data centers de AI de ponta raramente excedem 120kW. A transição requer não apenas novos sistemas de resfriamento, mas redesenhos completos de instalações, desde pisos de concreto capazes de suportar cargas de peso massivas até subestações elétricas dimensionadas para operações industriais.

"A questão permanece de quantas instalações de datacenter existentes serão capazes de suportar tal configuração densa", observa o The Register, destacando que a natureza personalizada dos racks Kyber significa que as instalações precisam de infraestrutura construída especificamente.²⁹ Desenvolvimentos greenfield em regiões com energia renovável ou nuclear excedente—Escandinávia, Quebec e Emirados Árabes Unidos—provavelmente liderarão a adoção.³⁰

O cronograma dá à indústria uma folga, mas exige ação imediata. Organizações planejando infraestrutura de AI para 2027 e além devem tomar decisões agora sobre localizações de instalações, aquisição de energia e arquitetura de resfriamento. O prazo de três anos reflete a complexidade de implantar infraestrutura que opera no limite do que é fisicamente possível.

A estrada além do Vera Rubin

O roadmap da NVIDIA se estende além do Vera Rubin para a arquitetura Feynman em 2028, provavelmente empurrando em direção a racks de 1 megawatt.³¹ O CEO da Vertiv, Giordano Albertazzi, sugere que alcançar densidade de escala MW exigirá "uma revolução adicional no resfriamento líquido, e uma mudança de paradigma no lado da energia".³² A trajetória parece inevitável—cargas de trabalho de AI exigem aumentos exponenciais na densidade de computação, e a economia favorece concentração sobre distribuição.

A mudança de melhorias incrementais para mudanças revolucionárias na infraestrutura de GPU espelha a transformação mais ampla da AI. Assim como os grandes modelos de linguagem saltaram de bilhões para trilhões de parâmetros, a infraestrutura que os suporta deve fazer saltos similares. O Vera Rubin representa não apenas GPUs mais rápidas, mas um repensar fundamental de como a infraestrutura de computação funciona.

Conclusão

A plataforma Vera Rubin da NVIDIA força a indústria de data centers a confrontar verdades desconfortáveis sobre limitações de infraestrutura enquanto oferece capacidades computacionais sem precedentes. Os racks de 600kW de 2027 representam mais do que apenas maior consumo de energia—eles marcam uma transformação completa em como a infraestrutura de AI é construída, resfriada e operada. Organizações que começarem a planejar agora, fazendo parcerias com especialistas em infraestrutura experientes que entendem as complexidades das implantações de próxima geração, estarão mais bem posicionadas para aproveitar as capacidades revolucionárias que o Vera Rubin possibilita.

A chegada da plataforma em 2026-2027 dá à indústria tempo para se preparar, mas o relógio está correndo. Data centers projetados hoje devem antecipar os requisitos de amanhã, e o Vera Rubin deixa claro que amanhã exige afastamentos radicais do pensamento convencional. As empresas que abraçarem essa transformação alimentarão a próxima geração de avanços em AI, desde modelos de linguagem de milhões de tokens até sistemas de geração de vídeo em tempo real que parecem ficção científica hoje.

Referências

¹ The Register. "Nvidia's Vera Rubin CPU, GPUs chart course for 600kW racks." March 19, 2025. https://www.theregister.com/2025/03/19/nvidia_charts_course_for_600kw.

² NVIDIA Newsroom. "NVIDIA Unveils Rubin CPX: A New Class of GPU Designed for Massive-Context Inference." 2025. https://nvidianews.nvidia.com/news/nvidia-unveils-rubin-cpx-a-new-class-of-gpu-designed-for-massive-context-inference.

³ Ibid.

⁴ Data Center Dynamics. "GTC: Nvidia's Jensen Huang, Ian Buck, and Charlie Boyle on the future of data center rack density." March 21, 2025. https://www.datacenterdynamics.com/en/analysis/nvidia-gtc-jensen-huang-data-center-rack-density/.

⁵ TechPowerUp. "NVIDIA Unveils Vera CPU and Rubin Ultra AI GPU, Announces Feynman Architecture." 2025. https://www.techpowerup.com/334334/nvidia-unveils-vera-cpu-and-rubin-ultra-ai-gpu-announces-feynman-architecture.

⁶ CNBC. "Nvidia announces Blackwell Ultra and Vera Rubin AI chips." March 18, 2025. https://www.cnbc.com/2025/03/18/nvidia-announces-blackwell-ultra-and-vera-rubin-ai-chips-.html.

⁷ Yahoo Finance. "Nvidia debuts next-generation Vera Rubin superchip at GTC 2025." March 18, 2025. https://finance.yahoo.com/news/nvidia-debuts-next-generation-vera-rubin-superchip-at-gtc-2025-184305222.html.

⁸ Next Platform. "Nvidia Draws GPU System Roadmap Out To 2028." June 5, 2025. https://www.nextplatform.com/2025/03/19/nvidia-draws-gpu-system-roadmap-out-to-2028/.

⁹ SemiAnalysis. "NVIDIA GTC 2025 – Built For Reasoning, Vera Rubin, Kyber, CPO, Dynamo Inference, Jensen Math, Feynman." August 4, 2025. https://semianalysis.com/2025/03/19/nvidia-gtc-2025-built-for-reasoning-vera-rubin-kyber-cpo-dynamo-inference-jensen-math-feynman/.

¹⁰ NVIDIA Newsroom. "NVIDIA Unveils Rubin CPX: A New Class of GPU Designed for Massive-Context Inference."

¹¹ Ibid.

¹² Tom's Hardware. "Nvidia announces Rubin GPUs in 2026, Rubin Ultra in 2027, Feynman also added to roadmap." March 18, 2025. https://www.tomshardware.com/pc-components/gpus/nvidia-announces-rubin-gpus-in-2026-rubin-ultra-in-2027-feynam-after.

¹³ The New Stack. "NVIDIA Unveils Next-Gen Rubin and Feynman Architectures, Pushing AI Power Limits." April 14, 2025. https://thenewstack.io/nvidia-unveils-next-gen-rubin-and-feynman-architectures-pushing-ai-power-limits/.

¹⁴ NVIDIA Newsroom. "NVIDIA Unveils Rubin CPX: A New Class of GPU Designed for Massive-Context Inference."

¹⁵ Data Center Dynamics. "Nvidia's Rubin Ultra NVL576 rack expected to be 600kW, coming second half of 2027." March 18, 2025. https://www.datacenterdynamics.com/en/news/nvidias-rubin-ultra-nvl576-rack-expected-to-be-600kw-coming-second-half-of-2027/.

¹⁶ Tom's Hardware. "Nvidia shows off Rubin Ultra with 600,000-Watt Kyber racks and infrastructure, coming in 2027." March 19, 2025. https://www.tomshardware.com/pc-components/gpus/nvidia-shows-off-rubin-ultra-with-600-000-watt-kyber-racks-and-infrastructure-coming-in-2027.

¹⁷ Data Center Dynamics. "GTC: Nvidia's Jensen Huang, Ian Buck, and Charlie Boyle on the future of data center rack density."

¹⁸ Data Center Frontier. "CoolIT and Accelsius Push Data Center Liquid Cooling Limits Amid Soaring Rack Densities." 2025. https://www.datacenterfrontier.com/cooling/article/55281394/coolit-and-accelsius-push-data-center-liquid-cooling-limits-amid-soaring-rack-densities.

¹⁹ Data Center Dynamics. "GTC: Nvidia's Jensen Huang, Ian Buck, and Charlie Boyle on the future of data center rack density."

²⁰ NVIDIA Technical Blog. "NVIDIA 800 VDC Architecture Will Power the Next Generation of AI Factories." May 20, 2025. https://developer.nvidia.com/blog/nvidia-800-v-hvdc-architecture-will-power-the-next-generation-of-ai-factories/.

²¹ Ibid.

²² Ibid.

²⁴ NVIDIA Newsroom. "NVIDIA Unveils Rubin CPX: A New Class of GPU Designed for Massive-Context Inference."

²⁵ Ibid.

²⁶ NVIDIA Blog. "Blue Lion Supercomputer Will Run on NVIDIA Vera Rubin." June 10, 2025. https://blogs.nvidia.com/blog/blue-lion-vera-rubin/.

²⁷ Ibid.

²⁸ NVIDIA Newsroom. "NVIDIA Unveils Rubin CPX: A New Class of GPU Designed for Massive-Context Inference."

²⁹ The Register. "Nvidia's Vera Rubin CPU, GPUs chart course for 600kW racks."

³⁰ Global Data Center Hub. "Nvidia's 600kW Racks Are Here (Is Your Infrastructure Ready?)." March 23, 2025. https://www.globaldatacenterhub.com/p/issue-8-nvidias-600kw-racks-are-hereis.

³¹ TechPowerUp. "NVIDIA Unveils Vera CPU and Rubin Ultra AI GPU, Announces Feynman Architecture."

³² Data Center Dynamics. "GTC: Nvidia's Jensen Huang, Ian Buck, and Charlie Boyle on the future of data center rack density."

Solicitar Orçamento_

Conte-nos sobre seu projeto e responderemos em até 72 horas.

> TRANSMISSÃO_CONCLUÍDA

Solicitação Recebida_

Obrigado por sua consulta. Nossa equipe analisará sua solicitação e responderá em até 72 horas.

EM FILA PARA PROCESSAMENTO