NVIDIA Vera Rubin doorbreekt de GPU-vorm met 600-kilowatt racks en geheugens van een miljoen tokens

NVIDIA Vera Rubin drijft datacenters naar 600kW racks tegen 2027, met 7,5x prestatieverbeteringen terwijl een complete infrastructuurtransformatie vereist is.

NVIDIA Vera Rubin doorbreekt de GPU-vorm met 600-kilowatt racks en geheugens van een miljoen tokens

NVIDIA CEO Jensen Huang liet een bom barsten op GTC 2025, waardoor infrastructuurteams haastig naar hun rekenmachines grepen: het Vera Rubin platform zal datacenterrekken tegen 2027 naar 600 kilowatt stuwen.¹ De aankondiging markeert een fundamentele verschuiving in hoe datacenters opereren, en dwingt een complete heroverweging af van stroomlevering, koelsystemen en fysieke infrastructuur die decennialang in wezen onveranderd is gebleven.

Het Vera Rubin platform vertegenwoordigt NVIDIA's meest ambitieuze sprong tot nu toe. Dit multi-component systeem combineert de aangepaste Vera CPU, de volgende generatie Rubin GPU, en de gespecialiseerde Rubin CPX (Context Processing eXtension) accelerator, specifiek ontworpen voor miljoen-token AI workloads.² In tegenstelling tot de incrementele verbeteringen die typisch zijn voor GPU-generaties, levert de Vera Rubin NVL144 CPX variant 7,5x de AI-prestaties van de huidige Blackwell GB300 systemen terwijl het fundamenteel verandert hoe GPU's worden verpakt, gekoeld en ingezet.³

[caption id="" align="alignnone" width="2522"] NVIDIA Vera Rubin NVL144 platform specificaties met 3,6 exaflops FP4 inference prestaties en 3,3x verbetering ten opzichte van GB300 NVL72, aankomend tweede helft 2026. NVIDIA Vera Rubin NVL144 platform specificaties met 3,6 exaflops FP4 inference prestaties en 3,3x verbetering ten opzichte van GB300 NVL72, aankomend tweede helft 2026. [/caption]

De architectuurrevolutie begint met aangepaste silicium.

[caption id="" align="alignnone" width="2520"] NVIDIA's complete roadmap van Blackwell tot Feynman, met de evolutie van Oberon naar Kyber rek-architecturen die tot 600kW stroomverbruik ondersteunen. NVIDIA's complete roadmap van Blackwell tot Feynman, met de evolutie van Oberon naar Kyber rek-architecturen die tot 600kW stroomverbruik ondersteunen. [/caption]

De Vera CPU markeert NVIDIA's afwijking van standaard ARM-ontwerpen, met 88 aangepaste ARM-cores met simultaneous multithreading, wat 176 logische processors mogelijk maakt.⁵ NVIDIA noemt de aangepaste cores "Olympus," en het ontwerp levert tweemaal de prestaties van de Grace CPU gebruikt in huidige Blackwell systemen.⁶ Elke Vera CPU verbindt met Rubin GPU's via een 1,8 TB/s NVLink C2C interface, wat ongekende bandbreedte tussen compute-elementen mogelijk maakt.⁷

De standaard Rubin GPU doorbreekt grenzen met 288GB HBM4 geheugen per pakket, waarbij dezelfde capaciteit als de Blackwell Ultra B300 wordt behouden maar de geheugenbandbreedte toeneemt van 8 TB/s naar 13 TB/s.⁸ Elk Rubin pakket bevat twee reticle-gelimiteerde GPU dies, hoewel NVIDIA zijn telmethodologie heeft veranderd—wat Blackwell één GPU noemde (twee dies), noemt Rubin twee GPU's.⁹ De verandering reflecteert de toenemende complexiteit van multi-die architecturen en helpt klanten de werkelijke compute-bronnen in elk systeem beter begrijpen.

Het meest innovatieve element arriveert in de vorm van Rubin CPX, een speciaal gebouwde accelerator voor massieve contextverwerking. Het monolithische ontwerp levert 30 petaFLOPS NVFP4 compute met 128GB kostenefficiënt GDDR7 geheugen, specifiek geoptimaliseerd voor attention-mechanismen in transformer-modellen.¹⁰ De CPX behaalt 3x snellere attention-capaciteiten vergeleken met GB300 NVL72 systemen, waardoor AI-modellen miljoen-token contexten kunnen verwerken—equivalent aan een uur video of hele codebases—zonder prestatievermindering.¹¹

Implementatie vereist een complete infrastructuur-overhaul.

Het standaard Vera Rubin NVL144 systeem, gepland voor de tweede helft van 2026, behoudt compatibiliteit met bestaande GB200/GB300 infrastructuur, gebruikmakend van de bekende Oberon rek-architectuur.¹² Het systeem pakt 144 GPU dies (72 pakketten), 36 Vera CPU's, en levert 3,6 exaFLOPS FP4 inference prestaties—een 3,3x verbetering ten opzichte van Blackwell Ultra.¹³ Stroomverbruik blijft beheersbaar op ongeveer 120-130kW per rek, vergelijkbaar met huidige implementaties.

De Vera Rubin NVL144 CPX variant gaat verder in prestaties, door 144 Rubin CPX GPU's te integreren naast 144 standaard Rubin GPU's en 36 Vera CPU's om acht exaFLOPs NVFP4 compute te leveren—die 7,5x verbetering ten opzichte van GB300 NVL72—met 100TB high-speed geheugen en 1,7 PB/s geheugenbandbreedte in een enkele rek.¹⁴

Alles verandert met Rubin Ultra en de Kyber rek-architectuur in 2027. Het NVL576 systeem propt 576 GPU dies in een enkele rek, verbruikt 600kW stroom—vijf keer huidige systemen.¹⁵ Het Kyber ontwerp draait compute blades 90 graden naar een verticale oriëntatie, waarbij vier pods van elk 18 blades in de rek worden gepakt.¹⁶ Elke blade huisvest acht Rubin Ultra GPU's naast Vera CPU's, waarbij dichtheden worden bereikt die nog jaren geleden onmogelijk leken.

[caption id="" align="alignnone" width="2522"] Huidig NVIDIA Blackwell Systeem met 72 GPU's die 1,1 exaflops leveren Huidig NVIDIA Blackwell Systeem met 72 GPU's die 1,1 exaflops leveren [/caption]

[caption id="" align="alignnone" width="2524"] Toekomstig NVIDIA Rubin Systeem schaalt naar 576 GPU's en 15 exaflops in een enkele 600kW rek Toekomstig NVIDIA Rubin Systeem schaalt naar 576 GPU's en 15 exaflops in een enkele 600kW rek [/caption]

Het koelen van deze systemen vereist complete vloeistofonderdompeling met nul ventilatoren—een afwijking van huidige systemen die nog steeds enige luchtkoeling gebruiken voor hulpcomponenten.¹⁷ CoolIT Systems en Accelsius hebben al koeloplossingen gedemonstreerd die 250kW rekken aankunnen met 40°C inlet watertemperaturen, wat het technologiepad naar 600kW implementaties valideert.¹⁸ De Kyber rek bevat een speciale sidecar voor stroom- en koelinfrastructuur, wat effectief twee rek-voetafdrukken vereist voor elk 600kW systeem.¹⁹

Stroomarchitectuur-evolutie maakt megawatt-schaal computing mogelijk.

NVIDIA's overgang naar 800 VDC stroomdistributie pakt fundamentele fysieke beperkingen van huidige infrastructuur aan. Traditionele 54V in-rek distributie zou 64U aan stroomkasten vereisen voor Kyber-schaal systemen, wat geen ruimte overlaat voor werkelijke compute.²⁰ De 800V architectuur elimineert AC/DC conversie op rekniveau, verbetert end-to-end efficiëntie met tot 5%, en reduceert onderhoudskosten met tot 70%.²¹

De nieuwe stroominfrastructuur ondersteunt rekken van 100kW tot meer dan 1MW, gebruikmakend van dezelfde backbone, en biedt de schaalbaarheid die nodig is voor toekomstige generaties.²² Bedrijven die Vera Rubin implementeren moeten plannen voor massieve elektrische upgrades—een enkele NVL576 rek trekt evenveel stroom als 400 typische huizen. Datacenters die plannen voor 2027 implementaties zouden nu infrastructuur-upgrades moeten beginnen, inclusief utility-schaal stroomverbindingen en mogelijk ter plekke opwekking.

Prestatiewinsten rechtvaardigen infrastructuur-investering.

De Vera Rubin NVL144 CPX variant toont het potentieel van het platform met zijn acht exaFLOPS NVFP4 compute, naast 100TB high-speed geheugen en 1,7 PB/s geheugenbandbreedte, alles in een enkele rek.²⁴ NVIDIA beweert dat organisaties 30x tot 50x return on investment kunnen behalen, wat vertaalt naar $5 miljard inkomsten uit een $100 miljoen kapitaalinvestering.²⁵

Vroege adoptanten omvatten Duitsland's Leibniz Supercomputing Centre, dat de Blue Lion supercomputer implementeert met Vera Rubin om 30 keer meer rekenkracht te bereiken dan hun huidige systeem.²⁶ Lawrence Berkeley National Lab's Doudna systeem zal ook draaien op Vera Rubin, waarbij simulatie, data en AI worden gecombineerd in een enkel platform voor wetenschappelijk computergebruik.²⁷

De Rubin CPX's specialisatie voor contextverwerking pakt een kritieke bottleneck aan in huidige AI-systemen. Bedrijven zoals Cursor, Runway en Magic onderzoeken al hoe CPX coding assistenten en video generatie applicaties kan versnellen die miljoenen tokens tegelijkertijd moeten verwerken.²⁸ Het vermogen om hele codebases of uren video in actief geheugen te houden verandert fundamenteel wat AI-applicaties kunnen bereiken.

Infrastructuur-uitdagingen creëren marktkansen.

De sprong naar 600kW rekken legt harde realiteiten bloot over huidige datacenter-capaciteiten. De meeste faciliteiten worstelen met 40kW rekken; zelfs geavanceerde AI-datacenters overschrijden zelden 120kW. De overgang vereist niet alleen nieuwe koelsystemen maar complete facility-herontwerpen, van betonnen vloeren die massief gewicht kunnen dragen tot elektrische onderstations gedimensioneerd voor industriële operaties.

"De vraag blijft hoeveel bestaande datacenter-faciliteiten zo'n dichte configuratie zullen kunnen ondersteunen," merkt The Register op, benadrukkend dat de op maat gemaakte aard van Kyber rekken betekent dat faciliteiten speciaal gebouwde infrastructuur nodig hebben.²⁹ Greenfield ontwikkelingen in regio's met surplus hernieuwbare of nucleaire energie—Scandinavië, Quebec en de VAE—zullen waarschijnlijk leiden in adoptie.³⁰

De tijdlijn geeft de industrie ademruimte maar vereist onmiddellijke actie. Organisaties die AI-infrastructuur plannen voor 2027 en daarna moeten nu beslissingen nemen over faciliteitslocaties, stroomprocurement en koelarchitectuur. De drie jaar voorbereidingstijd reflecteert de complexiteit van het implementeren van infrastructuur die opereert aan de rand van wat fysiek mogelijk is.

De weg voorbij Vera Rubin

NVIDIA's roadmap strekt zich uit voorbij Vera Rubin naar de Feynman architectuur in 2028, waarschijnlijk stuwend richting 1-megawatt rekken.³¹ Vertiv CEO Giordano Albertazzi suggereert dat het bereiken van MW-schaal dichtheid "een verdere revolutie in vloeistofkoeling en een paradigmaverandering aan de stroomzijde" zal vereisen.³² De trajectorie lijkt onvermijdelijk—AI workloads eisen exponentiële toenames in compute-dichtheid, en de economie bevoordeelt concentratie boven distributie.

De verschuiving van incrementele verbeteringen naar revolutionaire veranderingen in GPU-infrastructuur weerspiegelt de bredere AI-transformatie. Net zoals grote taalmodellen sprongen van miljarden naar triljoenen parameters, moet de infrastructuur die hen ondersteunt vergelijkbare sprongen maken. Vera Rubin vertegenwoordigt niet alleen snellere GPU's maar een fundamentele heroverweging van hoe compute-infrastructuur werkt.

Conclusie

NVIDIA's Vera Rubin platform dwingt de datacenter-industrie om oncomfortabele waarheden over infrastructuur-beperkingen onder ogen te zien terwijl het ongekende computationele capaciteiten biedt. De 600kW rekken van 2027 vertegenwoordigen meer dan alleen hoger stroomverbruik—ze markeren een complete transformatie in hoe AI-infrastructuur wordt gebouwd, gekoeld en geopereerd. Organisaties die nu beginnen met plannen, door partnerschappen aan te gaan met ervaren infrastructuurspecialisten die de complexiteiten van volgende generatie implementaties begrijpen, zullen het best gepositioneerd zijn om de revolutionaire capaciteiten te benutten die Vera Rubin mogelijk maakt.

De aankomst van het platform in 2026-2027 geeft de industrie tijd om zich voor te bereiden, maar de klok tikt. Datacenters die vandaag worden ontworpen moeten de eisen van morgen anticiperen, en Vera Rubin maakt duidelijk dat morgen radicale afwijkingen van conventioneel denken vereist. De bedrijven die deze transformatie omarmen zullen de volgende generatie AI-doorbraken aandrijven, van miljoen-token taalmodellen tot real-time video generatie systemen die vandaag als science fiction lijken.

Referenties

¹ The Register. "Nvidia's Vera Rubin CPU, GPUs chart course for 600kW racks." March 19, 2025. https://www.theregister.com/2025/03/19/nvidia_charts_course_for_600kw.

² NVIDIA Newsroom. "NVIDIA Unveils Rubin CPX: A New Class of GPU Designed for Massive-Context Inference." 2025. https://nvidianews.nvidia.com/news/nvidia-unveils-rubin-cpx-a-new-class-of-gpu-designed-for-massive-context-inference.

³ Ibid.

⁴ Data Center Dynamics. "GTC: Nvidia's Jensen Huang, Ian Buck, and Charlie Boyle on the future of data center rack density." March 21, 2025. https://www.datacenterdynamics.com/en/analysis/nvidia-gtc-jensen-huang-data-center-rack-density/.

⁵ TechPowerUp. "NVIDIA Unveils Vera CPU and Rubin Ultra AI GPU, Announces Feynman Architecture." 2025. https://www.techpowerup.com/334334/nvidia-unveils-vera-cpu-and-rubin-ultra-ai-gpu-announces-feynman-architecture.

⁶ CNBC. "Nvidia announces Blackwell Ultra and Vera Rubin AI chips." March 18, 2025. https://www.cnbc.com/2025/03/18/nvidia-announces-blackwell-ultra-and-vera-rubin-ai-chips-.html.

⁷ Yahoo Finance. "Nvidia debuts next-generation Vera Rubin superchip at GTC 2025." March 18, 2025. https://finance.yahoo.com/news/nvidia-debuts-next-generation-vera-rubin-superchip-at-gtc-2025-184305222.html.

⁸ Next Platform. "Nvidia Draws GPU System Roadmap Out To 2028." June 5, 2025. https://www.nextplatform.com/2025/03/19/nvidia-draws-gpu-system-roadmap-out-to-2028/.

⁹ SemiAnalysis. "NVIDIA GTC 2025 – Built For Reasoning, Vera Rubin, Kyber, CPO, Dynamo Inference, Jensen Math, Feynman." August 4, 2025. https://semianalysis.com/2025/03/19/nvidia-gtc-2025-built-for-reasoning-vera-rubin-kyber-cpo-dynamo-inference-jensen-math-feynman/.

¹⁰ NVIDIA Newsroom. "NVIDIA Unveils Rubin CPX: A New Class of GPU Designed for Massive-Context Inference."

¹¹ Ibid.

¹² Tom's Hardware. "Nvidia announces Rubin GPUs in 2026, Rubin Ultra in 2027, Feynman also added to roadmap." March 18, 2025. https://www.tomshardware.com/pc-components/gpus/nvidia-announces-rubin-gpus-in-2026-rubin-ultra-in-2027-feynam-after.

¹³ The New Stack. "NVIDIA Unveils Next-Gen Rubin and Feynman Architectures, Pushing AI Power Limits." April 14, 2025. https://thenewstack.io/nvidia-unveils-next-gen-rubin-and-feynman-architectures-pushing-ai-power-limits/.

¹⁴ NVIDIA Newsroom. "NVIDIA Unveils Rubin CPX: A New Class of GPU Designed for Massive-Context Inference."

¹⁵ Data Center Dynamics. "Nvidia's Rubin Ultra NVL576 rack expected to be 600kW, coming second half of 2027." March 18, 2025. https://www.datacenterdynamics.com/en/news/nvidias-rubin-ultra-nvl576-rack-expected-to-be-600kw-coming-second-half-of-2027/.

¹⁶ Tom's Hardware. "Nvidia shows off Rubin Ultra with 600,000-Watt Kyber racks and infrastructure, coming in 2027." March 19, 2025. https://www.tomshardware.com/pc-components/gpus/nvidia-shows-off-rubin-ultra-with-600-000-watt-kyber-racks-and-infrastructure-coming-in-2027.

¹⁷ Data Center Dynamics. "GTC: Nvidia's Jensen Huang, Ian Buck, and Charlie Boyle on the future of data center rack density."

¹⁸ Data Center Frontier. "CoolIT and Accelsius Push Data Center Liquid Cooling Limits Amid Soaring Rack Densities." 2025. https://www.datacenterfrontier.com/cooling/article/55281394/coolit-and-accelsius-push-data-center-liquid-cooling-limits-amid-soaring-rack-densities.

¹⁹ Data Center Dynamics. "GTC: Nvidia's Jensen Huang, Ian Buck, and Charlie Boyle on the future of data center rack density."

²⁰ NVIDIA Technical Blog. "NVIDIA 800 VDC Architecture Will Power the Next Generation of AI Factories." May 20, 2025. https://developer.nvidia.com/blog/nvidia-800-v-hvdc-architecture-will-power-the-next-generation-of-ai-factories/.

²¹ Ibid.

²² Ibid.

²⁴ NVIDIA Newsroom. "NVIDIA Unveils Rubin CPX: A New Class of GPU Designed for Massive-Context Inference."

²⁵ Ibid.

²⁶ NVIDIA Blog. "Blue Lion Supercomputer Will Run on NVIDIA Vera Rubin." June 10, 2025. https://blogs.nvidia.com/blog/blue-lion-vera-rubin/.

²⁷ Ibid.

²⁸ NVIDIA Newsroom. "NVIDIA Unveils Rubin CPX: A New Class of GPU Designed for Massive-Context Inference."

²⁹ The Register. "Nvidia's Vera Rubin CPU, GPUs chart course for 600kW racks."

³⁰ Global Data Center Hub. "Nvidia's 600kW Racks Are Here (Is Your Infrastructure Ready?)." March 23, 2025. https://www.globaldatacenterhub.com/p/issue-8-nvidias-600kw-racks-are-hereis.

³¹ TechPowerUp. "NVIDIA Unveils Vera CPU and Rubin Ultra AI GPU, Announces Feynman Architecture."

³² Data Center Dynamics. "GTC: Nvidia's Jensen Huang, Ian Buck, and Charlie Boyle on the future of data center rack density."

Offerte aanvragen_

Vertel ons over uw project en wij reageren binnen 72 uur.

> TRANSMISSIE_VOLTOOID

Aanvraag Ontvangen_

Bedankt voor uw aanvraag. Ons team zal uw verzoek beoordelen en binnen 72 uur reageren.

IN WACHTRIJ VOOR VERWERKING