NVIDIA Vera Rubin mematahkan cetakan GPU dengan rak 600 kilowatt dan memori jutaan token

NVIDIA Vera Rubin mendorong data center menuju rack 600kW pada tahun 2027, menghadirkan peningkatan performa 7,5x sambil menuntut transformasi infrastruktur yang menyeluruh.

Blake Crosley

Sep 25, 2025 9 min read Disclaimer

NVIDIA Vera Rubin mematahkan cetakan GPU dengan rak 600 kilowatt dan memori jutaan token

CEO NVIDIA Jensen Huang menjatuhkan bom di GTC 2025, membuat tim infrastruktur bergegas mengambil kalkulator: platform Vera Rubin akan mendorong rack data center hingga 600 kilowatt pada 2027.¹ Pengumuman ini menandai pergeseran fundamental dalam cara operasi data center, memaksa pemikiran ulang menyeluruh terhadap pengiriman daya, sistem pendinginan, dan infrastruktur fisik yang pada dasarnya tidak berubah selama beberapa dekade.

Platform Vera Rubin mewakili lompatan paling ambisius NVIDIA hingga kini. Sistem multi-komponen ini menggabungkan CPU Vera kustom, GPU Rubin generasi selanjutnya, dan akselerator Rubin CPX (Context Processing eXtension) yang khusus dirancang untuk beban kerja AI dengan jutaan token.² Berbeda dari peningkatan bertahap yang khas pada generasi GPU, varian Vera Rubin NVL144 CPX menghadirkan performa AI 7,5x lebih tinggi dari sistem Blackwell GB300 saat ini sambil mengubah fundamental cara GPU dikemas, didinginkan, dan di-deploy.³

[caption id="" align="alignnone" width="2522"] NVIDIA Vera Rubin NVL144 platform specifications showing 3.6 exaflops of FP4 inference performance and 3.3x improvement over GB300 NVL72, arriving second half 2026. Spesifikasi platform NVIDIA Vera Rubin NVL144 menunjukkan performa inference FP4 3,6 exaflops dan peningkatan 3,3x dari GB300 NVL72, tiba paruh kedua 2026. [/caption]

Revolusi arsitektur dimulai dengan silicon kustom.

[caption id="" align="alignnone" width="2520"] NVIDIA's complete roadmap from Blackwell through Feynman, showing the evolution from Oberon to Kyber rack architectures supporting up to 600kW power consumption. Roadmap lengkap NVIDIA dari Blackwell hingga Feynman, menunjukkan evolusi dari arsitektur rack Oberon ke Kyber yang mendukung konsumsi daya hingga 600kW. [/caption]

CPU Vera menandai keberangkatan NVIDIA dari desain ARM off-the-shelf, menampilkan 88 core ARM kustom dengan simultaneous multithreading, yang memungkinkan 176 prosesor logis.⁵ NVIDIA menyebut core kustom tersebut "Olympus," dan desainnya menghadirkan performa dua kali lipat dari CPU Grace yang digunakan dalam sistem Blackwell saat ini.⁶ Setiap CPU Vera terhubung ke GPU Rubin melalui interface NVLink C2C 1,8 TB/s, memungkinkan bandwidth yang belum pernah ada sebelumnya antar elemen compute.⁷

GPU Rubin standar mendorong batasan dengan memori HBM4 288GB per package, mempertahankan kapasitas yang sama dengan Blackwell Ultra B300 namun meningkatkan bandwidth memori dari 8 TB/s menjadi 13 TB/s.⁸ Setiap package Rubin berisi dua die GPU yang dibatasi reticle, meskipun NVIDIA telah mengubah metodologi penghitungannya—apa yang Blackwell sebut satu GPU (dua die), Rubin sebut dua GPU.⁹ Perubahan ini mencerminkan kompleksitas yang meningkat dari arsitektur multi-die dan membantu pelanggan memahami sumber daya compute aktual di setiap sistem dengan lebih baik.

Elemen paling inovatif hadir dalam bentuk Rubin CPX, akselerator yang dirancang khusus untuk pemrosesan konteks masif. Desain monolitik ini menghadirkan compute NVFP4 30 petaFLOPs dengan memori GDDR7 128GB yang cost-efficient, khusus dioptimalkan untuk mekanisme attention dalam model transformer.¹⁰ CPX mencapai kemampuan attention 3x lebih cepat dibanding sistem GB300 NVL72, memungkinkan model AI memproses konteks jutaan token—setara dengan satu jam video atau seluruh codebase—tanpa degradasi performa.¹¹

Deployment menuntut perombakan infrastruktur menyeluruh.

Sistem Vera Rubin NVL144 standar, dijadwalkan tiba di paruh kedua 2026, mempertahankan kompatibilitas dengan infrastruktur GB200/GB300 yang ada, memanfaatkan arsitektur rack Oberon yang familiar.¹² Sistem ini mengemas 144 die GPU (72 package), 36 CPU Vera, dan menghadirkan performa inference FP4 3,6 exaFLOPS—peningkatan 3,3x dari Blackwell Ultra.¹³ Konsumsi daya tetap terkelola di sekitar 120-130kW per rack, serupa dengan deployment saat ini.

Varian Vera Rubin NVL144 CPX membawa performa lebih jauh, mengintegrasikan 144 GPU Rubin CPX bersama 144 GPU Rubin standar dan 36 CPU Vera untuk menghadirkan compute NVFP4 delapan exaFLOPs—peningkatan 7,5x dari GB300 NVL72—dengan memori high-speed 100TB dan bandwidth memori 1,7 PB/s dalam satu rack.¹⁴

Semuanya berubah dengan Rubin Ultra dan arsitektur rack Kyber pada 2027. Sistem NVL576 memadatkan 576 die GPU dalam satu rack, mengonsumsi daya 600kW—lima kali sistem saat ini.¹⁵ Desain Kyber memutar blade compute 90 derajat ke orientasi vertikal, mengemas empat pod dari 18 blade masing-masing ke dalam rack.¹⁶ Setiap blade menampung delapan GPU Rubin Ultra bersama CPU Vera, mencapai densitas yang tampak mustahil beberapa tahun lalu.

[caption id="" align="alignnone" width="2522"] Current NVIDIA Blackwell System with 72 GPUs delivering 1.1 exaflops Sistem NVIDIA Blackwell saat ini dengan 72 GPU menghadirkan 1,1 exaflops [/caption]

[caption id="" align="alignnone" width="2524"] Future NVIDIA Rubin System scaling to 576 GPUs and 15 exaflops in a single 600kW rack Sistem NVIDIA Rubin masa depan yang menskalakan hingga 576 GPU dan 15 exaflops dalam satu rack 600kW [/caption]

Mendinginkan sistem-sistem ini memerlukan pencelupan cairan lengkap dengan nol kipas—penyimpangan dari sistem saat ini yang masih menggunakan beberapa pendinginan udara untuk komponen tambahan.¹⁷ CoolIT Systems dan Accelsius telah mendemonstrasikan solusi pendinginan yang mampu menangani rack 250kW dengan suhu inlet air 40°C, memvalidasi jalur teknologi menuju deployment 600kW.¹⁸ Rack Kyber menyertakan sidecar khusus untuk infrastruktur daya dan pendinginan, secara efektif memerlukan dua footprint rack untuk setiap sistem 600kW.¹⁹

Evolusi arsitektur daya memungkinkan komputasi skala megawatt.

Transisi NVIDIA ke distribusi daya 800 VDC mengatasi keterbatasan fisika fundamental infrastruktur saat ini. Distribusi in-rack 54V tradisional akan memerlukan 64U shelf daya untuk sistem skala Kyber, tidak menyisakan ruang untuk compute aktual.²⁰ Arsitektur 800V menghilangkan konversi AC/DC tingkat rack, meningkatkan efisiensi end-to-end hingga 5%, dan mengurangi biaya perawatan hingga 70%.²¹

Infrastruktur daya baru mendukung rack mulai dari 100kW hingga lebih dari 1MW, menggunakan backbone yang sama, dan menyediakan skalabilitas yang diperlukan untuk generasi masa depan.²² Perusahaan yang men-deploy Vera Rubin harus merencanakan upgrade listrik masif—satu rack NVL576 mengonsumsi daya sebanyak 400 rumah biasa. Data center yang merencanakan deployment 2027 harus mulai upgrade infrastruktur sekarang, termasuk koneksi daya skala utilitas dan berpotensi pembangkit on-site.

Peningkatan performa membenarkan investasi infrastruktur.

Varian Vera Rubin NVL144 CPX menunjukkan potensi platform dengan compute NVFP4 delapan exaFLOPS, bersama memori high-speed 100TB dan bandwidth memori 1,7 PB/s, semua dalam satu rack.²⁴ NVIDIA mengklaim organisasi dapat mencapai return on investment 30x hingga 50x, berubah menjadi pendapatan $5 miliar dari investasi modal $100 juta.²⁵

Early adopter termasuk Leibniz Supercomputing Centre Jerman, yang men-deploy superkomputer Blue Lion dengan Vera Rubin untuk mencapai kekuatan komputasi 30 kali lebih besar dari sistem mereka saat ini.²⁶ Sistem Doudna dari Lawrence Berkeley National Lab juga akan berjalan pada Vera Rubin, menggabungkan simulasi, data, dan AI dalam satu platform untuk komputasi ilmiah.²⁷

Spesialisasi Rubin CPX untuk pemrosesan konteks mengatasi bottleneck kritis dalam sistem AI saat ini. Perusahaan seperti Cursor, Runway, dan Magic sudah mengeksplorasi bagaimana CPX dapat mempercepat asisten coding dan aplikasi generasi video yang memerlukan pemrosesan jutaan token secara bersamaan.²⁸ Kemampuan mempertahankan seluruh codebase atau jam video dalam memori aktif secara fundamental mengubah apa yang dapat dicapai aplikasi AI.

Tantangan infrastruktur menciptakan peluang pasar.

Lompatan ke rack 600kW mengekspos realitas keras tentang kemampuan data center saat ini. Sebagian besar fasilitas kesulitan dengan rack 40kW; bahkan data center AI terdepan jarang melebihi 120kW. Transisi ini memerlukan bukan hanya sistem pendinginan baru tetapi redesain fasilitas lengkap, dari lantai beton yang mampu menopang beban berat masif hingga gardu listrik berukuran untuk operasi industri.

"Pertanyaan tetap berapa banyak fasilitas datacenter yang ada akan mampu mendukung konfigurasi sepadat ini," catat The Register, menyoroti bahwa sifat custom-built dari rack Kyber berarti fasilitas memerlukan infrastruktur yang dibangun khusus.²⁹ Pengembangan greenfield di wilayah dengan surplus energi terbarukan atau nuklir—Scandinavia, Quebec, dan UAE—kemungkinan akan memimpin adopsi.³⁰

Timeline memberikan industri ruang bernapas tetapi menuntut tindakan segera. Organisasi yang merencanakan infrastruktur AI untuk 2027 dan seterusnya harus membuat keputusan sekarang tentang lokasi fasilitas, pengadaan daya, dan arsitektur pendinginan. Lead time tiga tahun mencerminkan kompleksitas men-deploy infrastruktur yang beroperasi di batas apa yang secara fisik mungkin.

Jalan di luar Vera Rubin

Roadmap NVIDIA meluas di luar Vera Rubin ke arsitektur Feynman pada 2028, kemungkinan mendorong menuju rack 1-megawatt.³¹ CEO Vertiv Giordano Albertazzi menyarankan mencapai densitas skala MW akan memerlukan "revolusi lebih lanjut dalam liquid cooling, dan perubahan paradigma di sisi daya."³² Lintasan tampak tak terhindarkan—beban kerja AI menuntut peningkatan eksponensial dalam densitas compute, dan ekonomi mendukung konsentrasi daripada distribusi.

Pergeseran dari peningkatan bertahap ke perubahan revolusioner dalam infrastruktur GPU mencerminkan transformasi AI yang lebih luas. Sama seperti large language model melompat dari miliaran ke triliunan parameter, infrastruktur yang mendukungnya harus membuat lompatan serupa. Vera Rubin mewakili bukan hanya GPU yang lebih cepat tetapi pemikiran ulang fundamental tentang cara kerja infrastruktur compute.

Kesimpulan

Platform Vera Rubin NVIDIA memaksa industri data center menghadapi kebenaran tidak nyaman tentang keterbatasan infrastruktur sambil menawarkan kemampuan komputasional yang belum pernah ada. Rack 600kW pada 2027 mewakili lebih dari sekadar konsumsi daya yang lebih tinggi—mereka menandai transformasi lengkap dalam cara infrastruktur AI dibangun, didinginkan, dan dioperasikan. Organisasi yang mulai merencanakan sekarang, bermitra dengan spesialis infrastruktur berpengalaman yang memahami kompleksitas deployment generasi selanjutnya, akan berada dalam posisi terbaik untuk memanfaatkan kemampuan revolusioner yang dimungkinkan Vera Rubin.

Kedatangan platform pada 2026-2027 memberikan industri waktu untuk mempersiapkan, tetapi waktu terus berjalan. Data center yang dirancang hari ini harus mengantisipasi persyaratan masa depan, dan Vera Rubin memperjelas bahwa masa depan menuntut penyimpangan radikal dari pemikiran konvensional. Perusahaan yang merangkul transformasi ini akan menggerakkan generasi selanjutnya terobosan AI, dari model bahasa jutaan token hingga sistem generasi video real-time yang tampak seperti fiksi ilmiah hari ini.

Referensi

¹ The Register. "Nvidia's Vera Rubin CPU, GPUs chart course for 600kW racks." March 19, 2025. https://www.theregister.com/2025/03/19/nvidia_charts_course_for_600kw.

² NVIDIA Newsroom. "NVIDIA Unveils Rubin CPX: A New Class of GPU Designed for Massive-Context Inference." 2025. https://nvidianews.nvidia.com/news/nvidia-unveils-rubin-cpx-a-new-class-of-gpu-designed-for-massive-context-inference.

³ Ibid.

⁴ Data Center Dynamics. "GTC: Nvidia's Jensen Huang, Ian Buck, and Charlie Boyle on the future of data center rack density." March 21, 2025. https://www.datacenterdynamics.com/en/analysis/nvidia-gtc-jensen-huang-data-center-rack-density/.

⁵ TechPowerUp. "NVIDIA Unveils Vera CPU and Rubin Ultra AI GPU, Announces Feynman Architecture." 2025. https://www.techpowerup.com/334334/nvidia-unveils-vera-cpu-and-rubin-ultra-ai-gpu-announces-feynman-architecture.

⁶ CNBC. "Nvidia announces Blackwell Ultra and Vera Rubin AI chips." March 18, 2025. https://www.cnbc.com/2025/03/18/nvidia-announces-blackwell-ultra-and-vera-rubin-ai-chips-.html.

⁷ Yahoo Finance. "Nvidia debuts next-generation Vera Rubin superchip at GTC 2025." March 18, 2025. https://finance.yahoo.com/news/nvidia-debuts-next-generation-vera-rubin-superchip-at-gtc-2025-184305222.html.

⁸ Next Platform. "Nvidia Draws GPU System Roadmap Out To 2028." June 5, 2025. https://www.nextplatform.com/2025/03/19/nvidia-draws-gpu-system-roadmap-out-to-2028/.

⁹ SemiAnalysis. "NVIDIA GTC 2025 – Built For Reasoning, Vera Rubin, Kyber, CPO, Dynamo Inference, Jensen Math, Feynman." August 4, 2025. https://semianalysis.com/2025/03/19/nvidia-gtc-2025-built-for-reasoning-vera-rubin-kyber-cpo-dynamo-inference-jensen-math-feynman/.

¹⁰ NVIDIA Newsroom. "NVIDIA Unveils Rubin CPX: A New Class of GPU Designed for Massive-Context Inference."

¹¹ Ibid.

¹² Tom's Hardware. "Nvidia announces Rubin GPUs in 2026, Rubin Ultra in 2027, Feynman also added to roadmap." March 18, 2025. https://www.tomshardware.com/pc-components/gpus/nvidia-announces-rubin-gpus-in-2026-rubin-ultra-in-2027-feynam-after.

¹³ The New Stack. "NVIDIA Unveils Next-Gen Rubin and Feynman Architectures, Pushing AI Power Limits." April 14, 2025. https://thenewstack.io/nvidia-unveils-next-gen-rubin-and-feynman-architectures-pushing-ai-power-limits/.

¹⁴ NVIDIA Newsroom. "NVIDIA Unveils Rubin CPX: A New Class of GPU Designed for Massive-Context Inference."

¹⁵ Data Center Dynamics. "Nvidia's Rubin Ultra NVL576 rack expected to be 600kW, coming second half of 2027." March 18, 2025. https://www.datacenterdynamics.com/en/news/nvidias-rubin-ultra-nvl576-rack-expected-to-be-600kw-coming-second-half-of-2027/.

¹⁶ Tom's Hardware. "Nvidia shows off Rubin Ultra with 600,000-Watt Kyber racks and infrastructure, coming in 2027." March 19, 2025. https://www.tomshardware.com/pc-components/gpus/nvidia-shows-off-rubin-ultra-with-600-000-watt-kyber-racks-and-infrastructure-coming-in-2027.

¹⁷ Data Center Dynamics. "GTC: Nvidia's Jensen Huang, Ian Buck, and Charlie Boyle on the future of data center rack density."

¹⁸ Data Center Frontier. "CoolIT and Accelsius Push Data Center Liquid Cooling Limits Amid Soaring Rack Densities." 2025. https://www.datacenterfrontier.com/cooling/article/55281394/coolit-and-accelsius-push-data-center-liquid-cooling-limits-amid-soaring-rack-densities.

¹⁹ Data Center Dynamics. "GTC: Nvidia's Jensen Huang, Ian Buck, and Charlie Boyle on the future of data center rack density."

²⁰ NVIDIA Technical Blog. "NVIDIA 800 VDC Architecture Will Power the Next Generation of AI Factories." May 20, 2025. https://developer.nvidia.com/blog/nvidia-800-v-hvdc-architecture-will-power-the-next-generation-of-ai-factories/.

²¹ Ibid.

²² Ibid.

²⁴ NVIDIA Newsroom. "NVIDIA Unveils Rubin CPX: A New Class of GPU Designed for Massive-Context Inference."

²⁵ Ibid.

²⁶ NVIDIA Blog. "Blue Lion Supercomputer Will Run on NVIDIA Vera Rubin." June 10, 2025. https://blogs.nvidia.com/blog/blue-lion-vera-rubin/.

²⁷ Ibid.

²⁸ NVIDIA Newsroom. "NVIDIA Unveils Rubin CPX: A New Class of GPU Designed for Massive-Context Inference."

²⁹ The Register. "Nvidia's Vera Rubin CPU, GPUs chart course for 600kW racks."

³⁰ Global Data Center Hub. "Nvidia's 600kW Racks Are Here (Is Your Infrastructure Ready?)." March 23, 2025. https://www.globaldatacenterhub.com/p/issue-8-nvidias-600kw-racks-are-hereis.

³¹ TechPowerUp. "NVIDIA Unveils Vera CPU and Rubin Ultra AI GPU, Announces Feynman Architecture."

³² Data Center Dynamics. "GTC: Nvidia's Jensen Huang, Ian Buck, and Charlie Boyle on the future of data center rack density."

Revolusi arsitektur dimulai dengan silicon kustom.

Deployment menuntut perombakan infrastruktur menyeluruh.

Evolusi arsitektur daya memungkinkan komputasi skala megawatt.

Peningkatan performa membenarkan investasi infrastruktur.

Tantangan infrastruktur menciptakan peluang pasar.

Jalan di luar Vera Rubin

Kesimpulan

Referensi

You Might Also Like

UPS dan Distribusi Daya untuk AI: Merancang Infrastruktur 2N...

Retrofitting Pusat Data Lama untuk AI: Panduan Integrasi Pen...

xAI Colossus Mencapai 2 GW: 555.000 GPU, $18 Miliar, Situs A...

Minta Penawaran_

Permintaan Diterima_