NVIDIA Vera Rubinが600キロワットラックと100万トークンメモリでGPUの常識を破る

NVIDIA Vera Rubinは2027年までにデータセンターを600kWラックへと押し上げ、7.5倍の性能向上を実現する一方で、インフラの完全な変革を要求している。

NVIDIA Vera Rubinが600キロワットラックと100万トークンメモリでGPUの常識を破る

NVIDIA CEOのJensen HuangがGTC 2025で爆弾発言を行い、インフラチームが電卓を取り出す事態となった:Vera Rubinプラットフォームは2027年までにデータセンターラックを600キロワットまで押し上げる。¹この発表は、データセンターの運用方法における根本的な変化を意味し、何十年間も本質的に変わらなかった電力供給、冷却システム、物理インフラの完全な再考を強いることになる。

Vera RubinプラットフォームはNVIDIAの最も野心的な飛躍を表している。このマルチコンポーネントシステムは、カスタムのVera CPU、次世代のRubin GPU、そして100万トークンのAIワークロード専用に設計された特殊なRubin CPX(Context Processing eXtension)アクセラレータを組み合わせている。²GPU世代の典型的な段階的改良とは異なり、Vera Rubin NVL144 CPXバリアントは、現在のBlackwell GB300システムの7.5倍のAI性能を提供しながら、GPUのパッケージング、冷却、展開方法を根本的に変える。³

[caption id="" align="alignnone" width="2522"] NVIDIA Vera Rubin NVL144 platform specifications showing 3.6 exaflops of FP4 inference performance and 3.3x improvement over GB300 NVL72, arriving second half 2026. NVIDIA Vera Rubin NVL144プラットフォーム仕様。FP4推論性能3.6エクサフロップス、GB300 NVL72比3.3倍の性能向上を示し、2026年下半期に登場。[/caption]

アーキテクチャ革命はカスタムシリコンから始まる。

[caption id="" align="alignnone" width="2520"] NVIDIA's complete roadmap from Blackwell through Feynman, showing the evolution from Oberon to Kyber rack architectures supporting up to 600kW power consumption. BlackwellからFeynmanまでのNVIDIAの完全ロードマップ。OberonからKyberラックアーキテクチャへの進化を示し、最大600kWの消費電力をサポート。[/caption]

Vera CPUは、NVIDIAの既製のARM設計からの脱却を示し、同時マルチスレッディング機能を持つ88個のカスタムARMコアを特徴とし、176個の論理プロセッサを実現している。⁵NVIDIAはこのカスタムコアを「Olympus」と呼び、現在のBlackwellシステムで使用されているGrace CPUの2倍の性能を提供する。⁶各Vera CPUは1.8TB/sのNVLink C2Cインターフェースを通じてRubin GPUに接続し、コンピューティング要素間で前例のない帯域幅を実現している。⁷

標準のRubin GPUは、パッケージあたり288GBのHBM4メモリで境界を押し広げ、Blackwell Ultra B300と同じ容量を維持しながら、メモリ帯域幅を8TB/sから13TB/sに増加させている。⁸各Rubinパッケージには2つのレチクル制限GPU dieが含まれているが、NVIDIAは数え方を変更した—Blackwellが1つのGPU(2つのdie)と呼んでいたものを、Rubinは2つのGPUと呼んでいる。⁹この変更は、マルチdieアーキテクチャの複雑性の増大を反映し、顧客が各システムの実際のコンピューティングリソースをより良く理解できるように支援している。

最も革新的な要素はRubin CPXの形で登場し、大規模コンテキスト処理用に専用設計されたアクセラレータである。モノリシック設計は、128GBのコスト効率的なGDDR7メモリとともに30ペタFLOPSのNVFP4コンピューティングを提供し、トランスフォーマーモデルのアテンション機構に特に最適化されている。¹⁰CPXは、GB300 NVL72システムと比較して3倍高速なアテンション機能を実現し、AIモデルが100万トークンのコンテキスト—1時間のビデオやコードベース全体に相当—を性能低下なしで処理することを可能にしている。¹¹

展開には完全なインフラオーバーホールが必要である。

2026年下半期に登場予定の標準Vera Rubin NVL144システムは、既存のGB200/GB300インフラとの互換性を維持し、馴染みのあるOberonラックアーキテクチャを利用している。¹²このシステムは144個のGPU die(72パッケージ)、36個のVera CPUをパックし、3.6エクサFLOPSのFP4推論性能を提供—Blackwell Ultraより3.3倍の改善である。¹³消費電力は、現在の展開と同様に1ラックあたり約120-130kWと管理可能な範囲に留まる。

Vera Rubin NVL144 CPXバリアントは性能をさらに向上させ、144個のRubin CPX GPUを144個の標準Rubin GPUおよび36個のVera CPUと統合して、8エクサFLOPSのNVFP4コンピューティング—GB300 NVL72比7.5倍の向上—を1つのラックで100TBの高速メモリと1.7PB/sのメモリ帯域幅とともに実現している。¹⁴

すべては2027年のRubin UltraとKyberラックアーキテクチャで変わる。NVL576システムは576個のGPU dieを1つのラックに詰め込み、600kWの電力を消費—現在のシステムの5倍である。¹⁵Kyber設計はコンピューティングブレードを90度回転させて垂直方向に配置し、18ブレードの4つのポッドをラックに収めている。¹⁶各ブレードには8つのRubin Ultra GPUとVera CPUが搭載され、わずか数年前には不可能と思われた密度を実現している。

[caption id="" align="alignnone" width="2522"] Current NVIDIA Blackwell System with 72 GPUs delivering 1.1 exaflops 現在のNVIDIA Blackwellシステム。72個のGPUで1.1エクサフロップスを実現[/caption]

[caption id="" align="alignnone" width="2524"] Future NVIDIA Rubin System scaling to 576 GPUs and 15 exaflops in a single 600kW rack 将来のNVIDIA Rubinシステム。576個のGPUと15エクサフロップスを単一の600kWラックでスケール[/caption]

これらのシステムの冷却には、ファンゼロの完全液浸が必要—補助コンポーネントに一部エアクーリングを使用する現在のシステムからの脱却である。¹⁷CoolIT SystemsとAccelsiusは、40°Cの入水温度で250kWラックを処理できる冷却ソリューションを既に実証し、600kW展開への技術パスを検証している。¹⁸Kyberラックには電力と冷却インフラ用の専用サイドカーが含まれ、各600kWシステムに実質的に2つのラックフットプリントが必要になる。¹⁹

電力アーキテクチャの進化がメガワットスケールコンピューティングを可能にする。

NVIDIAの800 VDC電力分散への移行は、現在のインフラの基本的な物理限界に対処している。従来の54Vラック内分散では、Kyberスケールシステムに64Uの電力シェルフが必要になり、実際のコンピューティングのスペースが残らない。²⁰800VアーキテクチャはラックレベルのAC/DC変換を排除し、エンドツーエンド効率を最大5%改善し、保守コストを最大70%削減する。²¹

新しい電力インフラは、同じバックボーンを使用して100kWから1MW超まで対応し、将来世代に必要なスケーラビリティを提供している。²²Vera Rubinを展開する企業は、大規模な電気アップグレードを計画する必要がある—単一のNVL576ラックは一般的な家庭400軒分の電力を消費する。2027年展開を計画するデータセンターは、ユーティリティスケールの電力接続や場合によっては現地発電を含むインフラアップグレードを今から開始すべきである。

性能向上はインフラ投資を正当化する。

Vera Rubin NVL144 CPXバリアントは、8エクサFLOPSのNVFP4コンピューティング、100TBの高速メモリ、1.7PB/sのメモリ帯域幅を単一ラックでプラットフォームの可能性を実証している。²⁴NVIDIAは、組織が30倍から50倍の投資収益率を達成でき、1億ドルの設備投資から50億ドルの収益につながると主張している。²⁵

早期採用者には、Vera Rubinを使用してBlue Lionスーパーコンピューターを展開し、現在のシステムの30倍のコンピューティング能力を実現するドイツのライプニッツスーパーコンピューティングセンターが含まれる。²⁶ローレンス・バークレー国立研究所のDoudnaシステムもVera Rubinで動作し、シミュレーション、データ、AIを科学計算の単一プラットフォームに統合する。²⁷

Rubin CPXのコンテキスト処理への特化は、現在のAIシステムの重要なボトルネックに対処している。Cursor、Runway、Magicのような企業は既に、CPXが数百万トークンを同時処理する必要があるコーディングアシスタントやビデオ生成アプリケーションをどのように加速できるかを探求している。²⁸コードベース全体や数時間のビデオをアクティブメモリに維持する能力は、AIアプリケーションが達成できることを根本的に変える。

インフラの課題が市場機会を生み出す。

600kWラックへの飛躍は、現在のデータセンター能力に関する厳しい現実を露呈している。ほとんどの施設は40kWラックに苦労している;最先端のAIデータセンターでさえ120kWを超えることはまれである。この移行には新しい冷却システムだけでなく、大量の重量負荷をサポートできるコンクリート床から産業運用規模の電気サブステーションまで、施設の完全な再設計が必要である。

「既存のデータセンター施設がどれほどこのような高密度構成をサポートできるかという疑問が残る」とThe Registerが指摘し、Kyberラックのカスタムビルドな性質により、施設には専用インフラが必要であることを強調している。²⁹再生可能エネルギーや原子力の余剰がある地域—スカンジナビア、ケベック、UAE—でのグリーンフィールド開発が採用をリードする可能性が高い。³⁰

タイムラインは業界に息つく間を与えるが、即座の行動を要求する。2027年以降のAIインフラを計画する組織は、施設の場所、電力調達、冷却アーキテクチャについて今決定を下さなければならない。3年の準備期間は、物理的に可能な限界で動作するインフラ展開の複雑さを反映している。

Vera Rubinを超える道のり

NVIDIAのロードマップはVera Rubinを超えて2028年のFeynmanアーキテクチャまで延び、1メガワットラックに向けて押し進む可能性が高い。³¹Vertix CEOのGiordano Albertazziは、MWスケール密度の達成には「液体冷却のさらなる革命と電力側でのパラダイムチェンジ」が必要になるとしている。³²軌道は不可避に見える—AIワークロードはコンピューティング密度の指数的増加を要求し、経済学は分散より集中を支持している。

GPUインフラの段階的改良から革命的変化への転換は、より広いAI変革を反映している。大規模言語モデルが数十億から数兆パラメータにジャンプしたように、それらをサポートするインフラも同様な飛躍をしなければならない。Vera Rubinは単により高速なGPUではなく、コンピューティングインフラの動作方法の根本的再考を表している。

結論

NVIDIAのVera Rubinプラットフォームは、データセンター業界にインフラ制限に関する不快な真実と向き合うことを強いる一方で、前例のない計算能力を提供している。2027年の600kWラックは単により高い消費電力以上を表す—AIインフラの構築、冷却、運用方法における完全な変革を示している。今から計画を開始し、次世代展開の複雑さを理解する経験豊富なインフラ専門家とパートナーシップを組む組織が、Vera Rubinが実現する革命的能力を活用する最良のポジションに立つことになる。

2026-2027年のプラットフォーム到来は業界に準備時間を与えるが、時間は刻々と過ぎている。今日設計されるデータセンターは明日の要件を予測しなければならず、Vera Rubinは明日が従来の思考からの根本的脱却を要求することを明確にしている。この変革を受け入れる企業が、今日はサイエンスフィクションに見える100万トークン言語モデルからリアルタイムビデオ生成システムまで、次世代のAIブレークスルーを推進することになる。

参考文献

¹ The Register. "Nvidia's Vera Rubin CPU, GPUs chart course for 600kW racks." March 19, 2025. https://www.theregister.com/2025/03/19/nvidia_charts_course_for_600kw.

² NVIDIA Newsroom. "NVIDIA Unveils Rubin CPX: A New Class of GPU Designed for Massive-Context Inference." 2025. https://nvidianews.nvidia.com/news/nvidia-unveils-rubin-cpx-a-new-class-of-gpu-designed-for-massive-context-inference.

³ Ibid.

⁴ Data Center Dynamics. "GTC: Nvidia's Jensen Huang, Ian Buck, and Charlie Boyle on the future of data center rack density." March 21, 2025. https://www.datacenterdynamics.com/en/analysis/nvidia-gtc-jensen-huang-data-center-rack-density/.

⁵ TechPowerUp. "NVIDIA Unveils Vera CPU and Rubin Ultra AI GPU, Announces Feynman Architecture." 2025. https://www.techpowerup.com/334334/nvidia-unveils-vera-cpu-and-rubin-ultra-ai-gpu-announces-feynman-architecture.

⁶ CNBC. "Nvidia announces Blackwell Ultra and Vera Rubin AI chips." March 18, 2025. https://www.cnbc.com/2025/03/18/nvidia-announces-blackwell-ultra-and-vera-rubin-ai-chips-.html.

⁷ Yahoo Finance. "Nvidia debuts next-generation Vera Rubin superchip at GTC 2025." March 18, 2025. https://finance.yahoo.com/news/nvidia-debuts-next-generation-vera-rubin-superchip-at-gtc-2025-184305222.html.

⁸ Next Platform. "Nvidia Draws GPU System Roadmap Out To 2028." June 5, 2025. https://www.nextplatform.com/2025/03/19/nvidia-draws-gpu-system-roadmap-out-to-2028/.

⁹ SemiAnalysis. "NVIDIA GTC 2025 – Built For Reasoning, Vera Rubin, Kyber, CPO, Dynamo Inference, Jensen Math, Feynman." August 4, 2025. https://semianalysis.com/2025/03/19/nvidia-gtc-2025-built-for-reasoning-vera-rubin-kyber-cpo-dynamo-inference-jensen-math-feynman/.

¹⁰ NVIDIA Newsroom. "NVIDIA Unveils Rubin CPX: A New Class of GPU Designed for Massive-Context Inference."

¹¹ Ibid.

¹² Tom's Hardware. "Nvidia announces Rubin GPUs in 2026, Rubin Ultra in 2027, Feynman also added to roadmap." March 18, 2025. https://www.tomshardware.com/pc-components/gpus/nvidia-announces-rubin-gpus-in-2026-rubin-ultra-in-2027-feynam-after.

¹³ The New Stack. "NVIDIA Unveils Next-Gen Rubin and Feynman Architectures, Pushing AI Power Limits." April 14, 2025. https://thenewstack.io/nvidia-unveils-next-gen-rubin-and-feynman-architectures-pushing-ai-power-limits/.

¹⁴ NVIDIA Newsroom. "NVIDIA Unveils Rubin CPX: A New Class of GPU Designed for Massive-Context Inference."

¹⁵ Data Center Dynamics. "Nvidia's Rubin Ultra NVL576 rack expected to be 600kW, coming second half of 2027." March 18, 2025. https://www.datacenterdynamics.com/en/news/nvidias-rubin-ultra-nvl576-rack-expected-to-be-600kw-coming-second-half-of-2027/.

¹⁶ Tom's Hardware. "Nvidia shows off Rubin Ultra with 600,000-Watt Kyber racks and infrastructure, coming in 2027." March 19, 2025. https://www.tomshardware.com/pc-components/gpus/nvidia-shows-off-rubin-ultra-with-600-000-watt-kyber-racks-and-infrastructure-coming-in-2027.

¹⁷ Data Center Dynamics. "GTC: Nvidia's Jensen Huang, Ian Buck, and Charlie Boyle on the future of data center rack density."

¹⁸ Data Center Frontier. "CoolIT and Accelsius Push Data Center Liquid Cooling Limits Amid Soaring Rack Densities." 2025. https://www.datacenterfrontier.com/cooling/article/55281394/coolit-and-accelsius-push-data-center-liquid-cooling-limits-amid-soaring-rack-densities.

¹⁹ Data Center Dynamics. "GTC: Nvidia's Jensen Huang, Ian Buck, and Charlie Boyle on the future of data center rack density."

²⁰ NVIDIA Technical Blog. "NVIDIA 800 VDC Architecture Will Power the Next Generation of AI Factories." May 20, 2025. https://developer.nvidia.com/blog/nvidia-800-v-hvdc-architecture-will-power-the-next-generation-of-ai-factories/.

²¹ Ibid.

²² Ibid.

²⁴ NVIDIA Newsroom. "NVIDIA Unveils Rubin CPX: A New Class of GPU Designed for Massive-Context Inference."

²⁵ Ibid.

²⁶ NVIDIA Blog. "Blue Lion Supercomputer Will Run on NVIDIA Vera Rubin." June 10, 2025. https://blogs.nvidia.com/blog/blue-lion-vera-rubin/.

²⁷ Ibid.

²⁸ NVIDIA Newsroom. "NVIDIA Unveils Rubin CPX: A New Class of GPU Designed for Massive-Context Inference."

²⁹ The Register. "Nvidia's Vera Rubin CPU, GPUs chart course for 600kW racks."

³⁰ Global Data Center Hub. "Nvidia's 600kW Racks Are Here (Is Your Infrastructure Ready?)." March 23, 2025. https://www.globaldatacenterhub.com/p/issue-8-nvidias-600kw-racks-are-hereis.

³¹ TechPowerUp. "NVIDIA Unveils Vera CPU and Rubin Ultra AI GPU, Announces Feynman Architecture."

³² Data Center Dynamics. "GTC: Nvidia's Jensen Huang, Ian Buck, and Charlie Boyle on the future of data center rack density."

お見積り依頼_

プロジェクトについてお聞かせください。72時間以内にご回答いたします。

> TRANSMISSION_COMPLETE

リクエストを受信しました_

お問い合わせありがとうございます。弊社チームがリクエストを確認し、72時間以内に回答いたします。

QUEUED FOR PROCESSING