OpenAI与NVIDIA缔结1000亿美元基础设施联盟，共建AI计算未来

截至12月初，这一里程碑式的合作仍处于意向书阶段。NVIDIA首席财务官Colette Kress在瑞银全球科技大会上确认："我们仍未达成最终协议……"

Blake Crosley

Mar 01, 2026 1 min read Disclaimer

OpenAI与NVIDIA缔结1000亿美元基础设施联盟，共建AI计算未来

更新于2025年12月11日

Jensen Huang与Sam Altman的握手不仅仅是企业外交的象征。两家公司宣布了一份意向书，计划建设10吉瓦的AI基础设施——这一计算能力相当于九年前Huang亲自送到OpenAI办公室的那台DGX系统的十亿倍。¹ NVIDIA计划在OpenAI部署这些系统时投资高达1000亿美元，Huang称之为"历史上最大的AI基础设施项目"。²

2025年12月更新： 截至12月初，这一里程碑式的合作仍处于意向书阶段。NVIDIA首席财务官Colette Kress在瑞银全球科技大会上确认："我们仍未达成最终协议。"¹³ OpenAI目前的GPU采购继续通过云合作伙伴Microsoft和Oracle进行，同时两家公司正在协商最终条款。Kress强调双方关系仍是"非常紧密的合作伙伴关系"，OpenAI视NVIDIA为其计算需求的"首选合作伙伴"——尽管9月份概述的直接合作安排尚未正式落地。¹⁴

这一合作伙伴关系来临于一个关键时刻。OpenAI服务于每周7亿活跃用户，其总体计算需求超过大多数国家超级计算中心。³ 与此同时，NVIDIA的下一代Vera Rubin平台承诺提供8艾克萨弗洛普斯的AI性能和单机架100TB的高速内存——这些规格听起来像科幻小说，但将从2026年底开始驱动生产工作负载。⁴ OpenAI的模型创新与NVIDIA的硬件突破相结合，创造了一个重塑我们对AI经济学认知的基础设施布局。

十年合作伙伴关系迎来拐点

NVIDIA与OpenAI之间的合作堪称一个硅谷起源故事。2016年，Huang亲手将NVIDIA的首台DGX超级计算机送到OpenAI位于旧金山的总部，这一时刻被定格在如今标志性的照片中。OpenAI总裁Greg Brockman回顾那一刻时说："这一合作代表着比最初那台服务器多十亿倍的计算能力。"⁵

两家公司携手跨越了多个技术飞跃。NVIDIA的硬件支撑了OpenAI GPT系列的演进，从早期语言模型到ChatGPT的爆发性亮相。每一代都需要指数级增长的计算资源，推动NVIDIA加速其芯片开发周期，而OpenAI则不断优化模型架构以最大化硬件效率。

新协议正式确认了行业观察者长期以来的猜测——这两家公司彼此需要。OpenAI需要大规模的计算资源来训练超级智能系统，而NVIDIA则从OpenAI展示其硬件能力的模型创新中获益。两家公司将"共同优化OpenAI模型和基础设施的技术路线图"，这表明双方的技术合作将超越简单的买卖关系。⁶

Vera Rubin平台重新定义计算边界

NVIDIA的Vera Rubin NVL144 CPX平台代表了AI基础设施设计的代际飞跃。该系统在单机架配置中集成了144个Rubin CPX GPU、144个Rubin GPU和36个Vera CPU，提供比NVIDIA GB300 NVL72系统高7.5倍的AI性能。⁷ 这些数字即使对经验丰富的基础设施工程师来说也令人震惊——每秒1.7PB的内存带宽使模型能够处理百万级token上下文而不会出现性能下降。

Rubin CPX架构引入了专门为语言模型注意力机制和视频处理工作负载优化的专用电路。每个Rubin CPX在单个芯片上配备128GB GDDR7内存，而该平台在FP4精度下实现50 petaflops性能——比Blackwell的20 petaflops提升了2.5倍。⁸ NVIDIA专门为推理工作负载设计了这些系统，随着模型从研究走向生产，推理将主导AI经济。

Vera代表NVIDIA基于其Olympus核心架构的首款定制CPU设计。这款88核Arm架构处理器承诺提供当前Blackwell系统中Grace CPU两倍的性能。⁹ 通过NVIDIA MGX系统实现的Vera CPU与Rubin GPU之间的紧密集成，消除了困扰分布式计算架构的传统瓶颈。

基础设施经济学改变AI商业模式

拟议合作背后的金融工程揭示了AI基础设施经济学的演变。NVIDIA计划承诺随着每吉瓦部署逐步投资高达1000亿美元，这将创造一种新颖的融资模式，使硬件提供商的激励与客户成功保持一致。¹⁰ 如果最终敲定，这一安排将允许OpenAI在无需大量前期资本支出的情况下扩展基础设施，同时NVIDIA参与其硬件所创造的价值。

在规模化运营下，Vera Rubin平台承诺30到50倍的投资回报，可能将1亿美元的资本支出转化为50亿美元的收入。¹¹ 这些经济效益从根本上改变了公司评估AI基础设施决策的方式。当系统达到足够的规模和利用率时，每单位智能的成本——两家公司都强调的指标——大幅下降。

该合作的结构表明，两家公司都从加密货币挖矿的繁荣-萧条周期中吸取了教训。NVIDIA没有将硬件销售给投机性需求，而是将其投资与实际部署和利用率挂钩。OpenAI获得了与用户增长和模型开发时间表相一致的可预测产能扩展。

区域影响重塑数据中心地理格局

10吉瓦的部署需要前所未有的数据中心容量，这将重塑全球基础设施版图。作为参考，10吉瓦大约相当于1000万户家庭或一个主要大都市区的用电量。在这种规模下找到具有可用电力、冷却能力和网络连接的地点，其工程挑战不亚于计算本身。

基础设施建设为区域数据中心市场创造了机会，特别是在拥有强大电网和冷却优势的亚太地区。拥有可再生能源盈余和有利监管环境的国家正在定位自己以获取这一部署的份额。该合作的时间表——首批系统于2026年底投入运营——给数据中心运营商和政府留下了准备基础设施的有限窗口期。

在这种规模下，专业部署经验变得至关重要。理论规格与运营性能之间的差异往往取决于冷却效率、配电和互连优化。像Introl这样在不同地理区域部署大规模GPU集群方面拥有经验的公司，深谙决定这些系统能否发挥承诺性能的细微差别。

竞争加剧但合作模式占据主导

OpenAI-NVIDIA联盟标志着行业向模型开发商与硬件提供商之间深度合作的更广泛转变。Anthropic与Amazon Web Services的合作以及Google内部开发TPU代表了同一主题的不同变体——AI进步需要软件和硬件创新之间前所未有的协调。

Microsoft的地位为这一格局增添了复杂性。作为OpenAI最大的投资者和云合作伙伴，Microsoft必须在其Azure基础设施投资与OpenAI与NVIDIA的直接关系之间取得平衡。两家公司将其努力定位为互补，但随着计算需求的爆发式增长，资源分配决策将考验这一叙事。

在研究替代方案时，合作模式的优势变得清晰。构建定制硅片需要数年的开发和数十亿美元的投资，且结果不确定。仅依赖云提供商会引入利润叠加，使大规模训练在经济上具有挑战性。OpenAI与NVIDIA之间的直接合作消除了中间商成本，同时加速了创新周期。

时间表显示激进但可实现的部署计划

首批1吉瓦的系统将于2026年下半年上线，与NVIDIA Rubin CPX的上市时间一致。¹² 这一激进的时间表需要跨多个工作流程的并行执行——芯片制造、数据中心建设、电力基础设施部署和软件优化。每个环节都可能成为潜在瓶颈，延迟更广泛的10吉瓦愿景。

NVIDIA的制造合作伙伴，主要是台积电，必须为Rubin生产分配大量产能。Rubin CPX所需的先进封装技术增加了超越传统GPU制造的复杂性。供应链多元化对于避免可能破坏部署时间表的单点故障变得至关重要。

2026-2030年的部署窗口与多项技术转型相吻合。电力基础设施现代化，特别是可再生能源整合，正在加速以满足数据中心需求。光学互连技术日趋成熟，以处理增加的带宽需求。冷却创新，从直接液冷到浸没式系统，正在从实验变为标准。

工程挑战要求全栈创新

部署10吉瓦的AI基础设施暴露出将当前技术推向极限的工程挑战。这种规模的电力供应需要与公用事业公司协调，可能还需要专用发电能力。单个Vera Rubin机架消耗数兆瓦的电力，产生的热量传统空气冷却无法有效散发。

网络架构必须进化以支持跨数千个GPU的模型并行。Vera Rubin机架内每秒1.7PB的内存带宽意味着外部网络成为分布式训练的主要瓶颈。NVIDIA在光学互连技术和交换芯片方面的投资解决了这些限制，但需要仔细的系统设计。

软件优化同样至关重要。OpenAI的模型必须高效利用Rubin CPX中用于注意力机制的专用电路。两家公司承诺共同优化其技术路线图，表明在编译器技术、内核优化和模型架构演进方面的深度合作。在这种规模下，软件优化带来的性能提升往往超过硬件改进。

市场影响延伸至直接参与者之外

该合作的涟漪效应延伸至整个科技生态系统。冷却技术提供商看到了对液冷解决方案前所未有的需求。电力基础设施公司加速电网现代化项目。光学元器件制造商扩大生产以满足互连需求。

随着两家公司扩大工程团队，人才争夺战愈发激烈。了解GPU集群优化的基础设施工程师获得了高额薪酬。拥有分布式训练经验的软件工程师变得极其宝贵。该合作在多个学科和地理区域创造了数千个高薪工作岗位。

较小的AI公司面临着严峻的选择——要么与加价销售NVIDIA硬件的云提供商合作，要么接受限制模型雄心的计算约束。AI基础设施的经济性越来越有利于规模化，在整个行业造成自然的整合压力。

未来路线图暗示持续创新节奏

虽然当前协议聚焦于Vera Rubin的部署，但两家公司都表示将在2030年之后保持持续合作。NVIDIA的年度

[内容因翻译需要而截断]

OpenAI与NVIDIA缔结1000亿美元基础设施联盟，共建AI计算未来

十年合作伙伴关系迎来拐点

Vera Rubin平台重新定义计算边界

基础设施经济学改变AI商业模式

区域影响重塑数据中心地理格局

竞争加剧但合作模式占据主导

时间表显示激进但可实现的部署计划

工程挑战要求全栈创新

市场影响延伸至直接参与者之外

未来路线图暗示持续创新节奏

You Might Also Like

AI工作负载调度：跨时区优化GPU利用率

AI基础设施安全运营：GPU集群的SOC要求

6000亿美元AI基础设施建设：超大规模云服务商资本支出、债务和供应链现实

申请报价_

请求已收到_