xAI Colossus达到2吉瓦:55.5万GPU,180亿美元,全球最大AI设施

马斯克的xAI在孟菲斯购买第三栋建筑,总容量达2吉瓦。55.5万块NVIDIA GPU耗资约180亿美元,使Colossus成为全球最大的单站点AI训练设施。

xAI Colossus达到2吉瓦:55.5万GPU,180亿美元,全球最大AI设施

xAI Colossus达到2吉瓦:55.5万GPU,180亿美元,全球最大AI设施

2026年1月1日

2026年1月更新: 埃隆·马斯克宣布xAI在孟菲斯购买了第三栋建筑,将Colossus扩展至总容量2吉瓦。该设施将容纳约55.5万块NVIDIA GPU,购买金额约180亿美元——使其成为全球最大的单站点AI训练设施。


摘要

xAI Colossus扩展至2吉瓦代表着前所未有的AI算力集中。55.5万块GPU的部署(180亿美元)超越了全球任何其他单站点AI设施。凭借现场燃气发电和19天的建设周期,xAI展示了一种将通常需要4年的工程压缩至数周的建设模式。基础设施规划者必须正视这一规模和速度的新基准。


事件经过

2025年12月30日,埃隆·马斯克透露xAI在田纳西州孟菲斯的Colossus 2数据中心附近购买了第三栋建筑。1 此次扩展使站点总容量接近2吉瓦。

Colossus布局:

设施 状态 GPU数量 功率
Colossus 1 运营中 23万(含3.2万GB200s) ~500 MW
Colossus 2 运营中 55万GB200s/GB300s ~1 GW
3号楼("MACROHARDRR") 已购买 计划扩展 ~500 MW
总计 55.5万+ ~2 GW

新建筑位于密西西比州绍萨文附近的Colossus 2旁边,靠近xAI正在建设的燃气电厂。2

马斯克将第三栋建筑命名为"MACROHARDRR"——延续他的"Macrohard"命名惯例,是对微软的调侃。3


重要意义

史无前例的规模

2吉瓦的Colossus综合体使所有其他AI训练设施相形见绌:4

设施 功率 GPU数量 运营商
xAI Colossus(孟菲斯) 2 GW 55.5万+ xAI
Meta AI研究中心 ~500 MW ~15万 Meta
微软Azure AI ~400 MW ~10万+ 微软
谷歌TPU集群 ~300 MW TPU v5等效 谷歌

xAI的设施是第二大专用AI训练站点功率的4倍。

180亿美元GPU投资

以约180亿美元购买55.5万块GPU意味着:5

  • 平均成本:每块GPU约32,400美元
  • 组合包括NVIDIA最新产品:GB200s和GB300s
  • 2025年7月:"首批55万GB200s和GB300s"在Colossus 2上线

作为参考,180亿美元超过了大多数科技公司的年度资本支出,约占NVIDIA总GPU出货量的3%,集中在单一客户身上。

建设速度

NVIDIA首席执行官黄仁勋称最初的Colossus建设"超人"——19天内投入运营,而传统时间表需要4年。6

里程碑 传统方式 xAI Colossus
选址到动工 6-12个月 数周
建设 2-3年 19天
电力供应 1-2年 现场发电
GPU安装 3-6个月 与建设同步

这种速度来自垂直整合:xAI在现场建设自己的发电设施,而不是等待电网接入。


技术细节

电力基础设施

孟菲斯站点通过现场发电绕过了传统公用事业限制:7

  • 燃气电厂正在数据中心旁边建设
  • 总负载2吉瓦——相当于为约150万户家庭供电
  • 避免ERCOT式互联排队
  • 自给自足的发电和消费

GPU配置

根据马斯克的披露:8

代次 数量 备注
GB200 ~52万 2025年7月首批投入运营
GB300 ~3万 最新Blackwell变体
H100/H200(旧型) ~3万 Colossus 1原始安装

GB200-NVL72配置(每机架72块GPU)表明完全部署后约有7,700+计算机架。

冷却需求

2吉瓦GPU算力产生约1.8吉瓦的热量需要散发:9

  • 在此密度下液体冷却是强制性的
  • 估计冷却能力每分钟5万+加仑
  • 孟菲斯位置可通过密西西比河流域获得水源

竞争影响

AI训练军备竞赛

马斯克在宣布前几天表示:xAI的目标是拥有"比其他所有公司加起来还多的AI算力"。10

2吉瓦设施支持这一目标:

公司 估计AI训练算力 状态
xAI 2 GW(55.5万GPU) 最大单一站点
OpenAI/微软 ~1.5 GW(分布式) Azure基础设施
谷歌 ~1 GW(TPU + GPU) 全球分布
Meta ~800 MW 多个设施
Anthropic ~500 MW AWS + FluidStack

Grok模型训练

Colossus的存在主要是为了训练xAI的Grok模型。扩展的容量使以下成为可能:11

  • 更大的模型参数量
  • 更快的训练迭代周期
  • 多模型并行训练运行

xAI的目标:总共100万块GPU。Colossus的55.5万块代表了该目标在单一站点的55%。


下一步

2026年时间表

  • 2026年第一季度: 开始将3号楼改造为数据中心
  • 2026年第二至第三季度: 额外GPU部署
  • 2026年: 燃气电厂完工

扩展路径

马斯克已表示计划总共部署100万+块GPU。可能的路径:12

  1. 孟菲斯站点扩展超过2吉瓦(需要额外电力)
  2. 第二个主要站点(地点待定)
  3. 收购现有数据中心容量

行业影响

Colossus模式——现场发电、压缩时间表、大规模单站点规模——可能成为前沿AI训练设施的模板。传统数据中心开发周期似乎无法满足AI训练需求。


如需大规模GPU部署和数据中心基础设施,请联系Introl


参考文献


  1. Bloomberg. "Musk's xAI to Expand 'Colossus' Data Center, Information Reports." 2025年12月30日. https://www.bloomberg.com/news/articles/2025-12-30/musk-s-xai-to-expand-colossus-data-center-information-reports 

  2. SiliconANGLE. "Elon Musk reveals plan to expand xAI's 'Colossus' data center to 2 gigawatts." 2025年12月30日. https://siliconangle.com/2025/12/30/elon-musk-reveals-plan-expand-xais-colossus-data-center-2-gigawatts/ 

  3. Benzinga. "Elon Musk Says xAI Purchased Third Building For Massive AI Expansion." 2025年12月. https://www.benzinga.com/markets/tech/25/12/49642773/elon-musk-says-xai-purchased-third-building-for-massive-ai-expansion-as-company-takes-on-openai-anthropic-property-name-takes-dig-at-microsoft 

  4. Tom's Hardware. "Musk to expand xAI's training capacity to a monstrous 2 gigawatts." 2025年12月. https://www.tomshardware.com/tech-industry/artificial-intelligence/musk-purchases-third-building-at-memphis-site-to-expand-xais-training-capacity-to-a-monstrous-2-gigawatts-announcement-comes-days-after-musk-vows-to-have-more-ai-compute-than-everyone-else 

  5. Techzine Global. "xAI expands Colossus megadata center to 2 gigawatts." 2025年12月. https://www.techzine.eu/news/infrastructure/137578/xai-expands-colossus-megadata-center-to-2-gigawatts/ 

  6. SemiAnalysis. "xAI's Colossus 2 - First Gigawatt Datacenter In The World." 2025. https://newsletter.semianalysis.com/p/xais-colossus-2-first-gigawatt-datacenter 

  7. The Edge Malaysia. "Musk's xAI buys building to expand 'colossus' data centre." 2025年12月. https://theedgemalaysia.com/node/787706 

  8. WebProNews. "Elon Musk's xAI Doubles Colossus Supercomputer to 2GW in Memphis." 2025年12月. https://www.webpronews.com/elon-musks-xai-doubles-colossus-supercomputer-to-2gw-in-memphis/ 

  9. Yahoo Finance. "Musk's xAI buys third building to expand AI compute power." 2025年12月. https://finance.yahoo.com/news/musks-xai-buys-third-building-221629820.html 

  10. Stocktwits. "Elon Musk Is Ramping AI Compute At Breakneck Speed." 2025年12月. https://stocktwits.com/news-articles/markets/equity/elon-musk-is-ramping-ai-compute-at-breakneck-speed/cL7BTsJREzG 

  11. Bloomberg. "xAI Colossus Data Center." 2025年12月. 

  12. Tom's Hardware. "xAI training capacity expansion." 2025年12月. 

申请报价_

告诉我们您的项目需求,我们将在72小时内回复。

> 传输完成

请求已收到_

感谢您的咨询。我们的团队将审核您的请求并在72小时内回复。

排队处理中