xAI Colossus达到2吉瓦:55.5万GPU,180亿美元,全球最大AI设施
2026年1月1日
2026年1月更新: 埃隆·马斯克宣布xAI在孟菲斯购买了第三栋建筑,将Colossus扩展至总容量2吉瓦。该设施将容纳约55.5万块NVIDIA GPU,购买金额约180亿美元——使其成为全球最大的单站点AI训练设施。
摘要
xAI Colossus扩展至2吉瓦代表着前所未有的AI算力集中。55.5万块GPU的部署(180亿美元)超越了全球任何其他单站点AI设施。凭借现场燃气发电和19天的建设周期,xAI展示了一种将通常需要4年的工程压缩至数周的建设模式。基础设施规划者必须正视这一规模和速度的新基准。
事件经过
2025年12月30日,埃隆·马斯克透露xAI在田纳西州孟菲斯的Colossus 2数据中心附近购买了第三栋建筑。1 此次扩展使站点总容量接近2吉瓦。
Colossus布局:
| 设施 | 状态 | GPU数量 | 功率 |
|---|---|---|---|
| Colossus 1 | 运营中 | 23万(含3.2万GB200s) | ~500 MW |
| Colossus 2 | 运营中 | 55万GB200s/GB300s | ~1 GW |
| 3号楼("MACROHARDRR") | 已购买 | 计划扩展 | ~500 MW |
| 总计 | 55.5万+ | ~2 GW |
新建筑位于密西西比州绍萨文附近的Colossus 2旁边,靠近xAI正在建设的燃气电厂。2
马斯克将第三栋建筑命名为"MACROHARDRR"——延续他的"Macrohard"命名惯例,是对微软的调侃。3
重要意义
史无前例的规模
2吉瓦的Colossus综合体使所有其他AI训练设施相形见绌:4
| 设施 | 功率 | GPU数量 | 运营商 |
|---|---|---|---|
| xAI Colossus(孟菲斯) | 2 GW | 55.5万+ | xAI |
| Meta AI研究中心 | ~500 MW | ~15万 | Meta |
| 微软Azure AI | ~400 MW | ~10万+ | 微软 |
| 谷歌TPU集群 | ~300 MW | TPU v5等效 | 谷歌 |
xAI的设施是第二大专用AI训练站点功率的4倍。
180亿美元GPU投资
以约180亿美元购买55.5万块GPU意味着:5
- 平均成本:每块GPU约32,400美元
- 组合包括NVIDIA最新产品:GB200s和GB300s
- 2025年7月:"首批55万GB200s和GB300s"在Colossus 2上线
作为参考,180亿美元超过了大多数科技公司的年度资本支出,约占NVIDIA总GPU出货量的3%,集中在单一客户身上。
建设速度
NVIDIA首席执行官黄仁勋称最初的Colossus建设"超人"——19天内投入运营,而传统时间表需要4年。6
| 里程碑 | 传统方式 | xAI Colossus |
|---|---|---|
| 选址到动工 | 6-12个月 | 数周 |
| 建设 | 2-3年 | 19天 |
| 电力供应 | 1-2年 | 现场发电 |
| GPU安装 | 3-6个月 | 与建设同步 |
这种速度来自垂直整合:xAI在现场建设自己的发电设施,而不是等待电网接入。
技术细节
电力基础设施
孟菲斯站点通过现场发电绕过了传统公用事业限制:7
- 燃气电厂正在数据中心旁边建设
- 总负载2吉瓦——相当于为约150万户家庭供电
- 避免ERCOT式互联排队
- 自给自足的发电和消费
GPU配置
根据马斯克的披露:8
| 代次 | 数量 | 备注 |
|---|---|---|
| GB200 | ~52万 | 2025年7月首批投入运营 |
| GB300 | ~3万 | 最新Blackwell变体 |
| H100/H200(旧型) | ~3万 | Colossus 1原始安装 |
GB200-NVL72配置(每机架72块GPU)表明完全部署后约有7,700+计算机架。
冷却需求
2吉瓦GPU算力产生约1.8吉瓦的热量需要散发:9
- 在此密度下液体冷却是强制性的
- 估计冷却能力每分钟5万+加仑
- 孟菲斯位置可通过密西西比河流域获得水源
竞争影响
AI训练军备竞赛
马斯克在宣布前几天表示:xAI的目标是拥有"比其他所有公司加起来还多的AI算力"。10
2吉瓦设施支持这一目标:
| 公司 | 估计AI训练算力 | 状态 |
|---|---|---|
| xAI | 2 GW(55.5万GPU) | 最大单一站点 |
| OpenAI/微软 | ~1.5 GW(分布式) | Azure基础设施 |
| 谷歌 | ~1 GW(TPU + GPU) | 全球分布 |
| Meta | ~800 MW | 多个设施 |
| Anthropic | ~500 MW | AWS + FluidStack |
Grok模型训练
Colossus的存在主要是为了训练xAI的Grok模型。扩展的容量使以下成为可能:11
- 更大的模型参数量
- 更快的训练迭代周期
- 多模型并行训练运行
xAI的目标:总共100万块GPU。Colossus的55.5万块代表了该目标在单一站点的55%。
下一步
2026年时间表
- 2026年第一季度: 开始将3号楼改造为数据中心
- 2026年第二至第三季度: 额外GPU部署
- 2026年: 燃气电厂完工
扩展路径
马斯克已表示计划总共部署100万+块GPU。可能的路径:12
- 孟菲斯站点扩展超过2吉瓦(需要额外电力)
- 第二个主要站点(地点待定)
- 收购现有数据中心容量
行业影响
Colossus模式——现场发电、压缩时间表、大规模单站点规模——可能成为前沿AI训练设施的模板。传统数据中心开发周期似乎无法满足AI训练需求。
如需大规模GPU部署和数据中心基础设施,请联系Introl。
参考文献
-
Bloomberg. "Musk's xAI to Expand 'Colossus' Data Center, Information Reports." 2025年12月30日. https://www.bloomberg.com/news/articles/2025-12-30/musk-s-xai-to-expand-colossus-data-center-information-reports ↩
-
SiliconANGLE. "Elon Musk reveals plan to expand xAI's 'Colossus' data center to 2 gigawatts." 2025年12月30日. https://siliconangle.com/2025/12/30/elon-musk-reveals-plan-expand-xais-colossus-data-center-2-gigawatts/ ↩
-
Benzinga. "Elon Musk Says xAI Purchased Third Building For Massive AI Expansion." 2025年12月. https://www.benzinga.com/markets/tech/25/12/49642773/elon-musk-says-xai-purchased-third-building-for-massive-ai-expansion-as-company-takes-on-openai-anthropic-property-name-takes-dig-at-microsoft ↩
-
Tom's Hardware. "Musk to expand xAI's training capacity to a monstrous 2 gigawatts." 2025年12月. https://www.tomshardware.com/tech-industry/artificial-intelligence/musk-purchases-third-building-at-memphis-site-to-expand-xais-training-capacity-to-a-monstrous-2-gigawatts-announcement-comes-days-after-musk-vows-to-have-more-ai-compute-than-everyone-else ↩
-
Techzine Global. "xAI expands Colossus megadata center to 2 gigawatts." 2025年12月. https://www.techzine.eu/news/infrastructure/137578/xai-expands-colossus-megadata-center-to-2-gigawatts/ ↩
-
SemiAnalysis. "xAI's Colossus 2 - First Gigawatt Datacenter In The World." 2025. https://newsletter.semianalysis.com/p/xais-colossus-2-first-gigawatt-datacenter ↩
-
The Edge Malaysia. "Musk's xAI buys building to expand 'colossus' data centre." 2025年12月. https://theedgemalaysia.com/node/787706 ↩
-
WebProNews. "Elon Musk's xAI Doubles Colossus Supercomputer to 2GW in Memphis." 2025年12月. https://www.webpronews.com/elon-musks-xai-doubles-colossus-supercomputer-to-2gw-in-memphis/ ↩
-
Yahoo Finance. "Musk's xAI buys third building to expand AI compute power." 2025年12月. https://finance.yahoo.com/news/musks-xai-buys-third-building-221629820.html ↩
-
Stocktwits. "Elon Musk Is Ramping AI Compute At Breakneck Speed." 2025年12月. https://stocktwits.com/news-articles/markets/equity/elon-musk-is-ramping-ai-compute-at-breakneck-speed/cL7BTsJREzG ↩
-
Bloomberg. "xAI Colossus Data Center." 2025年12月. ↩
-
Tom's Hardware. "xAI training capacity expansion." 2025年12月. ↩