GPU云价格崩盘:H100租赁费用下跌64%,供需趋于平衡
2025年12月10日 作者:Blake Crosley
GPU租赁市场经历了戏剧性调整,H100价格从每小时8美元下降至2.85-3.50美元——相比2024年末的峰值下跌64%。[^1] Silicon Data H100租赁指数在2025年6月为2.36美元,低于2024年9月的3.06美元,不到一年时间下跌23%。[^2] 对于规划AI基础设施的组织而言,价格崩盘创造了战略机会,同时也引发了关于市场动态和未来定价走势的疑问。
AWS在2025年6月将H100价格下调约44%,使P5实例与市场预期保持一致。[^3] GCP的H100现货价格现在为2.25美元(A3-High),而AWS现货通常在2.50美元附近。[^4] 长期承诺可以将有效H100成本降至每GPU小时1.90-2.10美元。[^5] 一些激进的供应商提供低至每小时0.99-1美元的H100租赁服务。[^6]
价格下跌驱动因素
多重因素共同推动了市场调整。
供应扩张
定义了2023年和2024年初的H100供应紧张状况已大幅缓解。超大规模云服务商和区域数据中心已将大量新产能上线。[^7] 原本的卖方市场随着生产跟上短缺期间下达的订单而开始正常化。
NVIDIA的制造合作伙伴在2024年和2025年期间扩大了生产能力。在短缺条件下进行的产能投资现在将GPU投放到供需更加平衡的市场。从稀缺到充足的转变从根本上改变了定价动态。
竞争激烈程度
2025年超过300家新供应商进入H100云市场,导致激烈的价格竞争。[^8] RunPod和Vast.ai等较小的专业供应商提供低至每小时1.80-1.87美元的费率。[^9] 竞争迫使大型供应商匹配价格或失去客户。
GPU云服务的低准入门槛使市场快速进入成为可能。拥有数据中心访问权限和资本的组织可以购买或租赁GPU并提供云服务。与传统云服务相比,碎片化的市场结构加剧了价格竞争。
需求演变
AI初创公司已将重点从训练大型基础模型转向微调现有开源模型,降低了对最大GPU集群的需求强度。[^10] 推理工作负载虽然快速增长,但具有不同于训练的特征——更分布化、每实例要求更低、对价格更敏感。
Llama、Mistral和DeepSeek等有能力的开源模型的可用性减少了从头开始进行昂贵训练的需求。组织可以通过微调而不是基础模型训练来实现竞争性AI能力。这种转变改变了GPU需求的构成。
市场影响
价格崩盘对不同市场参与者产生了不同影响。
基础设施投资者
在峰值价格购买GPU的组织面临具有挑战性的经济状况。分析显示,一旦H100租赁价格低于每小时1.65美元,收入就无法收回投资。[^11] 价格需要超过每小时2.85美元才能超过股市替代品提供的内部收益率。[^12]
盈利能力阈值对价格形成底部压力。无法在当前价格下维持运营的供应商将退出,最终稳定供应。由于具有不同成本结构的运营商竞争,清洗过程可能需要数个季度才能完成。
云客户
租用GPU容量的组织直接受益于价格下跌。以前在每小时8美元时不经济的项目在每小时2.50美元时变得可行。可及性使更广泛的AI实验和部署成为可能。
然而,价格波动使规划变得复杂。承诺长期GPU容量的组织面临当前价格是否代表公允价值或临时供过于求的不确定性。较短期承诺提供灵活性,但如果供应紧张可能错过有利定价。
超大规模云服务商定位
IBM CEO Arvind Krishna公开质疑超大规模云服务商的AI基础设施投资是否能产生回报,称在当前支出水平下"数学不可能"成立。[^13] GPU价格崩盘为怀疑论者提供了支持证据,同时使GPU消费者受益。
Amazon CEO Andy Jassy反驳说,容量"我们投入多快就消耗多快",表明尽管价格下跌但需求持续。[^14] 成交量增长可能抵消价格下跌,但整个行业的利润率面临压力。
下一代展望
H100价格轨迹为新一代GPU的预期提供信息。
Blackwell推出
NVIDIA Blackwell GPU已开始发货,GB200系统已交付给客户。下一代架构相比H100提供显著的性能改进。初期Blackwell可用性仍然有限,稀缺性反映在溢价定价中。
随着Blackwell可用性增加,H100价格可能进一步下跌。对H100性能满意的组织可以从持续的价格下跌中受益。需要Blackwell能力的组织将支付溢价,直到供应正常化。
中期预测
中期预测显示,当B200 GPU在2026年更广泛推出时,可能下降10-20%。[^15] 引入周期可能重复H100模式:初期稀缺性伴随溢价定价,随后供应扩张和价格正常化。
组织在规划基础设施投资时应考虑GPU代际时机。等待新一代产品提供性能优势但延迟部署。当代硬件在价格下降时支持立即部署。
当前定价比较
| 供应商 | H100按需价格 | H100现货价格 | 承诺价格 |
|---|---|---|---|
| AWS P5 | $3.50/小时 | ~$2.50/小时 | $1.90-2.10/小时(1年) |
| GCP A3-High | $3.25/小时 | $2.25/小时 | ~$2.00/小时(1年) |
| Azure ND H100 | $3.40/小时 | ~$2.60/小时 | ~$2.15/小时(1年) |
| RunPod | $2.39/小时 | $1.87/小时 | 不适用 |
| Vast.ai | 可变 | $1.80-2.50/小时 | 不适用 |
| Lambda | $2.49/小时 | 不适用 | $1.99/小时(预留) |
价格截至2025年12月。现货价格根据可用性波动。
决策框架:租赁vs拥有vs等待
| 场景 | 建议 | 理由 |
|---|---|---|
| 可变工作负载(<50%利用率) | 租赁(现货) | 灵活性超过拥有权节省 |
| 稳定工作负载(>70%利用率) | 评估拥有权 | 在当前价格下可实现盈亏平衡 |
| >每月10万美元GPU支出 | 拥有基础设施 | 在持续利用率下明确ROI |
| 不确定的12个月展望 | 短期租赁 | 如果需求转移,避免搁浅资产 |
| 训练大型模型 | 拥有或预留 | 一致容量至关重要 |
盈亏平衡分析: - H100购买价格:每GPU约25,000-30,000美元 - 按每小时2.50美元租赁:10,000-12,000小时盈亏平衡(100%利用率约14-16个月) - 按每小时1.65美元租赁:供应商无法收回投资[^11] - 盈利能力阈值:每小时2.85美元以超过股市IRR[^12]
可行步骤: 1. 审计当前支出:计算所有GPU使用的有效小时成本 2. 评估利用率:测量实际vs预留容量使用 3. 评估承诺选项:比较1年预留定价vs按需定价 4. 考虑混合方案:基线拥有,突发容量租赁
专业指导
在波动市场中的基础设施决策受益于经验丰富的视角。
Introl的550名现场工程师支持组织驾驭GPU基础设施经济学。[^16] 该公司在2025年Inc. 5000榜单中排名第14位,三年增长率达9,594%。[^17]
[257个全球据点](https://introl.c