GPU云价格暴跌:H100租赁费用下降64%,供应追上需求
2025年12月10日 作者:Blake Crosley
GPU租赁市场经历了剧烈调整,H100价格从每小时8美元降至每小时2.85-3.50美元——较2024年底的峰值下跌了64%。1 Silicon Data的H100租赁指数在2025年6月为2.36美元,低于2024年9月的3.06美元,不到一年下跌了23%。2 对于规划AI基础设施的组织而言,价格暴跌创造了战略机遇,同时也引发了对市场动态和未来价格走势的疑问。
AWS在2025年6月将H100价格大幅下调约44%,使P5实例价格符合市场预期。3 GCP的H100竞价实例现为2.25美元(A3-High),而AWS竞价通常在2.50美元左右。4 长期承诺可将H100的有效成本降至每GPU小时1.90-2.10美元。5 一些激进的供应商提供的H100租赁价格低至每小时0.99-1美元。6
价格下跌的驱动因素
多重因素共同导致了市场调整。
供应扩张
2023年和2024年初的H100供应紧张状况已大幅缓解。超大规模云厂商和区域数据中心已投入大量新产能。7 曾经的卖方市场开始正常化,因为生产已追上短缺期间下达的订单。
NVIDIA的制造合作伙伴在2024年和2025年全年扩大了产能。短缺期间进行的产能投资现在正向供需更加平衡的市场交付GPU。从稀缺到充足的转变从根本上改变了定价动态。
竞争加剧
2025年有超过300家新供应商进入H100云市场,导致价格竞争激烈。8 RunPod和Vast.ai等规模较小的专业供应商提供的价格低至每小时1.80-1.87美元。9 这种竞争迫使大型供应商要么匹配价格,要么失去客户。
GPU云服务的低进入门槛使市场快速涌入新参与者。拥有数据中心访问权限和资本的组织可以购买或租赁GPU并提供云服务。与传统云服务相比,碎片化的市场结构加剧了价格竞争,而传统云服务的进入门槛更高。
需求演变
AI初创公司已将重点从训练大型基础模型转向微调现有开源模型,降低了对最大GPU集群的需求强度。10 推理工作负载虽然增长迅速,但与训练有不同的特点——更加分布式、单实例需求更低、对价格更敏感。
Llama、Mistral和DeepSeek等能力出色的开源模型的出现,减少了从头进行昂贵训练的需求。组织可以通过微调而非基础模型训练来获得有竞争力的AI能力。这种转变改变了GPU需求的构成。
市场影响
价格暴跌对不同的市场参与者产生了不同的影响。
基础设施投资者
在峰值价格购买GPU的组织面临着具有挑战性的经济状况。分析表明,一旦H100租赁价格降至每小时1.65美元以下,收入将无法收回投资。11 价格需要超过每小时2.85美元才能击败股市提供的内部收益率。12
盈利门槛对价格形成了底部支撑。无法在当前价格下维持运营的供应商将退出,最终稳定供应。由于成本结构不同的运营商相互竞争,这种洗牌可能需要数个季度才能完成。
云客户
租用GPU产能的组织直接受益于价格下跌。之前在每小时8美元时不经济的项目,在每小时2.50美元时变得可行。这种可及性使更广泛的AI实验和部署成为可能。
然而,价格波动使规划变得复杂。承诺长期GPU产能的组织面临不确定性:当前价格是代表公允价值还是暂时的供应过剩。较短期的承诺提供了灵活性,但如果供应收紧,可能会错过有利的定价。
超大规模云厂商定位
IBM首席执行官Arvind Krishna公开质疑超大规模云厂商的AI基础设施投资能否产生回报,称在当前支出水平下"不可能"实现盈利数学。13 GPU价格暴跌为怀疑论者提供了支持证据,同时也使GPU消费者受益。
亚马逊首席执行官Andy Jassy反驳称,产能"投入多快就消耗多快",表明尽管价格下降,需求仍然持续。14 数量增长可能弥补价格下降,但整个行业的利润率都面临压力。
下一代展望
H100的价格走势为新一代GPU提供了预期参考。
Blackwell推出
NVIDIA Blackwell GPU已开始发货,GB200系统已交付客户。下一代架构相比H100提供了显著的性能改进。Blackwell的初始供应量仍然有限,溢价定价反映了稀缺性。
随着Blackwell供应量增加,H100价格可能进一步下降。对H100性能满意的组织可以从持续的价格下跌中受益。需要Blackwell能力的组织将支付溢价,直到供应正常化。
中期预测
中期预测表明,当B200 GPU在2026年更广泛推出时,可能会有10-20%的下降。15 这个推出周期可能会重复H100的模式:初期稀缺伴随溢价定价,随后供应扩张和价格正常化。
组织在规划基础设施投资时应考虑GPU的代际时机。等待新一代提供性能优势,但会延迟部署。以下降价格购买当前一代硬件可以实现即时部署。
当前价格比较
| 供应商 | H100按需 | H100竞价 | 承诺价格 |
|---|---|---|---|
| AWS P5 | $3.50/小时 | ~$2.50/小时 | $1.90-2.10/小时 (1年) |
| GCP A3-High | $3.25/小时 | $2.25/小时 | ~$2.00/小时 (1年) |
| Azure ND H100 | $3.40/小时 | ~$2.60/小时 | ~$2.15/小时 (1年) |
| RunPod | $2.39/小时 | $1.87/小时 | 不适用 |
| Vast.ai | 浮动 | $1.80-2.50/小时 | 不适用 |
| Lambda | $2.49/小时 | 不适用 | $1.99/小时 (预留) |
价格截至2025年12月。竞价价格根据可用性波动。
决策框架:租赁 vs 自建 vs 等待
| 场景 | 建议 | 理由 |
|---|---|---|
| 可变工作负载(<50%利用率) | 租赁(竞价) | 灵活性优于自建节省的成本 |
| 稳定工作负载(>70%利用率) | 评估自建 | 在当前价格下可实现盈亏平衡 |
| GPU月支出>10万美元 | 自建基础设施 | 持续利用率下ROI明确 |
| 12个月前景不确定 | 短期租赁 | 避免需求变化时资产搁置 |
| 训练大型模型 | 自建或预留 | 稳定产能至关重要 |
盈亏平衡分析: - H100购买价格:每GPU约25,000-30,000美元 - 按每小时2.50美元租赁:10,000-12,000小时达到盈亏平衡(100%利用率下约14-16个月) - 按每小时1.65美元租赁:供应商无法收回投资11 - 盈利门槛:每小时2.85美元才能击败股市IRR12
可行动步骤: 1. 审计当前支出:计算所有GPU使用的有效小时成本 2. 评估利用率:测量实际使用与预留产能的对比 3. 评估承诺选项:比较1年预留定价与按需定价 4. 考虑混合方案:基线需求自建,突发需求租赁
专业指导
在波动市场中的基础设施决策受益于经验丰富的专业视角。
Introl拥有550名现场工程师网络,支持组织应对GPU基础设施经济问题。16 该公司以9,594%的三年增长率在2025年Inc. 5000榜单中排名第14位。17
覆盖全球257个地点的专业能力提供跨地域的市场洞察。18 专业指导帮助组织在价格演变过程中做出明智决策。
关键要点
对于采购团队: - H100价格从每小时8美元下降64%至每小时2.85-3.50美元 - 超过300家新供应商加剧竞争 - 竞价定价(GCP 2.25美元,AWS 2.50美元)为灵活工作负载提供最佳价值
对于基础设施规划者: - 自建盈亏平衡点:100%利用率下14-16个月 - 供应商盈利底线:约每小时1.65美元(价格不太可能大幅下跌) - 承诺定价(每小时1.90-2.10美元)比按需低40%以上
对于战略规划: - 市场在2023-2024年短缺后正在正常化——不是暂时的下跌 - Blackwell的推出可能在2026年进一步压低H100价格 - 随着技术快速演进,租赁灵活性很有价值
展望
GPU云价格暴跌代表了2023-2024年稀缺条件后的市场正常化。组织受益于大幅改善的GPU可及性,使更广泛的AI部署成为可能。随着供应增长持续满足需求,加上下一代产品的推出可能延续这一模式,价格环境可能会持续。
组织应利用当前定价满足即时需求,同时保持对市场演变的灵活性。最成功的策略将在部署紧迫性和市场时机考虑之间取得平衡,利用租赁灵活性避免在快速演变的市场中过早进行资本承诺。
参考文献
类别: 市场分析 紧急程度: 高——市场变化对采购有即时影响 字数: 约1,800
-
Thunder Compute. "AI GPU Rental Market Trends December 2025." December 2025. https://www.thundercompute.com/blog/ai-gpu-rental-market-trends ↩
-
Silicon Data. "H100 Rental Market Cools in September." September 2025. https://www.silicondata.com/blog/h100-rental-market-update-september-2025 ↩
-
Thunder Compute. "AI GPU Rental Market Trends December 2025." December 2025. ↩
-
IntuitionLabs. "H100 Rental Prices: A Cloud Cost Comparison." November 2025. https://intuitionlabs.ai/articles/h100-rental-prices-cloud-comparison ↩
-
IntuitionLabs. "H100 Rental Prices: A Cloud Cost Comparison." November 2025. ↩
-
Thunder Compute. "AI GPU Rental Market Trends December 2025." December 2025. ↩
-
Silicon Data. "H100 Rental Market Cools in September." September 2025. ↩
-
Thunder Compute. "AI GPU Rental Market Trends December 2025." December 2025. ↩
-
IntuitionLabs. "H100 Rental Prices: A Cloud Cost Comparison." November 2025. ↩
-
Thunder Compute. "AI GPU Rental Market Trends December 2025." December 2025. ↩
-
Cybernews. "AI boom paradox leads to GPU rental market crash." 2025. https://cybernews.com/tech/gpu-rental-prices-are-crashing/ ↩↩
-
Cybernews. "AI boom paradox leads to GPU rental market crash." 2025. ↩↩
-
Fortune. "IBM CEO warns there's 'no way' hyperscalers will turn a profit." December 2025. https://fortune.com/2025/12/03/ibm-ceo-no-way-hyperscalers-google-amazon-turn-profit-data-center-spending/ ↩
-
CIO Dive. "'We're not dabbling here': AWS backs infrastructure investments." December 2025. https://www.ciodive.com/news/aws-ai-cloud-infrastructure-capacity-microsoft-google/746998/ ↩
-
Thunder Compute. "AI GPU Rental Market Trends December 2025." December 2025. ↩
-
Introl. "Company Overview." Introl. 2025. https://introl.com ↩
-
Inc. "Inc. 5000 2025." Inc. Magazine. 2025. ↩
-
Introl. "Coverage Area." Introl. 2025. https://introl.com/coverage-area ↩