GPU云价格暴跌:H100租赁费用下降64%,供应追上需求

GPU租赁市场在2023-2024年供应短缺后恢复正常,为AI基础设施创造了战略机遇。

GPU云价格暴跌:H100租赁费用下降64%,供应追上需求

GPU云价格暴跌:H100租赁费用下降64%,供应追上需求

2025年12月10日 作者:Blake Crosley

GPU租赁市场经历了剧烈调整,H100价格从每小时8美元降至每小时2.85-3.50美元——较2024年底的峰值下跌了64%。1 Silicon Data的H100租赁指数在2025年6月为2.36美元,低于2024年9月的3.06美元,不到一年下跌了23%。2 对于规划AI基础设施的组织而言,价格暴跌创造了战略机遇,同时也引发了对市场动态和未来价格走势的疑问。

AWS在2025年6月将H100价格大幅下调约44%,使P5实例价格符合市场预期。3 GCP的H100竞价实例现为2.25美元(A3-High),而AWS竞价通常在2.50美元左右。4 长期承诺可将H100的有效成本降至每GPU小时1.90-2.10美元。5 一些激进的供应商提供的H100租赁价格低至每小时0.99-1美元。6

价格下跌的驱动因素

多重因素共同导致了市场调整。

供应扩张

2023年和2024年初的H100供应紧张状况已大幅缓解。超大规模云厂商和区域数据中心已投入大量新产能。7 曾经的卖方市场开始正常化,因为生产已追上短缺期间下达的订单。

NVIDIA的制造合作伙伴在2024年和2025年全年扩大了产能。短缺期间进行的产能投资现在正向供需更加平衡的市场交付GPU。从稀缺到充足的转变从根本上改变了定价动态。

竞争加剧

2025年有超过300家新供应商进入H100云市场,导致价格竞争激烈。8 RunPod和Vast.ai等规模较小的专业供应商提供的价格低至每小时1.80-1.87美元。9 这种竞争迫使大型供应商要么匹配价格,要么失去客户。

GPU云服务的低进入门槛使市场快速涌入新参与者。拥有数据中心访问权限和资本的组织可以购买或租赁GPU并提供云服务。与传统云服务相比,碎片化的市场结构加剧了价格竞争,而传统云服务的进入门槛更高。

需求演变

AI初创公司已将重点从训练大型基础模型转向微调现有开源模型,降低了对最大GPU集群的需求强度。10 推理工作负载虽然增长迅速,但与训练有不同的特点——更加分布式、单实例需求更低、对价格更敏感。

Llama、Mistral和DeepSeek等能力出色的开源模型的出现,减少了从头进行昂贵训练的需求。组织可以通过微调而非基础模型训练来获得有竞争力的AI能力。这种转变改变了GPU需求的构成。

市场影响

价格暴跌对不同的市场参与者产生了不同的影响。

基础设施投资者

在峰值价格购买GPU的组织面临着具有挑战性的经济状况。分析表明,一旦H100租赁价格降至每小时1.65美元以下,收入将无法收回投资。11 价格需要超过每小时2.85美元才能击败股市提供的内部收益率。12

盈利门槛对价格形成了底部支撑。无法在当前价格下维持运营的供应商将退出,最终稳定供应。由于成本结构不同的运营商相互竞争,这种洗牌可能需要数个季度才能完成。

云客户

租用GPU产能的组织直接受益于价格下跌。之前在每小时8美元时不经济的项目,在每小时2.50美元时变得可行。这种可及性使更广泛的AI实验和部署成为可能。

然而,价格波动使规划变得复杂。承诺长期GPU产能的组织面临不确定性:当前价格是代表公允价值还是暂时的供应过剩。较短期的承诺提供了灵活性,但如果供应收紧,可能会错过有利的定价。

超大规模云厂商定位

IBM首席执行官Arvind Krishna公开质疑超大规模云厂商的AI基础设施投资能否产生回报,称在当前支出水平下"不可能"实现盈利数学。13 GPU价格暴跌为怀疑论者提供了支持证据,同时也使GPU消费者受益。

亚马逊首席执行官Andy Jassy反驳称,产能"投入多快就消耗多快",表明尽管价格下降,需求仍然持续。14 数量增长可能弥补价格下降,但整个行业的利润率都面临压力。

下一代展望

H100的价格走势为新一代GPU提供了预期参考。

Blackwell推出

NVIDIA Blackwell GPU已开始发货,GB200系统已交付客户。下一代架构相比H100提供了显著的性能改进。Blackwell的初始供应量仍然有限,溢价定价反映了稀缺性。

随着Blackwell供应量增加,H100价格可能进一步下降。对H100性能满意的组织可以从持续的价格下跌中受益。需要Blackwell能力的组织将支付溢价,直到供应正常化。

中期预测

中期预测表明,当B200 GPU在2026年更广泛推出时,可能会有10-20%的下降。15 这个推出周期可能会重复H100的模式:初期稀缺伴随溢价定价,随后供应扩张和价格正常化。

组织在规划基础设施投资时应考虑GPU的代际时机。等待新一代提供性能优势,但会延迟部署。以下降价格购买当前一代硬件可以实现即时部署。

当前价格比较

供应商 H100按需 H100竞价 承诺价格
AWS P5 $3.50/小时 ~$2.50/小时 $1.90-2.10/小时 (1年)
GCP A3-High $3.25/小时 $2.25/小时 ~$2.00/小时 (1年)
Azure ND H100 $3.40/小时 ~$2.60/小时 ~$2.15/小时 (1年)
RunPod $2.39/小时 $1.87/小时 不适用
Vast.ai 浮动 $1.80-2.50/小时 不适用
Lambda $2.49/小时 不适用 $1.99/小时 (预留)

价格截至2025年12月。竞价价格根据可用性波动。

决策框架:租赁 vs 自建 vs 等待

场景 建议 理由
可变工作负载(<50%利用率) 租赁(竞价) 灵活性优于自建节省的成本
稳定工作负载(>70%利用率) 评估自建 在当前价格下可实现盈亏平衡
GPU月支出>10万美元 自建基础设施 持续利用率下ROI明确
12个月前景不确定 短期租赁 避免需求变化时资产搁置
训练大型模型 自建或预留 稳定产能至关重要

盈亏平衡分析: - H100购买价格:每GPU约25,000-30,000美元 - 按每小时2.50美元租赁:10,000-12,000小时达到盈亏平衡(100%利用率下约14-16个月) - 按每小时1.65美元租赁:供应商无法收回投资11 - 盈利门槛:每小时2.85美元才能击败股市IRR12

可行动步骤: 1. 审计当前支出:计算所有GPU使用的有效小时成本 2. 评估利用率:测量实际使用与预留产能的对比 3. 评估承诺选项:比较1年预留定价与按需定价 4. 考虑混合方案:基线需求自建,突发需求租赁

专业指导

在波动市场中的基础设施决策受益于经验丰富的专业视角。

Introl拥有550名现场工程师网络,支持组织应对GPU基础设施经济问题。16 该公司以9,594%的三年增长率在2025年Inc. 5000榜单中排名第14位。17

覆盖全球257个地点的专业能力提供跨地域的市场洞察。18 专业指导帮助组织在价格演变过程中做出明智决策。

关键要点

对于采购团队: - H100价格从每小时8美元下降64%至每小时2.85-3.50美元 - 超过300家新供应商加剧竞争 - 竞价定价(GCP 2.25美元,AWS 2.50美元)为灵活工作负载提供最佳价值

对于基础设施规划者: - 自建盈亏平衡点:100%利用率下14-16个月 - 供应商盈利底线:约每小时1.65美元(价格不太可能大幅下跌) - 承诺定价(每小时1.90-2.10美元)比按需低40%以上

对于战略规划: - 市场在2023-2024年短缺后正在正常化——不是暂时的下跌 - Blackwell的推出可能在2026年进一步压低H100价格 - 随着技术快速演进,租赁灵活性很有价值

展望

GPU云价格暴跌代表了2023-2024年稀缺条件后的市场正常化。组织受益于大幅改善的GPU可及性,使更广泛的AI部署成为可能。随着供应增长持续满足需求,加上下一代产品的推出可能延续这一模式,价格环境可能会持续。

组织应利用当前定价满足即时需求,同时保持对市场演变的灵活性。最成功的策略将在部署紧迫性和市场时机考虑之间取得平衡,利用租赁灵活性避免在快速演变的市场中过早进行资本承诺。

参考文献


类别: 市场分析 紧急程度: 高——市场变化对采购有即时影响 字数: 约1,800



  1. Thunder Compute. "AI GPU Rental Market Trends December 2025." December 2025. https://www.thundercompute.com/blog/ai-gpu-rental-market-trends 

  2. Silicon Data. "H100 Rental Market Cools in September." September 2025. https://www.silicondata.com/blog/h100-rental-market-update-september-2025 

  3. Thunder Compute. "AI GPU Rental Market Trends December 2025." December 2025. 

  4. IntuitionLabs. "H100 Rental Prices: A Cloud Cost Comparison." November 2025. https://intuitionlabs.ai/articles/h100-rental-prices-cloud-comparison 

  5. IntuitionLabs. "H100 Rental Prices: A Cloud Cost Comparison." November 2025. 

  6. Thunder Compute. "AI GPU Rental Market Trends December 2025." December 2025. 

  7. Silicon Data. "H100 Rental Market Cools in September." September 2025. 

  8. Thunder Compute. "AI GPU Rental Market Trends December 2025." December 2025. 

  9. IntuitionLabs. "H100 Rental Prices: A Cloud Cost Comparison." November 2025. 

  10. Thunder Compute. "AI GPU Rental Market Trends December 2025." December 2025. 

  11. Cybernews. "AI boom paradox leads to GPU rental market crash." 2025. https://cybernews.com/tech/gpu-rental-prices-are-crashing/ 

  12. Cybernews. "AI boom paradox leads to GPU rental market crash." 2025. 

  13. Fortune. "IBM CEO warns there's 'no way' hyperscalers will turn a profit." December 2025. https://fortune.com/2025/12/03/ibm-ceo-no-way-hyperscalers-google-amazon-turn-profit-data-center-spending/ 

  14. CIO Dive. "'We're not dabbling here': AWS backs infrastructure investments." December 2025. https://www.ciodive.com/news/aws-ai-cloud-infrastructure-capacity-microsoft-google/746998/ 

  15. Thunder Compute. "AI GPU Rental Market Trends December 2025." December 2025. 

  16. Introl. "Company Overview." Introl. 2025. https://introl.com 

  17. Inc. "Inc. 5000 2025." Inc. Magazine. 2025. 

  18. Introl. "Coverage Area." Introl. 2025. https://introl.com/coverage-area 

申请报价_

告诉我们您的项目需求,我们将在72小时内回复。

> 传输完成

请求已收到_

感谢您的咨询。我们的团队将审核您的请求并在72小时内回复。

排队处理中