二级GPU市场:购买和出售二手AI硬件
更新于2025年12月11日
2025年12月更新: CoreWeave 2022年合同到期的H100以原价95%的价格立即重新签约。超大规模云服务商将折旧期延长至6年,在3000亿美元以上的资本支出中每年节省约180亿美元。价值梯度:第1-2年用于前沿训练,第3-4年用于推理,第5-6年用于批量工作负载。黄仁勋开玩笑说"等Blackwell发货时,Hopper就送人都没人要了"——但推理需求让上一代硬件依然保值。
CoreWeave 2022年合同到期的H100 GPU以原价95%的价格立即重新签约。¹ 这个数据点揭示了一个反直觉的现象:即使NVIDIA发布更新的产品,AI加速器仍能保持相当大的价值。企业级GPU硬件已经形成了成熟的二级市场,为企业以显著折扣获取计算能力创造了机会,同时让卖方能够从基础设施升级中回收资本。
围绕AI基础设施投资的万亿美元级问题——GPU究竟贬值多快——决定着采购策略、财务规划和基础设施生命周期决策。了解二级市场动态有助于企业优化GPU采购、把握硬件更新周期时机,并最大化AI基础设施投资回报。
折旧之争
超大规模云服务商和GPU云服务提供商在AI加速器能保持多久经济价值这一问题上存在根本分歧:
延长折旧期(6年): Amazon、Microsoft和Google都在2023年前将服务器使用寿命假设从3-4年延长到6年。² CoreWeave采用六年折旧周期。这种会计处理方式显著降低了年度折旧费用——据估计,这一变化仅在2024年就为超大规模云服务商在其总计超过3000亿美元的资本支出中节省了180亿美元。³
激进折旧期(2-3年): 批评者认为AI硬件发展太快,不适合采用六年假设。NVIDIA每2年发布新架构(2020年A100、2022年H100、2024年B200),每一代都带来2-3倍的性能提升。黄仁勋本人开玩笑说"等Blackwell开始大规模发货时,Hopper就送人都没人要了。"⁴
价值梯度模型: 一个更细致的观点认识到,GPU随着使用时间的推移服务于不同的工作负载:⁵ - 第1-2年: 需要最高性能的前沿模型训练 - 第3-4年: 上一代硬件即可满足的高价值实时推理 - 第5-6年: 批量推理和分析工作负载
梯度框架解释了CoreWeave的经验:A100 GPU仍然满负荷运行,因为推理工作负载不需要最先进的芯片。训练前沿模型的组织需要B200;服务生产推理的组织通常不需要。
当前市场定价
二级GPU价格反映了新硬件供应、推理需求和代际过渡之间的相互作用:
H100定价(2025年)
新品/零售价: - 基础价格:25,000-28,000美元 - 服务器集成配置:35,000-40,000美元以上 - 供应紧张时期:溢价40-60%⁶
二级市场: - 轻度使用(1-2年):新品价格的70-85% - 中度使用(2-3年):新品价格的50-70% - 灰色市场/eBay:折扣20-40%,但存在保修/支持风险
云租用参考: - 超大规模云服务商按需价格:3-4美元/小时(比2024年下降44%) - 经济型提供商:1.80-2.50美元/小时 - 2025年有300多家新提供商进入市场⁷
A100定价动态
在2025年中期的调整中,A100价格比H100下跌更多,反映出该GPU在更广泛、流动性更强的二级市场中的地位。⁸ A100服务于多种工作负载,包括推理、中端训练和边缘部署——正是这些应用让二手硬件获得第二春。
当前A100二级市场定价: - 40GB版本:8,000-12,000美元(新品价格15,000美元以上) - 80GB版本:12,000-18,000美元(新品价格25,000美元以上) - 服务器套装(8x A100):批量折扣显著
B200过渡影响
NVIDIA B200正式上市(预计2026年第一季度)将对H100二级市场价值造成压力。历史规律表明,随着企业升级,上一代硬件价格会下降10-20%。⁹ 计划购买H100的组织应将过渡时机纳入采购决策考量。
采购策略
购买二手GPU
认证翻新项目: 主要供应商(Dell、HPE、Supermicro)提供带保修的认证翻新GPU服务器。定价通常比新品低30-40%,提供1-2年保修覆盖。这种方式在成本节省和支持保障之间取得平衡。
超大规模云服务商剩余库存: 当云服务提供商更新基础设施时,大量GPU库存进入市场。在已知升级周期前后把握采购时机(AWS通常在发布后3-4年更新)可以获得有利定价。企业再营销渠道处理大部分交易量。
经纪商网络: 专业IT资产处置(ITAD)公司聚合来自多个卖家的GPU库存。信誉良好的经纪商会验证硬件来源、测试功能并提供有限保修。预计比认证翻新节省20-30%。
企业直接采购: 升级基础设施的组织有时会直接出售给已知买家,尤其是在行业网络内部。直接交易避免经纪商佣金,但需要对硬件状况和来源进行尽职调查。
灰色市场风险: eBay、阿里巴巴和类似平台提供最大的折扣,但存在显著风险: - 保修覆盖有限或没有 - 可能存在固件限制或区域锁定 - 假冒或虚假描述的硬件 - 驱动程序/固件更新无支持
灰色市场采购适合具有硬件专业知识且对非关键工作负载有风险承受能力的组织。
尽职调查清单
购买二级GPU前:
-
验证来源: 要求提供原始购买文件,特别是高价值H100。合法卖家会提供显示授权分销渠道的发票。
-
检查保修状态: 部分制造商保修可转让给后续所有者;其他则不行。在假设可转让性之前验证保修覆盖范围。
-
测试功能: 在代表性工作负载下对GPU进行压力测试后再最终确定购买。内存错误、热节流和性能下降可能不会在基本验证中出现。
-
确认固件/驱动兼容性: 确保GPU可以接收当前固件更新。部分灰色市场产品的固件访问受限。
-
评估物理状况: 检查导热硅脂老化、风扇磨损和物理损坏。由于环境受控,数据中心GPU通常比消费级产品状况更好。
销售策略
把握硬件更新时机
最佳销售时机需要平衡几个因素:
性能要求: 当硬件不再满足主要工作负载需求时出售,而不是等到完全过时。支持昨天训练需求的GPU仍然可以服务明天的推理工作负载。
市场状况: 新架构发布会暂时压低上一代产品价值。在预期后继产品发布前6-12个月出售可最大化回收价值。发布后立即出售则回收最小化。
合同义务: 云承诺或租赁条款可能限制时机。将这些约束纳入更新规划。
Microsoft CEO萨蒂亚·纳德拉描述过分散AI芯片采购以避免"被某一代产品四五年的折旧套牢"。¹⁰ 这种方法是用批量折扣换取淘汰风险。
回收预期
企业GPU转售通常可回收原购买价格的60-80%,具体取决于:¹¹ - 使用年限和状况 - 代际时效性(发布了多少后继产品) - 市场供需平衡 - 套装完整性(仅GPU vs 整机服务器)
捆绑策略: 将完整GPU服务器作为交钥匙方案出售通常比拆分单个组件收益更好。买家看重简化部署;卖家减少再营销复杂性。
销售渠道
ITAD合作伙伴: IT资产处置公司处理物流、数据销毁认证和买家寻找。通常收取15-25%佣金,但显著减轻卖家负担。
企业直接销售: 向已知买家出售(可能通过行业协会或专业网络)可避免经纪商费用,但需要卖家在寻找买家和谈判条款方面付出努力。
拍卖平台: 专注技术的拍卖汇聚买家需求,但会产生价格不确定性。适合速度比价格优化更重要的库存清算。
以旧换新项目: 部分供应商提供购买新硬件时的以旧换新抵扣。这种方式简化了交易,但回收通常低于公开市场销售。
财务规划考量
折旧计划优化
组织应将会计折旧与实际硬件生命周期保持一致:
保守方法(3年): 匹配典型主要使用期。年度折旧费用较高,但在硬件过时时不会出现意外减值。
延长方法(6年): 匹配超大规模云服务商惯例。年度费用较低,但需要对二级市场价值保持的信心。
混合方法: 第1-2年加速折旧(价值的50-60%),第3-6年放缓折旧。反映主要使用捕获大部分价值的价值梯度经济学。
总拥有成本调整
将残值纳入TCO计算:
有效年度成本 = (采购价格 - 预期转售价) / 使用年限
+ 年度运营成本(电力、冷却、支持)
例如,一台H100服务器: - 采购价:300,000美元 - 预期转售价(4年):90,000美元(30%残值) - 运营成本:40,000美元/年 - 有效年度成本:(300,000美元 - 90,000美元) / 4 + 40,000美元 = 92,500美元
相比假设零残值: - 有效年度成本:300,000美元 / 4 + 40,000美元 = 115,000美元
20%的TCO差异显著影响自建与租用决策。
税务影响
咨询税务顾问关于: - 折旧方法选择(直线法vs加速法) - 符合条件设备的Section 179扣除 - 资本利得优化的销售时机 - 同类资产交换可能性
市场结构与参与者
卖方类别
超大规模云服务商: AWS、Azure和GCP定期淘汰GPU产能,创造大量二级供应。通常通过认证再营销合作伙伴而非公开市场销售。
GPU云服务提供商: CoreWeave、Lambda Labs等公司比超大规模云服务商更快地更新基础设施。合同到期创造可预测的供应。
企业: 完成AI项目或调整战略的组织出售剩余产能。质量因使用模式和维护实践而差异很大。
失败的初创公司: AI公司倒闭释放GPU库存,有时以低价出售。鉴于来源和维护历史的不确定性,尽职调查至关重要。
买方类别
成本敏感型企业: 推理工作负载或研究应用使用上一代硬件即可满足需求的组织。
新兴市场: 价格敏感地区以可接受价格获取基础设施的组织。
AI初创公司: 在获得资金购买新硬件之前启动计算能力的早期公司。
研究机构: 预算有限、寻求性能硬件的学术和非营利组织。
2025年市场动态
几个因素塑造了当前的二级市场状况:
关税影响: 2025年实施的美国贸易政策使GPU组件成本增加了20-40%,影响
[内容因翻译而截断]