DeepSeek和Qwen如何改变AI基础设施经济学

DeepSeek R1使用2,000块H800 GPU仅花费560万美元完成训练,而同等水平的西方模型则需要在16,000块H100上投入8000万至1亿美元。2025年,中国开源模型的全球使用份额从1.2%增长至近30%。AWS、Azure和Google Cloud现已提供DeepSeek部署服务。汇丰银行、渣打银行和沙特阿美正在测试或部署DeepSeek。Qwen 2.5-Max的价格为每百万token 0.38美元,远低于西方同类产品。

DeepSeek和Qwen如何改变AI基础设施经济学

DeepSeek和Qwen如何改变AI基础设施经济学

2025年12月11日更新

2025年12月更新: DeepSeek R1使用2,000块H800 GPU仅花费560万美元完成训练,而同等水平的西方模型则需要在16,000块H100上投入8000万至1亿美元。2025年,中国开源模型的全球使用份额从1.2%增长至近30%。AWS、Azure和Google Cloud现已提供DeepSeek部署服务。汇丰银行、渣打银行和沙特阿美正在测试或部署DeepSeek。Qwen 2.5-Max的价格为每百万token 0.38美元,远低于西方同类产品。

DeepSeek声称其R1模型仅使用2,000块NVIDIA H800 GPU,训练成本仅为560万美元。¹ 而同等水平的西方模型需要8000万至1亿美元以及16,000块H100 GPU。² 该模型于2025年1月发布,恰好在OpenAI宣布5000亿美元Stargate计划的前一天,引发了NVIDIA单日市值蒸发5890亿美元的历史性暴跌。³ 中国AI模型从区域性的新奇事物一跃成为全球基础设施领域的重要挑战者,仅凭一款产品的发布就实现了这一转变。

这一效率声明值得深入审视。中国开源模型的全球使用份额从2024年底的1.2%增长至2025年的近30%。⁴ 阿里巴巴报告称,基于Qwen构建的衍生模型已超过17万个。⁵ 汇丰银行、渣打银行和沙特阿美目前正在测试或部署DeepSeek模型。⁶ 亚马逊云服务、微软Azure和谷歌云均向客户提供DeepSeek部署服务。⁷ 曾经有利于大规模资本支出的基础设施经济学,可能正在向效率优先的模式转变,这将改变企业规划AI投资的方式。

DeepSeek的效率突破

DeepSeek是一家总部位于杭州、员工不足200人的公司,由量化基金幻方(管理资产规模80亿美元)支持,它重新思考了模型训练的方式。⁸ 其模型不再依赖计算密集型基础设施,而是利用强化学习和混合专家(Mixture-of-Experts)架构来提升性能,同时降低计算需求。⁹

MoE架构是实现效率提升的技术核心。与传统密集模型为每个推理请求激活所有参数不同,MoE模型仅激活相关的专家网络。这种方法与传统密集模型相比,可将计算成本降低高达30%,同时保持或超越原有性能。¹⁰ DeepSeek证明,有效的软硬件协同设计能够实现大模型的低成本训练,为小型团队创造了公平竞争的机会。

美国出口管制在中国AI行业引发了一波创新浪潮。¹¹ 由于无法获得最先进的NVIDIA GPU,中国研究人员开发出了使用现有硬件达到竞争性能的技术。限制反而成为了催化剂。DeepSeek以仅需少量成本和算力就能媲美GPT-4能力的模型,震惊了全球观察者。

基础设施的影响不仅限于训练成本。如果推理成本遵循类似的效率曲线,云服务提供商的年度资本支出可能从800亿至1000亿美元降至每家650亿至850亿美元。¹² 这一削减将影响从芯片制造商到数据中心运营商再到电力供应商的整个产业链。

Qwen与中国模型生态系统

阿里巴巴的Qwen模型提供的效率直接转化为企业经济效益。Qwen 2.5-Max的价格约为每百万token 0.38美元,远低于西方竞争对手,同时在多项基准测试中表现相当或更优。¹³ 对于每月处理数十亿token的企业而言,成本差异决定了盈利能力。

Airbnb首席执行官Brian Chesky表示,公司更青睐阿里巴巴的Qwen,因为它"又快又便宜"。¹⁴ 日本经济产业省在某些应用中选择了Qwen而非美国替代方案。¹⁵ LVMH与阿里巴巴合作,利用Qwen和Model Studio为其在中国的数字零售业务提供支持。¹⁶ 这种采用不仅限于注重成本的初创企业,还扩展到拥有大量AI预算的大型企业。

Qwen 3是2025年发布的最全面的开源模型系列之一。该系列涵盖从5亿到1100亿参数的模型,包括密集模型和稀疏模型。¹⁷ 通过"思考"和"非思考"模式的双重运行方式,可根据任务复杂度动态切换,在需要时分配算力,其他时候则节省资源。

百川将自己定位为专注于垂直领域应用的中国模型领军者。它专注于法律、金融、医学和中国古典文学,在语言和文化细微差异要求较高的任务中表现出色。¹⁸ 通过ALiBi位置编码,百川支持更长的上下文处理和高效推理。int8和int4量化版本确保可在低成本消费级GPU上部署。¹⁹

对西方基础设施投资的影响

华尔街的反应揭示了真正的不确定性。杰富瑞警告称,DeepSeek的方法"刺破了资本支出的狂热泡沫",此前Meta和微软各自承诺的支出均超过600亿美元。²⁰ 高盛认为,这一发展可能通过降低进入门槛来重塑竞争格局。²¹ 纳斯达克综合指数下跌3.1%,标普500指数下跌1.5%。²²

乐观情景援引杰文斯悖论:效率提升导致推理成本降低,刺激更多AI应用,最终推动对基础设施的更高需求。²³ 更低的成本使此前不经济的应用成为可能。更多应用意味着更多推理。更多推理最终意味着更多硬件,只是部署方式更加高效。

温和情景认为,AI训练成本保持稳定,而推理基础设施支出下降30-50%。²⁴ 云服务提供商将减少资本支出,同时承载相似或更多的AI工作负载。效率提升将以更低的价格形式流向用户,而非作为利润流向基础设施提供商。

AI基础设施支出放缓可能会暂时影响芯片制造商和硬件供应商。²⁵ 然而,模型优化和成本降低带来的效率提升可能会在长期内推动更大规模的AI应用,最终带动对AI硬件的更高需求。时机很重要:短期阵痛可能会迎来长期收益。

基础设施规划的战略启示

行业似乎正在从为通用场景训练大规模语言模型转向其他方向。²⁶ 针对特定用例进行微调和定制的小型模型,正在越来越多地取代通用前沿模型。这一转变有利于大规模高效推理,而非大规模训练。

DeepSeek的崛起凸显了行业范围内从暴力扩展向智能优化的转变。²⁷ 包括OpenAI和谷歌在内的老牌玩家面临着探索效率提升的压力,因为AI应用正在全球范围内扩展。竞争压力使用户受益,同时可能压缩基础设施提供商的利润空间。

规划AI基础设施的企业应考虑效率趋势。以更低计算成本实现相当性能的模型,挑战了关于容量需求的假设。训练基础设施(仍然是计算密集型)和推理基础设施(效率日益提高)之间的区别可能会扩大。基于当前使用模式过度建设推理容量,可能会随着效率提升而留下过剩产能。

中国模型也带来了部署决策问题。许多企业现在可以通过西方云服务提供商访问中国AI能力,将熟悉的基础设施与高效模型相结合。主权问题、监管要求和竞争考量都是决定是否采用中国模型的因素,尽管它们具有效率优势。

2024年看似已成定局的AI基础设施经济——计算规模决定能力——现在面临根本性问题。DeepSeek证明,巧妙的工程可以替代原始算力。Qwen证明,开源效率可以与专有规模竞争。那些围绕无限算力能力构建AI战略的企业,现在必须考虑效率优先的替代方案,这些方案挑战了他们关于AI基础设施需求的假设。

关键要点

对于基础设施战略师: - DeepSeek使用2,000块H800 GPU以560万美元训练R1,而同等水平的西方模型需要8000万至1亿美元和16,000块H100 - MoE架构与密集模型相比降低30%计算成本;效率提升源于软硬件协同设计 - 2025年中国开源模型全球使用份额从1.2%增长至30%;阿里巴巴报告Qwen衍生模型超过17万个

对于企业AI团队: - Qwen 2.5-Max价格约为每百万token 0.38美元——在性能相当的情况下远低于西方替代方案 - Airbnb首席执行官表示偏好阿里巴巴的Qwen,因为它"又快又便宜";日本经济产业省选择Qwen而非美国替代方案 - AWS、Azure和GCP现已提供DeepSeek部署;企业用户包括汇丰银行、渣打银行、沙特阿美

对于财务规划: - 如果推理效率遵循训练模式,云服务提供商年度资本支出可能从800亿至1000亿美元降至650亿至850亿美元 - DeepSeek发布当日NVIDIA市值蒸发5890亿美元;纳斯达克下跌3.1%,标普500下跌1.5% - 杰富瑞:DeepSeek"刺破了资本支出狂热",此前Meta和微软各自承诺支出超过600亿美元

对于容量规划师: - 行业正从大规模通用LLM转向针对特定用例微调的小型模型 - 训练基础设施仍然是计算密集型;推理基础设施效率日益提高——需要分别规划 - 基于当前模式过度建设推理容量,随着效率提升可能导致资产搁浅

对于战略规划: - 出口管制促进了创新;限制成为效率创新的催化剂 - 杰文斯悖论情景:效率提升使更多应用成为可能,最终推动更高的硬件需求 - 企业在规划基础设施需求时必须考虑效率优先的替代方案


参考文献

  1. Bain & Company. "DeepSeek: A Game Changer in AI Efficiency?" 2025. https://www.bain.com/insights/deepseek-a-game-changer-in-ai-efficiency/

  2. Bain & Company. "DeepSeek: A Game Changer in AI Efficiency?"

  3. TechCrunch. "DeepSeek 'punctures' AI leaders' spending plans, and what analysts are saying." January 27, 2025. https://techcrunch.com/2025/01/27/deepseek-punctures-tech-spending-plans-and-what-analysts-are-saying/

  4. Gizmochina. "Why U.S. Startups Are Dumping Western AI for China's Open-Source Models." December 9, 2025. https://www.gizmochina.com/2025/12/09/why-u-s-startups-are-dumping-western-ai-for-chinas-open-source-models/

  5. Intuition Labs. "An Overview of Chinese Open-Source LLMs (Sept 2025)." September 2025. https://intuitionlabs.ai/articles/chinese-open-source-llms-2025

  6. iKangai. "The Enterprise AI Shift: How Chinese Models Are Challenging Silicon Valley's Dominance." 2025. https://www.ikangai.com/the-enterprise-ai-shift-how-chinese-models-are-challenging-silicon-valleys-dominance/

  7. iKangai. "The Enterprise AI Shift."

  8. Bain & Company. "DeepSeek: A Game Changer in AI Efficiency?"

  9. IDC Blog. "DeepSeek's AI Innovation: A Shift in AI Model Efficiency and Cost Structure." January 31, 2025. https://blogs.idc.com/2025/01/31/deepseeks-ai-innovation-a-shift-in-ai-model-efficiency-and-cost-structure/

  10. Gizmochina. "Why U.S. Startups Are Dumping Western AI for China's Open-Source Models."

  11. World Economic Forum. "Why China's AI breakthroughs should come as no surprise." June 2025. https://www.weforum.org/stories/2025/06/china-ai-breakthroughs-no-surprise/

  12. Bain & Company. "DeepSeek: A Game Changer in AI Efficiency?"

  13. Gizmochina. "Why U.S. Startups Are Dumping Western AI for China's Open-Source Models."

  14. Gizmochina. "Why U.S. Startups Are Dumping Western AI for China's Open-Source Models."

  15. Gizmochina. "Why U.S. Startups Are Dumping Western AI for China's Open-Source Models."

  16. Intuition Labs. "An Overview of Chinese Open-Source LLMs (Sept 2025)."

  17. Intuition Labs. "An Overview of Chinese Open-Source LLMs (Sept 2025)."

  18. Intuition Labs. "An Overview of Chinese Open-Source LLMs (Sept 2025)."

  19. Intuition Labs. "An Overview of Chinese Open-Source LLMs (Sept 2025)."

  20. TechCrunch. "DeepSeek 'punctures' AI leaders' spending plans."

  21. TechCrunch. "DeepSeek 'punctures' AI leaders' spending plans."

  22. TechCrunch. "DeepSeek 'punctures' AI leaders' spending plans."

  23. Bain & Company. "DeepSeek: A Game Changer in AI Efficiency?"

  24. Bain & Company. "DeepSeek: A Game Changer in AI Efficiency?"

  25. IDC Blog. "DeepSeek's AI Innovation."

  26. IDC Blog. "DeepSeek's AI Innovation."

  27. IDC Blog. "DeepSeek's AI Innovation."

申请报价_

告诉我们您的项目需求,我们将在72小时内回复。

> 传输完成

请求已收到_

感谢您的咨询。我们的团队将审核您的请求并在72小时内回复。

排队处理中