NVIDIA在NeurIPS发布物理AI:Alpamayo-R1与Cosmos生态系统
2025年12月12日
2025年12月更新: NVIDIA在NeurIPS 2025发布了Alpamayo-R1(AR1),这是首个用于自动驾驶的开放推理视觉-语言-动作模型。Cosmos平台扩展了用于仿真的LidarGen和用于人形机器人的ProtoMotions3。Figure AI、1X、Agility Robotics及其他机器人领域领导者正在基于该生态系统构建。
摘要
NVIDIA正在开源物理AI的基础组件。Alpamayo-R1将思维链推理与轨迹规划相结合,用于自动驾驶汽车——这一能力此前被锁定在专有系统中。Cosmos世界基础模型平台现在包括视频生成、激光雷达合成和人形机器人训练工具。随着主要机器人公司采用这些模型,NVIDIA将自己定位为机器人和自动驾驶汽车的基础设施层,就像它主导LLM训练一样。
发生了什么
NVIDIA于12月1日在圣地亚哥的NeurIPS 2025上发布了Alpamayo-R1(AR1),将其描述为世界上第一个用于自动驾驶的工业级开放推理视觉语言动作(VLA)模型。1
该模型将思维链AI推理与路径规划相结合。AR1逐步分解驾驶场景,考虑可能的轨迹,然后使用上下文数据选择最佳路线。2该方法旨在提高复杂边缘案例场景中的安全性,这些场景对传统AV系统构成挑战。
正如大型语言模型革新了生成式和代理式AI,Cosmos世界基础模型是物理AI的突破,黄仁勋在早期的CES和GTC公告中表示。3
AR1基于Cosmos-Reason1-7B构建,这是NVIDIA作为更广泛Cosmos平台一部分发布的推理视觉语言模型。4该模型、评估框架(AlpaSim)和训练数据子集可在GitHub和Hugging Face上以开放许可证获取,用于非商业研究。
对基础设施的重要性
物理AI像LLM一样扩展:Cosmos平台将适用于语言模型的相同方法(大型基础模型、开放权重、开发者工具)应用于机器人和自动驾驶汽车。组织可以在专有数据上微调Alpamayo-R1或Cosmos模型,而不是从头开始构建。
仿真成为差异化因素:LidarGen生成合成激光雷达数据;Cosmos Transfer将仿真转换为逼真视频;ProtoMotions3在物理精确的环境中训练人形机器人。计算需求很大:训练单个机器人策略通常需要在H100级硬件上1,000-10,000 GPU小时。进入物理AI的组织需要专用GPU集群或与新云服务商合作。
开源加速采用:通过开放发布AR1,NVIDIA推动其硬件堆栈的采用。每个训练或微调这些模型的组织都在NVIDIA GPU上运行。开放模型策略被证明对LLM开发有效;NVIDIA将其应用于物理AI。
机器人生态系统成熟:Figure AI、1X、Agility Robotics和X-Humanoid基于Cosmos构建,表明人形机器人行业正在向共享基础设施收敛。这与云AI开发在PyTorch和transformer架构上的标准化相似。
技术细节
NVIDIA DRIVE Alpamayo-R1架构
| 组件 | 规格 |
|---|---|
| 模型基础 | Cosmos-Reason1-7B |
| 模型类型 | 视觉-语言-动作(VLA) |
| 关键特性 | 用于轨迹规划的思维链推理 |
| 训练数据 | 1,727+小时驾驶数据(子集开放) |
| 评估 | AlpaSim框架(开源) |
| 可用性 | GitHub、Hugging Face |
AR1的推理方法:5 1. 通过多模态输入感知环境 2. 使用思维链进行决策过程推理 3. 生成轨迹预测 4. 通过自然语言描述阐述动作
评估显示在推理、轨迹生成、对齐、安全和延迟指标上达到最先进性能。6
Cosmos平台组件
| 模型 | 用途 | 使用案例 |
|---|---|---|
| Cosmos Predict | 下一帧生成 | 边缘案例数据集创建 |
| Cosmos Transfer | 结构化到逼真视频 | 合成训练数据 |
| Cosmos Reason | 思维链评估 | 质量评估 |
| LidarGen | 激光雷达数据合成 | AV仿真 |
| ProtoMotions3 | 人形训练框架 | 机器人策略开发 |
LidarGen
首个为AV仿真生成合成激光雷达数据的世界模型:7 - 基于Cosmos架构构建 - 生成距离图和点云 - 实现基于激光雷达的场景测试,无需物理传感器数据收集 - 减少AV开发对真实世界数据的需求
ProtoMotions3
用于人形机器人训练的GPU加速框架:8 - 基于NVIDIA Newton和Isaac Lab构建 - 使用Cosmos WFM生成的场景 - 训练物理仿真的数字人和人形机器人 - 策略模型导出到NVIDIA GR00T N用于真实硬件
行业采用
使用Cosmos世界基础模型的组织:9
| 公司 | 应用 |
|---|---|
| 1X | 通过Cosmos Predict/Transfer训练NEO Gamma人形机器人 |
| Agility Robotics | 大规模合成数据生成 |
| Figure AI | 物理AI开发 |
| Foretellix | AV测试和验证 |
| Gatik | 自动卡车运输 |
| Oxa | 通用自主平台 |
| PlusAI | 自动卡车运输 |
| X-Humanoid | 人形机器人 |
Agility Robotics CTO Pras Velagapudi:Cosmos为我们提供了一个机会,将我们的逼真训练数据扩展到超越我们在现实世界中可行收集的范围。10
更广泛的NeurIPS公告
NVIDIA研究人员在NeurIPS 2025上展示了70多篇论文、演讲和研讨会。11其他开放发布包括:
数字AI模型: - MultiTalker Parakeet:多说话者环境的语音识别 - Sortformer:说话者分离模型 - Nemotron Content Safety Reasoning:安全评估
认可: - Artificial Analysis开放指数将NVIDIA Nemotron系列评为AI生态系统中最开放的之一12
下一步
2026年:Alpamayo-R1衍生物在L4级AV项目中生产部署。
2026-2027年:人形机器人制造商交付使用Cosmos/ProtoMotions3管道训练的产品。
持续进行:Cosmos平台扩展更多专业领域(制造、物流、医疗保健)的世界模型。
市场影响:黄仁勋提到的50万亿美元制造和物流行业将需要大规模GPU基础设施用于仿真和推理。物理AI代表NVIDIA在LLM训练之外的下一个增长载体。
关键要点
对于基础设施规划者: - 物理AI仿真需要在H100级硬件上每个机器人策略1,000-10,000 GPU小时 - 基于Cosmos的工作流驱动NVIDIA硬件需求;相应地为AV/机器人项目做预算 - 合成数据生成减少但不消除真实世界数据收集需求 - L4级自主时间表取决于AR1等推理模型的进展 - Isaac Sim最低需要RTX 4090;生产训练需要A100/H100集群
对于运营团队: - 开放模型可在GitHub和Hugging Face上评估 - AlpaSim提供标准化评估框架 - Isaac Lab/Isaac Sim集成用于机器人开发 - LidarGen实现无硬件激光雷达仿真
对于战略规划: - 物理AI遵循LLM剧本:基础模型、微调、开放生态系统 - 机器人行业整合到NVIDIA基础设施堆栈 - 1X、Figure AI、Agility的时间表表明2026-2027年推出人形产品 - 制造/物流AI代表下一波基础设施投资
参考文献
如需支持物理AI开发的GPU基础设施,请联系Introl。
-
NVIDIA博客。"At NeurIPS, NVIDIA Advances Open Model Development for Digital and Physical AI." 2025年12月1日。 ↩
-
TechCrunch。"Nvidia announces new open AI models and tools for autonomous driving research." 2025年12月1日。 ↩
-
NVIDIA新闻室。"NVIDIA Launches Cosmos World Foundation Model Platform to Accelerate Physical AI Development." 2025年1月7日。 ↩
-
NVIDIA研究。"Alpamayo-R1: Bridging Reasoning and Action Prediction for Generalizable Autonomous Driving in the Long Tail." 2025年10月。 ↩
-
WinBuzzer。"Alpamayo-R1: NVIDIA Releases Vision Reasoning Model and Massive 1,727-Hour Dataset." 2025年12月2日。 ↩
-
NVIDIA研究。"Alpamayo-R1 Publication." 2025年。 ↩
-
NVIDIA博客。"Physical AI Open Datasets." 2025年12月。 ↩
-
Edge AI and Vision Alliance。"NVIDIA Advances Open Model Development for Digital and Physical AI." 2025年12月。 ↩
-
NVIDIA新闻室。"NVIDIA Announces Major Release of Cosmos World Foundation Models and Physical AI Data Tools." 2025年3月18日。 ↩
-
NVIDIA新闻室。"Cosmos Platform Announcement." 2025年。 ↩
-
NVIDIA博客。"NeurIPS 2025." 2025年12月。 ↩
-
Artificial Analysis。"Openness Index." 2025年。 ↩
-
Analytics India Magazine。"NVIDIA Open Sources Reasoning Model for Autonomous Driving at NeurIPS 2025." 2025年12月。 ↩
-
TechRepublic。"Nvidia Unveils Advances in Open Digital and Physical AI." 2025年12月。 ↩
-
Interesting Engineering。"NVIDIA debuts first open reasoning AI for self-driving vehicles." 2025年12月。 ↩