NVIDIAのNeurIPSにおけるPhysical AI:Alpamayo-R1とCosmosエコシステム
2025年12月12日
2025年12月アップデート: NVIDIAはNeurIPS 2025でAlpamayo-R1(AR1)を発表しました。これは自動運転向け初のオープン推論ビジョン言語アクションモデルです。Cosmosプラットフォームはシミュレーション用LidarGenとヒューマノイドロボティクス用ProtoMotions3で拡張されました。Figure AI、1X、Agility Roboticsなどのロボティクスリーダー企業がこのエコシステム上で開発を進めています。
要約
NVIDIAはPhysical AIの構成要素をオープンソース化しています。Alpamayo-R1は自動運転車向けにChain-of-Thought推論と軌道計画を統合しており、これは以前はプロプライエタリシステムに限定されていた機能です。Cosmosワールドファンデーションモデルプラットフォームは現在、動画生成、LiDAR合成、ヒューマノイドロボット訓練ツールを含んでいます。主要ロボティクス企業がこれらのモデルを採用する中、NVIDIAはLLM訓練を支配しているのと同様に、ロボットと自動運転車のインフラストラクチャレイヤーとしての地位を確立しつつあります。
発表内容
NVIDIAは2025年12月1日、サンディエゴで開催されたNeurIPS 2025でAlpamayo-R1(AR1)を発表し、「自動運転向け世界初の産業規模オープン推論ビジョン言語アクション(VLA)モデル」と説明しました。1
このモデルはChain-of-Thought AI推論と経路計画を統合しています。AR1は運転シナリオをステップバイステップで分解し、可能な軌道を検討した後、コンテキストデータを使用して最適なルートを選択します。2 このアプローチは、従来のAVシステムでは対応が難しい複雑なエッジケースシナリオでの安全性向上を目指しています。
「大規模言語モデルが生成AIとエージェントAIに革命をもたらしたように、CosmosワールドファンデーションモデルはPhysical AIにとってのブレークスルーです」とJensen Huangは以前のCESおよびGTC発表で述べました。3
AR1はNVIDIAがより広範なCosmosプラットフォームの一部としてリリースした推論ビジョン言語モデル、Cosmos-Reason1-7Bをベースに構築されています。4 モデル、評価フレームワーク(AlpaSim)、および訓練データのサブセットは、非商用研究向けのオープンライセンスでGitHubとHugging Faceで公開されています。
インフラストラクチャにとっての重要性
Physical AIはLLMと同様にスケール:Cosmosプラットフォームは、言語モデルで効果を発揮したアプローチ(大規模ファンデーションモデル、オープンウェイト、開発者ツール)をロボティクスと自動運転車に適用しています。組織はゼロから構築するのではなく、Alpamayo-R1やCosmosモデルを独自データでファインチューニングできます。
シミュレーションが差別化要因に:LidarGenは合成LiDARデータを生成し、Cosmos Transferはシミュレーションをフォトリアリスティックな動画に変換し、ProtoMotions3は物理的に正確な環境でヒューマノイドロボットを訓練します。計算要件は相当なもので、単一のロボティクスポリシーの訓練には通常、H100クラスのハードウェアで1,000〜10,000 GPU時間が必要です。Physical AIに参入する組織には、専用GPUクラスターまたはネオクラウドとのパートナーシップが必要です。
オープンソースが採用を加速:AR1をオープンにリリースすることで、NVIDIAは自社ハードウェアスタックの採用を促進しています。これらのモデルを訓練またはファインチューニングするすべての組織がNVIDIA GPUで実行しています。オープンモデル戦略はLLM開発で効果を発揮しました。NVIDIAはこれをPhysical AIに適用しています。
ロボティクスエコシステムの成熟:Figure AI、1X、Agility Robotics、X-HumanoidがCosmosを採用していることは、ヒューマノイドロボティクス業界が共有インフラストラクチャに収束していることを示しています。これは、クラウドAI開発がPyTorchとTransformerアーキテクチャで標準化されたのと並行しています。
技術詳細
NVIDIA DRIVE Alpamayo-R1アーキテクチャ
| コンポーネント | 仕様 |
|---|---|
| モデルベース | Cosmos-Reason1-7B |
| モデルタイプ | ビジョン言語アクション(VLA) |
| 主要機能 | 軌道計画のためのChain-of-Thought推論 |
| 訓練データ | 1,727時間以上の運転データ(サブセット公開) |
| 評価 | AlpaSimフレームワーク(オープンソース) |
| 入手先 | GitHub、Hugging Face |
AR1の推論アプローチ:5 1. マルチモーダル入力を通じて環境を認識 2. Chain-of-Thoughtを使用して意思決定プロセスを推論 3. 軌道予測を生成 4. 自然言語による説明でアクションを明確化
評価では、推論、軌道生成、アライメント、安全性、レイテンシの各指標で最先端の性能を示しています。6
Cosmosプラットフォームコンポーネント
| モデル | 目的 | ユースケース |
|---|---|---|
| Cosmos Predict | 次フレーム生成 | エッジケースデータセット作成 |
| Cosmos Transfer | 構造化データからフォトリアル動画 | 合成訓練データ |
| Cosmos Reason | Chain-of-Thought評価 | 品質評価 |
| LidarGen | LiDARデータ合成 | AVシミュレーション |
| ProtoMotions3 | ヒューマノイド訓練フレームワーク | ロボットポリシー開発 |
LidarGen
AVシミュレーション用の合成LiDARデータを生成する初のワールドモデル:7 - Cosmosアーキテクチャ上に構築 - レンジマップとポイントクラウドを生成 - 物理センサーデータ収集なしでLiDARベースのシナリオテストが可能 - AV開発における実世界データ要件を削減
ProtoMotions3
ヒューマノイドロボット訓練用のGPUアクセラレーテッドフレームワーク:8 - NVIDIA NewtonとIsaac Lab上に構築 - Cosmos WFM生成シーンを使用 - 物理シミュレートされたデジタルヒューマンとヒューマノイドロボットを訓練 - ポリシーモデルはNVIDIA GR00T Nにエクスポートして実機ハードウェアで使用可能
業界での採用
Cosmosワールドファンデーションモデルを使用している組織:9
| 企業 | 用途 |
|---|---|
| 1X | Cosmos Predict/TransferによるNEO Gammaヒューマノイド訓練 |
| Agility Robotics | 大規模合成データ生成 |
| Figure AI | Physical AI開発 |
| Foretellix | AVテストと検証 |
| Gatik | 自動運転トラック |
| Oxa | ユニバーサル自律プラットフォーム |
| PlusAI | 自動運転トラック |
| X-Humanoid | ヒューマノイドロボティクス |
Agility Robotics CTO Pras Velagapudi氏:「Cosmosは、現実世界で収集可能な範囲を超えてフォトリアリスティックな訓練データをスケールする機会を提供してくれます。」10
NeurIPSでのその他の発表
NVIDIAの研究者はNeurIPS 2025で70以上の論文、講演、ワークショップを発表しました。11 その他のオープンリリースには以下が含まれます:
デジタルAIモデル: - MultiTalker Parakeet:マルチスピーカー環境向け音声認識 - Sortformer:話者ダイアライゼーションモデル - Nemotron Content Safety Reasoning:安全性評価
受賞: - Artificial Analysis Openness IndexがNVIDIA Nemotronファミリーを「AIエコシステムで最もオープンなモデルの一つ」と評価12
今後の展望
2026年:レベル4 AVプログラムでAlpamayo-R1派生モデルの本番デプロイメント。
2026-2027年:ヒューマノイドロボットメーカーがCosmos/ProtoMotions3パイプラインで訓練された製品を出荷。
継続中:Cosmosプラットフォームは専門ドメイン(製造、物流、医療)向けの追加ワールドモデルで拡張。
市場への影響:Huangが言及する50兆ドル規模の製造・物流産業は、シミュレーションと推論のための大規模GPUインフラストラクチャを必要とします。Physical AIはLLM訓練を超えたNVIDIAの次の成長ベクトルを代表しています。
重要ポイント
インフラストラクチャ計画担当者向け: - Physical AIシミュレーションにはH100クラスのハードウェアでロボティクスポリシーあたり1,000〜10,000 GPU時間が必要 - CosmosベースのワークフローはNVIDIAハードウェア需要を牽引;AV/ロボティクスプログラムに応じた予算計画を - 合成データ生成は実世界データ収集の必要性を削減するが、完全に排除はしない - レベル4自律のタイムラインはAR1のような推論モデルの進歩に依存 - Isaac SimはRTX 4090以上が最低要件;本番訓練にはA100/H100クラスターが必要
運用チーム向け: - オープンモデルはGitHubとHugging Faceで評価用に入手可能 - AlpaSimは標準化された評価フレームワークを提供 - Isaac Lab/Isaac Simとのロボティクス開発統合 - LidarGenはハードウェアなしでLiDARシミュレーションが可能
戦略計画向け: - Physical AIはLLMのプレイブックに従う:ファンデーションモデル、ファインチューニング、オープンエコシステム - ロボティクス業界はNVIDIAインフラストラクチャスタックに集約 - 1X、Figure AI、Agilityのタイミングは2026-2027年のヒューマノイド製品を示唆 - 製造/物流AIは次のインフラストラクチャ投資の波を代表
参考文献
Physical AI開発をサポートするGPUインフラストラクチャについては、Introlまでお問い合わせください。
-
NVIDIA Blog. "At NeurIPS, NVIDIA Advances Open Model Development for Digital and Physical AI." December 1, 2025. ↩
-
TechCrunch. "Nvidia announces new open AI models and tools for autonomous driving research." December 1, 2025. ↩
-
NVIDIA Newsroom. "NVIDIA Launches Cosmos World Foundation Model Platform to Accelerate Physical AI Development." January 7, 2025. ↩
-
NVIDIA Research. "Alpamayo-R1: Bridging Reasoning and Action Prediction for Generalizable Autonomous Driving in the Long Tail." October 2025. ↩
-
WinBuzzer. "Alpamayo-R1: NVIDIA Releases Vision Reasoning Model and Massive 1,727-Hour Dataset." December 2, 2025. ↩
-
NVIDIA Research. "Alpamayo-R1 Publication." 2025. ↩
-
NVIDIA Blog. "Physical AI Open Datasets." December 2025. ↩
-
Edge AI and Vision Alliance. "NVIDIA Advances Open Model Development for Digital and Physical AI." December 2025. ↩
-
NVIDIA Newsroom. "NVIDIA Announces Major Release of Cosmos World Foundation Models and Physical AI Data Tools." March 18, 2025. ↩
-
NVIDIA Newsroom. "Cosmos Platform Announcement." 2025. ↩
-
NVIDIA Blog. "NeurIPS 2025." December 2025. ↩
-
Artificial Analysis. "Openness Index." 2025. ↩
-
Analytics India Magazine. "NVIDIA Open Sources Reasoning Model for Autonomous Driving at NeurIPS 2025." December 2025. ↩
-
TechRepublic. "Nvidia Unveils Advances in Open Digital and Physical AI." December 2025. ↩
-
Interesting Engineering. "NVIDIA debuts first open reasoning AI for self-driving vehicles." December 2025. ↩