NeurIPSにおけるNVIDIAの物理AI:Alpamayo-R1とCosmosエコシステム
2025年12月12日
2025年12月アップデート: NVIDIAはNeurIPS 2025でAlpamayo-R1(AR1)をリリースしました。これは自動運転向けの初のオープン推論ビジョン・言語・アクションモデルです。Cosmosプラットフォームはシミュレーション用のLidarGenとヒューマノイドロボティクス用のProtoMotions3で拡張されました。Figure AI、1X、Agility Robotics、その他のロボティクスリーダーがこのエコシステム上に構築しています。
要約
NVIDIAは物理AIの基盤要素をオープンソース化しています。Alpamayo-R1は自律走行車向けに思考連鎖推論と軌道計画を組み合わせています。これは以前はプロプライエタリシステムの背後に隠されていた機能です。Cosmos世界基盤モデルプラットフォームには、ビデオ生成、ライダー合成、ヒューマノイドロボットトレーニングツールが含まれるようになりました。主要なロボティクス企業がこれらのモデルを採用することで、NVIDIAはLLMトレーニングを支配するのと同じ方法で、ロボットと自律走行車のインフラストラクチャレイヤーとしての地位を確立しています。
何が起きたか
NVIDIAは12月1日にサンディエゴで開催されたNeurIPS 2025でAlpamayo-R1(AR1)を発表し、「自動運転向けの世界初の産業規模オープン推論ビジョン言語アクション(VLA)モデル」と説明しました。1
このモデルは思考連鎖AI推論とパス計画を統合しています。AR1は運転シナリオを段階的に分解し、可能な軌道を検討し、コンテキストデータを使用して最適なルートを選択します。2このアプローチは、従来のAVシステムに挑戦する複雑なエッジケースシナリオでの安全性向上を目指しています。
「大規模言語モデルが生成AIとエージェントAIに革命をもたらしたように、Cosmos世界基盤モデルは物理AIにおける突破口です」とJensen Huangは以前のCESおよびGTCの発表で述べました。3
AR1はCosmos-Reason1-7Bをベースに構築されています。これはNVIDIAがより広範なCosmosプラットフォームの一部としてリリースした推論ビジョン言語モデルです。4モデル、評価フレームワーク(AlpaSim)、トレーニングデータのサブセットは、非商用研究向けのオープンライセンスの下でGitHubとHugging Faceで利用可能です。
インフラストラクチャにとっての重要性
物理AIはLLMのようにスケールする:Cosmosプラットフォームは、言語モデルで機能したのと同じアプローチ(大規模基盤モデル、オープンウェイト、開発者ツール)をロボティクスと自律走行車に適用します。組織はゼロから構築する代わりに、プロプライエタリデータでAlpamayo-R1やCosmosモデルをファインチューニングできます。
シミュレーションが差別化要因に:LidarGenは合成ライダーデータを生成し、Cosmos Transferはシミュレーションをフォトリアリスティックビデオに変換し、ProtoMotions3は物理的に正確な環境でヒューマノイドロボットをトレーニングします。計算要件は大きく、単一のロボティクスポリシーのトレーニングには通常、H100クラスのハードウェアで1,000〜10,000 GPU時間が必要です。物理AIに参入する組織には、専用GPUクラスターまたはネオクラウドパートナーシップが必要です。
オープンソースが採用を加速:AR1をオープンにリリースすることで、NVIDIAはハードウェアスタックの採用を促進します。これらのモデルをトレーニングまたはファインチューニングするすべての組織がNVIDIA GPUで実行します。オープンモデル戦略はLLM開発で効果的であることが証明されました。NVIDIAはそれを物理AIに適用します。
ロボティクスエコシステムの成熟:Figure AI、1X、Agility Robotics、X-HumanoidがCosmosの上に構築していることは、ヒューマノイドロボティクス業界が共有インフラストラクチャに収束していることを示しています。これは、クラウドAI開発がPyTorchとトランスフォーマーアーキテクチャで標準化されたのと並行しています。
技術的詳細
NVIDIA DRIVE Alpamayo-R1アーキテクチャ
| コンポーネント | 仕様 |
|---|---|
| モデルベース | Cosmos-Reason1-7B |
| モデルタイプ | ビジョン・言語・アクション(VLA) |
| 主要機能 | 軌道計画のための思考連鎖推論 |
| トレーニングデータ | 1,727時間以上の運転データ(サブセットオープン) |
| 評価 | AlpaSIMフレームワーク(オープンソース) |
| 可用性 | GitHub、Hugging Face |
AR1の推論アプローチ:5 1. マルチモーダル入力を通じて環境を認識 2. 思考連鎖を使用して意思決定プロセスを推論 3. 軌道予測を生成 4. 自然言語の説明を通じてアクションを明確化
評価では、推論、軌道生成、アラインメント、安全性、レイテンシの指標で最先端のパフォーマンスを示しています。6
Cosmosプラットフォームコンポーネント
| モデル | 目的 | ユースケース |
|---|---|---|
| Cosmos Predict | 次フレーム生成 | エッジケースデータセット作成 |
| Cosmos Transfer | 構造化からフォトリアルビデオへ | 合成トレーニングデータ |
| Cosmos Reason | 思考連鎖評価 | 品質評価 |
| LidarGen | ライダーデータ合成 | AVシミュレーション |
| ProtoMotions3 | ヒューマノイドトレーニングフレームワーク | ロボットポリシー開発 |
LidarGen
AVシミュレーション用の合成ライダーデータを生成する初の世界モデル:7 - Cosmosアーキテクチャ上に構築 - レンジマップとポイントクラウドを生成 - 物理センサーデータ収集なしでライダーベースのシナリオテストを可能に - AV開発のための実世界データ要件を削減
ProtoMotions3
ヒューマノイドロボットトレーニング用のGPUアクセラレーテッドフレームワーク:8 - NVIDIA NewtonとIsaac Lab上に構築 - Cosmos WFM生成シーンを使用 - 物理的にシミュレートされたデジタルヒューマンとヒューマノイドロボットをトレーニング - ポリシーモデルは実際のハードウェア用にNVIDIA GR00T Nにエクスポート
業界の採用
Cosmos世界基盤モデルを使用している組織:9
| 企業 | アプリケーション |
|---|---|
| 1X | Cosmos Predict/TransferによるNEO Gammaヒューマノイドトレーニング |
| Agility Robotics | 大規模合成データ生成 |
| Figure AI | 物理AI開発 |
| Foretellix | AVテストと検証 |
| Gatik | 自律トラック輸送 |
| Oxa | ユニバーサル自律プラットフォーム |
| PlusAI | 自律トラック輸送 |
| X-Humanoid | ヒューマノイドロボティクス |
Agility RoboticsのCTO Pras Velagapudi氏:「Cosmosは、現実世界で実際に収集できる範囲を超えてフォトリアリスティックなトレーニングデータをスケールする機会を提供してくれます。」10
より広範なNeurIPSの発表
NVIDIAの研究者はNeurIPS 2025で70以上の論文、講演、ワークショップを発表しました。11追加のオープンリリースには以下が含まれます:
デジタルAIモデル: - MultiTalker Parakeet:マルチスピーカー環境向け音声認識 - Sortformer:話者ダイアライゼーションモデル - Nemotron Content Safety Reasoning:安全性評価
認知: - Artificial AnalysisのOpennness IndexはNVIDIA Nemotronファミリーを「AIエコシステムで最もオープンなものの1つ」と評価しました12
次のステップ
2026年:レベル4 AVプログラムでのAlpamayo-R1派生モデルの本番デプロイメント。
2026-2027年:ヒューマノイドロボットメーカーがCosmos/ProtoMotions3パイプラインでトレーニングされた製品を出荷。
継続中:Cosmosプラットフォームは専門分野(製造、物流、ヘルスケア)向けの追加の世界モデルで拡張。
市場への影響:Huangが言及する50兆ドルの製造・物流産業は、シミュレーションと推論のための大規模なGPUインフラストラクチャを必要とします。物理AIはLLMトレーニングを超えたNVIDIAの次の成長ベクトルを表しています。
主要なポイント
インフラストラクチャプランナー向け: - 物理AIシミュレーションにはH100クラスのハードウェアでロボティクスポリシーあたり1,000〜10,000 GPU時間が必要 - CosmosベースのワークフローはNVIDIAハードウェアの需要を促進;AV/ロボティクスプログラムに応じて予算を計上 - 合成データ生成は実世界データ収集の必要性を減らすが排除はしない - レベル4自律のタイムラインはAR1のような推論モデルの進歩に依存 - Isaac SimにはRTX 4090最低限が必要;本番トレーニングにはA100/H100クラスターが必要
オペレーションチーム向け: - 評価用のオープンモデルがGitHubとHugging Faceで利用可能 - AlpaSIMは標準化された評価フレームワークを提供 - ロボティクス開発用のIsaac Lab/Isaac Sim統合 - LidarGenはハードウェアなしでライダーシミュレーションを可能に
戦略的計画向け: - 物理AIはLLMのプレイブックに従う:基盤モデル、ファインチューニング、オープンエコシステム - ロボティクス業界はNVIDIAインフラストラクチャスタックに統合 - 1X、Figure AI、Agilityのタイミングは2026-2027年のヒューマノイド製品を示唆 - 製造/物流AIは次のインフラストラクチャ投資の波を表す
参考文献
物理AI開発をサポートするGPUインフラストラクチャについては、Introlにお問い合わせください。
-
NVIDIAブログ。「At NeurIPS, NVIDIA Advances Open Model Development for Digital and Physical AI.」2025年12月1日。 ↩
-
TechCrunch。「Nvidia announces new open AI models and tools for autonomous driving research.」2025年12月1日。 ↩
-
NVIDIAニュースルーム。「NVIDIA Launches Cosmos World Foundation Model Platform to Accelerate Physical AI Development.」2025年1月7日。 ↩
-
NVIDIA Research。「Alpamayo-R1: Bridging Reasoning and Action Prediction for Generalizable Autonomous Driving in the Long Tail.」2025年10月。 ↩
-
WinBuzzer。「Alpamayo-R1: NVIDIA Releases Vision Reasoning Model and Massive 1,727-Hour Dataset.」2025年12月2日。 ↩
-
NVIDIA Research。「Alpamayo-R1 Publication.」2025年。 ↩
-
NVIDIAブログ。「Physical AI Open Datasets.」2025年12月。 ↩
-
Edge AI and Vision Alliance。「NVIDIA Advances Open Model Development for Digital and Physical AI.」2025年12月。 ↩
-
NVIDIAニュースルーム。「NVIDIA Announces Major Release of Cosmos World Foundation Models and Physical AI Data Tools.」2025年3月18日。 ↩
-
NVIDIAニュースルーム。「Cosmos Platform Announcement.」2025年。 ↩
-
NVIDIAブログ。「NeurIPS 2025.」2025年12月。 ↩
-
Artificial Analysis。「Openness Index.」2025年。 ↩
-
Analytics India Magazine。「NVIDIA Open Sources Reasoning Model for Autonomous Driving at NeurIPS 2025.」2025年12月。 ↩
-
TechRepublic。「Nvidia Unveils Advances in Open Digital and Physical AI.」2025年12月。 ↩
-
Interesting Engineering。「NVIDIA debuts first open reasoning AI for self-driving vehicles.」2025年12月。 ↩