NVIDIA Physical AI auf der NeurIPS: Alpamayo-R1 und das Cosmos-Ökosystem

NVIDIA veröffentlicht Alpamayo-R1, das erste offene Reasoning-VLA für autonomes Fahren. Die Cosmos-Plattform erweitert sich um LidarGen und ProtoMotions3. Figure AI und 1X setzen darauf.

NVIDIA Physical AI auf der NeurIPS: Alpamayo-R1 und das Cosmos-Ökosystem

NVIDIA Physical AI auf der NeurIPS: Alpamayo-R1 und das Cosmos-Ökosystem

12. Dezember 2025

Update Dezember 2025: NVIDIA hat auf der NeurIPS 2025 Alpamayo-R1 (AR1) vorgestellt – das erste offene Reasoning Vision-Language-Action-Modell für autonomes Fahren. Die Cosmos-Plattform wurde um LidarGen für Simulationen und ProtoMotions3 für humanoide Robotik erweitert. Figure AI, 1X, Agility Robotics und weitere führende Robotikunternehmen bauen auf diesem Ökosystem auf.


Kurzfassung

NVIDIA stellt die Bausteine der Physical AI als Open Source zur Verfügung. Alpamayo-R1 kombiniert Chain-of-Thought-Reasoning mit Trajektorienplanung für autonome Fahrzeuge – eine Fähigkeit, die bisher proprietären Systemen vorbehalten war. Die Cosmos World Foundation Model-Plattform umfasst nun Videogenerierung, Lidar-Synthese und Trainingstools für humanoide Roboter. Da führende Robotikunternehmen diese Modelle übernehmen, positioniert sich NVIDIA als Infrastrukturschicht für Roboter und autonome Fahrzeuge – ähnlich wie das Unternehmen bereits das LLM-Training dominiert.


Was geschehen ist

NVIDIA enthüllte Alpamayo-R1 (AR1) am 1. Dezember auf der NeurIPS 2025 in San Diego und beschrieb es als „das weltweit erste industrietaugliche offene Reasoning Vision Language Action (VLA)-Modell für autonomes Fahren."1

Das Modell integriert KI-gestütztes Chain-of-Thought-Reasoning mit Pfadplanung. AR1 analysiert Fahrsituationen Schritt für Schritt, erwägt mögliche Trajektorien und nutzt dann kontextbezogene Daten, um optimale Routen auszuwählen.2 Dieser Ansatz zielt darauf ab, die Sicherheit in komplexen Grenzfällen zu verbessern, die herkömmliche AV-Systeme herausfordern.

„So wie Large Language Models die generative und agentische KI revolutioniert haben, sind Cosmos World Foundation Models ein Durchbruch für Physical AI", erklärte Jensen Huang bei den früheren Ankündigungen auf CES und GTC.3

AR1 baut auf Cosmos-Reason1-7B auf, einem Reasoning Vision-Language-Modell, das NVIDIA als Teil der breiteren Cosmos-Plattform veröffentlicht hat.4 Das Modell, das Evaluierungsframework (AlpaSim) und eine Teilmenge der Trainingsdaten sind auf GitHub und Hugging Face unter offenen Lizenzen für nicht-kommerzielle Forschung verfügbar.


Bedeutung für die Infrastruktur

Physical AI skaliert wie LLMs: Die Cosmos-Plattform wendet den gleichen Ansatz an, der bei Sprachmodellen funktioniert hat (große Foundation Models, offene Gewichte, Entwicklertools), auf Robotik und autonome Fahrzeuge. Organisationen können Alpamayo-R1 oder Cosmos-Modelle auf proprietären Daten feintunen, anstatt bei null anzufangen.

Simulation wird zum Differenzierungsmerkmal: LidarGen erzeugt synthetische Lidar-Daten; Cosmos Transfer wandelt Simulationen in fotorealistische Videos um; ProtoMotions3 trainiert humanoide Roboter in physikalisch akkuraten Umgebungen. Die Rechenanforderungen sind erheblich: Das Training einer einzelnen Robotik-Policy erfordert typischerweise 1.000-10.000 GPU-Stunden auf Hardware der H100-Klasse. Organisationen, die in Physical AI einsteigen, benötigen dedizierte GPU-Cluster oder Neocloud-Partnerschaften.

Open Source beschleunigt die Adoption: Durch die offene Veröffentlichung von AR1 fördert NVIDIA die Adoption seines Hardware-Stacks. Jede Organisation, die diese Modelle trainiert oder feintuned, läuft auf NVIDIA-GPUs. Die Open-Model-Strategie hat sich bei der LLM-Entwicklung bewährt; NVIDIA wendet sie auf Physical AI an.

Das Robotik-Ökosystem reift: Dass Figure AI, 1X, Agility Robotics und X-Humanoid auf Cosmos aufbauen, signalisiert eine Konvergenz der humanoiden Robotikbranche auf gemeinsamer Infrastruktur. Dies entspricht der Standardisierung der Cloud-KI-Entwicklung auf PyTorch und Transformer-Architekturen.


Technische Details

NVIDIA DRIVE Alpamayo-R1 Architektur

Komponente Spezifikation
Modellbasis Cosmos-Reason1-7B
Modelltyp Vision-Language-Action (VLA)
Hauptmerkmal Chain-of-Thought-Reasoning für Trajektorienplanung
Trainingsdaten 1.727+ Stunden Fahrdaten (Teilmenge offen)
Evaluierung AlpaSim-Framework (Open Source)
Verfügbarkeit GitHub, Hugging Face

AR1s Reasoning-Ansatz:5 1. Wahrnehmung der Umgebung durch multimodale Eingaben 2. Durchdenken des Entscheidungsprozesses mittels Chain-of-Thought 3. Generierung von Trajektorienvorhersagen 4. Artikulation von Aktionen durch natürlichsprachliche Beschreibungen

Evaluierungen zeigen State-of-the-Art-Performance bei Reasoning, Trajektoriengenerierung, Alignment, Sicherheit und Latenzmetriken.6

Cosmos-Plattformkomponenten

Modell Zweck Anwendungsfall
Cosmos Predict Next-Frame-Generierung Erstellung von Edge-Case-Datensätzen
Cosmos Transfer Strukturiert-zu-fotoreales Video Synthetische Trainingsdaten
Cosmos Reason Chain-of-Thought-Evaluierung Qualitätsbewertung
LidarGen Lidar-Datensynthese AV-Simulation
ProtoMotions3 Framework für Humanoid-Training Entwicklung von Robot-Policies

LidarGen

Das erste World Model, das synthetische Lidar-Daten für AV-Simulation generiert:7 - Basiert auf der Cosmos-Architektur - Generiert Range Maps und Punktwolken - Ermöglicht Lidar-basiertes Szenariotesting ohne physische Sensordatenerfassung - Reduziert den Bedarf an realen Daten für die AV-Entwicklung

ProtoMotions3

GPU-beschleunigtes Framework für das Training humanoider Roboter:8 - Basiert auf NVIDIA Newton und Isaac Lab - Nutzt von Cosmos WFM generierte Szenen - Trainiert physikalisch simulierte digitale Menschen und humanoide Roboter - Policy-Modelle werden für echte Hardware nach NVIDIA GR00T N exportiert

Branchenadoption

Organisationen, die Cosmos World Foundation Models nutzen:9

Unternehmen Anwendung
1X NEO Gamma Humanoid-Training via Cosmos Predict/Transfer
Agility Robotics Großskalige synthetische Datengenerierung
Figure AI Physical-AI-Entwicklung
Foretellix AV-Tests und -Validierung
Gatik Autonomer Güterverkehr
Oxa Universelle Autonomieplattform
PlusAI Autonomer Güterverkehr
X-Humanoid Humanoide Robotik

Pras Velagapudi, CTO von Agility Robotics: „Cosmos bietet uns die Möglichkeit, unsere fotorealistischen Trainingsdaten über das hinaus zu skalieren, was wir in der realen Welt realistischerweise erfassen können."10


Weitere NeurIPS-Ankündigungen

NVIDIA-Forscher präsentierten auf der NeurIPS 2025 über 70 Papers, Vorträge und Workshops.11 Weitere offene Veröffentlichungen umfassen:

Digital-AI-Modelle: - MultiTalker Parakeet: Spracherkennung für Mehrsprecherumgebungen - Sortformer: Speaker-Diarization-Modell - Nemotron Content Safety Reasoning: Sicherheitsevaluierung

Auszeichnungen: - Der Artificial Analysis Openness Index bewertete die NVIDIA Nemotron-Familie als „eine der offensten im KI-Ökosystem"12


Ausblick

2026: Produktiveinsätze von Alpamayo-R1-Derivaten in Level-4-AV-Programmen.

2026-2027: Hersteller humanoider Roboter liefern Produkte aus, die mit der Cosmos/ProtoMotions3-Pipeline trainiert wurden.

Laufend: Die Cosmos-Plattform wird um weitere World Models für spezialisierte Bereiche erweitert (Fertigung, Logistik, Gesundheitswesen).

Marktauswirkungen: Die von Huang erwähnten Fertigungs- und Logistikbranchen mit einem Volumen von 50 Billionen Dollar werden massive GPU-Infrastruktur für Simulation und Inferenz benötigen. Physical AI stellt NVIDIAs nächsten Wachstumsvektor jenseits des LLM-Trainings dar.


Kernerkenntnisse

Für Infrastrukturplaner: - Physical-AI-Simulation erfordert 1.000-10.000 GPU-Stunden pro Robotik-Policy auf Hardware der H100-Klasse - Cosmos-basierte Workflows treiben die Nachfrage nach NVIDIA-Hardware; planen Sie entsprechend für AV/Robotik-Programme - Synthetische Datengenerierung reduziert, ersetzt aber nicht die Erfassung realer Daten - Level-4-Autonomie-Zeitpläne hängen von Fortschritten bei Reasoning-Modellen wie AR1 ab - Isaac Sim erfordert mindestens RTX 4090; Produktionstraining erfordert A100/H100-Cluster

Für Betriebsteams: - Offene Modelle auf GitHub und Hugging Face zur Evaluierung verfügbar - AlpaSim bietet ein standardisiertes Evaluierungsframework - Isaac Lab/Isaac Sim-Integration für Robotikentwicklung - LidarGen ermöglicht Lidar-Simulation ohne Hardware

Für strategische Planung: - Physical AI folgt dem LLM-Playbook: Foundation Models, Feintuning, offenes Ökosystem - Die Robotikbranche konsolidiert sich auf dem NVIDIA-Infrastruktur-Stack - Das Timing von 1X, Figure AI und Agility deutet auf humanoide Produkte in 2026-2027 hin - KI für Fertigung/Logistik repräsentiert die nächste Infrastruktur-Investitionswelle


Referenzen


Für GPU-Infrastruktur zur Unterstützung der Physical-AI-Entwicklung kontaktieren Sie Introl.


  1. NVIDIA Blog. "At NeurIPS, NVIDIA Advances Open Model Development for Digital and Physical AI." 1. Dezember 2025. 

  2. TechCrunch. "Nvidia announces new open AI models and tools for autonomous driving research." 1. Dezember 2025. 

  3. NVIDIA Newsroom. "NVIDIA Launches Cosmos World Foundation Model Platform to Accelerate Physical AI Development." 7. Januar 2025. 

  4. NVIDIA Research. "Alpamayo-R1: Bridging Reasoning and Action Prediction for Generalizable Autonomous Driving in the Long Tail." Oktober 2025. 

  5. WinBuzzer. "Alpamayo-R1: NVIDIA Releases Vision Reasoning Model and Massive 1,727-Hour Dataset." 2. Dezember 2025. 

  6. NVIDIA Research. "Alpamayo-R1 Publication." 2025. 

  7. NVIDIA Blog. "Physical AI Open Datasets." Dezember 2025. 

  8. Edge AI and Vision Alliance. "NVIDIA Advances Open Model Development for Digital and Physical AI." Dezember 2025. 

  9. NVIDIA Newsroom. "NVIDIA Announces Major Release of Cosmos World Foundation Models and Physical AI Data Tools." 18. März 2025. 

  10. NVIDIA Newsroom. "Cosmos Platform Announcement." 2025. 

  11. NVIDIA Blog. "NeurIPS 2025." Dezember 2025. 

  12. Artificial Analysis. "Openness Index." 2025. 

  13. Analytics India Magazine. "NVIDIA Open Sources Reasoning Model for Autonomous Driving at NeurIPS 2025." Dezember 2025. 

  14. TechRepublic. "Nvidia Unveils Advances in Open Digital and Physical AI." Dezember 2025. 

  15. Interesting Engineering. "NVIDIA debuts first open reasoning AI for self-driving vehicles." Dezember 2025. 

Angebot anfordern_

Erzählen Sie uns von Ihrem Projekt und wir antworten innerhalb von 72 Stunden.

> ÜBERTRAGUNG_ABGESCHLOSSEN

Anfrage erhalten_

Vielen Dank für Ihre Anfrage. Unser Team wird Ihre Anfrage prüfen und innerhalb von 72 Stunden antworten.

ZUR BEARBEITUNG EINGEREIHT