NVIDIA Physical AI op NeurIPS: Alpamayo-R1 en het Cosmos-ecosysteem

NVIDIA brengt Alpamayo-R1 uit, het eerste open reasoning VLA voor autonoom rijden. Het Cosmos-platform breidt uit met LidarGen en ProtoMotions3. Figure AI en 1X stappen in.

NVIDIA Physical AI op NeurIPS: Alpamayo-R1 en het Cosmos-ecosysteem

NVIDIA Physical AI op NeurIPS: Alpamayo-R1 en het Cosmos-ecosysteem

12 december 2025

Update december 2025: NVIDIA heeft op NeurIPS 2025 Alpamayo-R1 (AR1) uitgebracht, het eerste open reasoning vision-language-action model voor autonoom rijden. Het Cosmos-platform is uitgebreid met LidarGen voor simulatie en ProtoMotions3 voor humanoïde robotica. Figure AI, 1X, Agility Robotics en andere leiders in robotica bouwen voort op dit ecosysteem.


TL;DR

NVIDIA stelt de bouwstenen van physical AI open source beschikbaar. Alpamayo-R1 combineert chain-of-thought reasoning met trajectplanning voor autonome voertuigen—een capaciteit die voorheen achter propriëtaire systemen verborgen zat. Het Cosmos world foundation model-platform omvat nu videogeneratie, lidarsynthese en trainingstools voor humanoïde robots. Nu grote roboticabedrijven deze modellen adopteren, positioneert NVIDIA zich als de infrastructuurlaag voor robots en autonome voertuigen, vergelijkbaar met hoe het bedrijf domineert bij LLM-training.


Wat er gebeurde

NVIDIA onthulde Alpamayo-R1 (AR1) op NeurIPS 2025 in San Diego op 1 december, en omschreef het als "het eerste industrieschaal open reasoning vision language action (VLA) model ter wereld voor autonoom rijden."1

Het model integreert chain-of-thought AI-reasoning met padplanning. AR1 ontleedt rijscenario's stap voor stap, overweegt mogelijke trajecten en gebruikt vervolgens contextuele data om optimale routes te selecteren.2 De aanpak is bedoeld om de veiligheid te verbeteren in complexe, uitzonderlijke scenario's die traditionele AV-systemen uitdagen.

"Net zoals large language models een revolutie teweegbrachten in generatieve en agentic AI, vormen Cosmos world foundation models een doorbraak voor physical AI," verklaarde Jensen Huang tijdens de eerdere aankondigingen op CES en GTC.3

AR1 bouwt voort op Cosmos-Reason1-7B, een reasoning vision-language model dat NVIDIA uitbracht als onderdeel van het bredere Cosmos-platform.4 Het model, evaluatieframework (AlpaSim) en een subset van de trainingsdata zijn beschikbaar op GitHub en Hugging Face onder open licenties voor niet-commercieel onderzoek.


Waarom het belangrijk is voor infrastructuur

Physical AI schaalt zoals LLM's: Het Cosmos-platform past dezelfde aanpak toe die werkte voor taalmodellen (grote foundation models, open weights, ontwikkelaarstools) op robotica en autonome voertuigen. Organisaties kunnen Alpamayo-R1 of Cosmos-modellen finetunen op propriëtaire data in plaats van vanaf nul te bouwen.

Simulatie wordt onderscheidend: LidarGen genereert synthetische lidardata; Cosmos Transfer converteert simulaties naar fotorealistische video; ProtoMotions3 traint humanoïde robots in fysiek accurate omgevingen. De rekenvereisten zijn aanzienlijk: het trainen van één roboticabeleid vereist doorgaans 1.000-10.000 GPU-uren op H100-klasse hardware. Organisaties die physical AI betreden, hebben dedicated GPU-clusters of neocloud-partnerschappen nodig.

Open source versnelt adoptie: Door AR1 open uit te brengen, stimuleert NVIDIA de adoptie van zijn hardwarestack. Elke organisatie die deze modellen traint of finetunt, draait op NVIDIA GPU's. De open modelstrategie bleek effectief voor LLM-ontwikkeling; NVIDIA past deze toe op physical AI.

Robotica-ecosysteem rijpt: Figure AI, 1X, Agility Robotics en X-Humanoid die op Cosmos bouwen, signaleert dat de humanoïde robotica-industrie convergeert naar gedeelde infrastructuur. Dit loopt parallel met hoe cloud AI-ontwikkeling standaardiseerde op PyTorch en transformer-architecturen.


Technische details

NVIDIA DRIVE Alpamayo-R1-architectuur

Component Specificatie
Modelbasis Cosmos-Reason1-7B
Modeltype Vision-Language-Action (VLA)
Belangrijkste eigenschap Chain-of-thought reasoning voor trajectplanning
Trainingsdata 1.727+ uur rijdata (subset open)
Evaluatie AlpaSim framework (open source)
Beschikbaarheid GitHub, Hugging Face

AR1's reasoning-aanpak:5 1. Neemt omgeving waar via multi-modale inputs 2. Redeneert door besluitvormingsproces met chain-of-thought 3. Genereert trajectvoorspellingen 4. Articuleert acties via natuurlijke taalbeschrijvingen

Evaluaties tonen state-of-the-art prestaties op het gebied van reasoning, trajectgeneratie, alignment, veiligheid en latentiemetrieken.6

Cosmos-platformcomponenten

Model Doel Toepassing
Cosmos Predict Next-frame generatie Creatie van edge case-datasets
Cosmos Transfer Structured-to-photoreal video Synthetische trainingsdata
Cosmos Reason Chain-of-thought evaluatie Kwaliteitsbeoordeling
LidarGen Lidardatasynthese AV-simulatie
ProtoMotions3 Humanoïde trainingsframework Ontwikkeling roboticabeleid

LidarGen

Het eerste world model dat synthetische lidardata genereert voor AV-simulatie:7 - Gebouwd op Cosmos-architectuur - Genereert range maps en point clouds - Maakt lidar-gebaseerde scenariotests mogelijk zonder fysieke sensordataverzameling - Vermindert real-world datavereisten voor AV-ontwikkeling

ProtoMotions3

GPU-versneld framework voor training van humanoïde robots:8 - Gebouwd op NVIDIA Newton en Isaac Lab - Gebruikt door Cosmos WFM gegenereerde scènes - Traint fysiek gesimuleerde digitale mensen en humanoïde robots - Beleidsmodellen worden geëxporteerd naar NVIDIA GR00T N voor echte hardware

Industrieadoptie

Organisaties die Cosmos world foundation models gebruiken:9

Bedrijf Toepassing
1X NEO Gamma humanoïde training via Cosmos Predict/Transfer
Agility Robotics Grootschalige synthetische datageneratie
Figure AI Physical AI-ontwikkeling
Foretellix AV-testen en validatie
Gatik Autonoom vrachtvervoer
Oxa Universeel autonomieplatform
PlusAI Autonoom vrachtvervoer
X-Humanoid Humanoïde robotica

Agility Robotics CTO Pras Velagapudi: "Cosmos biedt ons de mogelijkheid om onze fotorealistische trainingsdata op te schalen voorbij wat we haalbaar in de echte wereld kunnen verzamelen."10


Bredere NeurIPS-aankondigingen

NVIDIA-onderzoekers presenteerden 70+ papers, talks en workshops op NeurIPS 2025.11 Aanvullende open releases omvatten:

Digital AI-modellen: - MultiTalker Parakeet: Spraakherkenning voor multi-speaker omgevingen - Sortformer: Speaker diarization model - Nemotron Content Safety Reasoning: Veiligheidsevaluatie

Erkenning: - Artificial Analysis Openness Index beoordeelde de NVIDIA Nemotron-familie als "een van de meest open in het AI-ecosysteem"12


Wat nu volgt

2026: Productie-implementaties van Alpamayo-R1-derivaten in Level 4 AV-programma's.

2026-2027: Fabrikanten van humanoïde robots leveren producten die getraind zijn op de Cosmos/ProtoMotions3-pipeline.

Doorlopend: Cosmos-platform breidt uit met aanvullende world models voor gespecialiseerde domeinen (productie, logistiek, gezondheidszorg).

Marktimpact: De productie- en logistieke industrieën ter waarde van $50 biljoen waar Huang naar verwijst, zullen enorme GPU-infrastructuur nodig hebben voor simulatie en inference. Physical AI vertegenwoordigt NVIDIA's volgende groeivector voorbij LLM-training.


Belangrijkste inzichten

Voor infrastructuurplanners: - Physical AI-simulatie vereist 1.000-10.000 GPU-uren per roboticabeleid op H100-klasse hardware - Cosmos-gebaseerde workflows stimuleren NVIDIA-hardwarevraag; budget dienovereenkomstig voor AV/roboticaprogramma's - Synthetische datageneratie vermindert maar elimineert niet de behoefte aan real-world dataverzameling - Level 4 autonomie-tijdlijnen zijn afhankelijk van vooruitgang in reasoning-modellen zoals AR1 - Isaac Sim draait minimaal op RTX 4090; productietraining vereist A100/H100-clusters

Voor operationele teams: - Open modellen beschikbaar op GitHub en Hugging Face voor evaluatie - AlpaSim biedt gestandaardiseerd evaluatieframework - Isaac Lab/Isaac Sim-integratie voor robotica-ontwikkeling - LidarGen maakt lidarsimulatie mogelijk zonder hardware

Voor strategische planning: - Physical AI volgt het LLM-draaiboek: foundation models, finetuning, open ecosysteem - Robotica-industrie consolideert op NVIDIA-infrastructuurstack - Timing van 1X, Figure AI, Agility suggereert humanoïde producten in 2026-2027 - Productie-/logistiek-AI vertegenwoordigt de volgende golf van infrastructuurinvesteringen


Referenties


Voor GPU-infrastructuur ter ondersteuning van physical AI-ontwikkeling, neem contact op met Introl.


  1. NVIDIA Blog. "At NeurIPS, NVIDIA Advances Open Model Development for Digital and Physical AI." 1 december 2025. 

  2. TechCrunch. "Nvidia announces new open AI models and tools for autonomous driving research." 1 december 2025. 

  3. NVIDIA Newsroom. "NVIDIA Launches Cosmos World Foundation Model Platform to Accelerate Physical AI Development." 7 januari 2025. 

  4. NVIDIA Research. "Alpamayo-R1: Bridging Reasoning and Action Prediction for Generalizable Autonomous Driving in the Long Tail." Oktober 2025. 

  5. WinBuzzer. "Alpamayo-R1: NVIDIA Releases Vision Reasoning Model and Massive 1,727-Hour Dataset." 2 december 2025. 

  6. NVIDIA Research. "Alpamayo-R1 Publication." 2025. 

  7. NVIDIA Blog. "Physical AI Open Datasets." December 2025. 

  8. Edge AI and Vision Alliance. "NVIDIA Advances Open Model Development for Digital and Physical AI." December 2025. 

  9. NVIDIA Newsroom. "NVIDIA Announces Major Release of Cosmos World Foundation Models and Physical AI Data Tools." 18 maart 2025. 

  10. NVIDIA Newsroom. "Cosmos Platform Announcement." 2025. 

  11. NVIDIA Blog. "NeurIPS 2025." December 2025. 

  12. Artificial Analysis. "Openness Index." 2025. 

  13. Analytics India Magazine. "NVIDIA Open Sources Reasoning Model for Autonomous Driving at NeurIPS 2025." December 2025. 

  14. TechRepublic. "Nvidia Unveils Advances in Open Digital and Physical AI." December 2025. 

  15. Interesting Engineering. "NVIDIA debuts first open reasoning AI for self-driving vehicles." December 2025. 

Offerte aanvragen_

Vertel ons over uw project en wij reageren binnen 72 uur.

> TRANSMISSIE_VOLTOOID

Aanvraag Ontvangen_

Bedankt voor uw aanvraag. Ons team zal uw verzoek beoordelen en binnen 72 uur reageren.

IN WACHTRIJ VOOR VERWERKING