IA Physique de NVIDIA a NeurIPS : Alpamayo-R1 et l'Ecosysteme Cosmos
12 decembre 2025
Mise a jour de decembre 2025 : NVIDIA a lance Alpamayo-R1 (AR1) a NeurIPS 2025, le premier modele ouvert de raisonnement vision-langage-action pour la conduite autonome. La plateforme Cosmos s'est enrichie de LidarGen pour la simulation et de ProtoMotions3 pour la robotique humanoide. Figure AI, 1X, Agility Robotics et d'autres leaders de la robotique construisent sur cet ecosysteme.
Resume
NVIDIA libere en open source les composants fondamentaux de l'IA physique. Alpamayo-R1 combine le raisonnement en chaine de pensee avec la planification de trajectoires pour les vehicules autonomes, une capacite auparavant enfermee dans des systemes proprietaires. La plateforme de modeles fondamentaux Cosmos comprend desormais la generation video, la synthese lidar et des outils d'entrainement pour robots humanoides. Avec les principales entreprises de robotique adoptant ces modeles, NVIDIA se positionne comme la couche d'infrastructure pour les robots et les vehicules autonomes de la meme maniere qu'il domine l'entrainement des LLM.
Ce Qui S'Est Passe
NVIDIA a devoile Alpamayo-R1 (AR1) a NeurIPS 2025 a San Diego le 1er decembre, le decrivant comme "le premier modele ouvert de vision-langage-action (VLA) de raisonnement a l'echelle industrielle au monde pour la conduite autonome."1
Le modele integre le raisonnement IA en chaine de pensee avec la planification de trajectoires. AR1 decompose les scenarios de conduite etape par etape, considere les trajectoires possibles, puis utilise les donnees contextuelles pour selectionner les routes optimales.2 L'approche vise a ameliorer la securite dans les scenarios complexes et les cas limites qui defient les systemes AV traditionnels.
"Tout comme les grands modeles de langage ont revolutionne l'IA generative et agentique, les modeles fondamentaux Cosmos sont une percee pour l'IA physique," a declare Jensen Huang lors des annonces precedentes au CES et GTC.3
AR1 s'appuie sur Cosmos-Reason1-7B, un modele de raisonnement vision-langage que NVIDIA a publie dans le cadre de la plateforme Cosmos plus large.4 Le modele, le cadre d'evaluation (AlpaSim) et un sous-ensemble des donnees d'entrainement sont disponibles sur GitHub et Hugging Face sous licences ouvertes pour la recherche non commerciale.
Pourquoi C'Est Important Pour L'Infrastructure
L'IA Physique Evolue Comme Les LLMs : La plateforme Cosmos applique la meme approche qui a fonctionne pour les modeles de langage (grands modeles fondamentaux, poids ouverts, outils pour developpeurs) a la robotique et aux vehicules autonomes. Les organisations peuvent affiner Alpamayo-R1 ou les modeles Cosmos sur des donnees proprietaires plutot que de construire a partir de zero.
La Simulation Devient Un Differenciateur : LidarGen genere des donnees lidar synthetiques ; Cosmos Transfer convertit les simulations en video photorealiste ; ProtoMotions3 entraine des robots humanoides dans des environnements physiquement precis. Les exigences de calcul sont substantielles : l'entrainement d'une seule politique de robotique necessite generalement 1 000 a 10 000 heures-GPU sur du materiel de classe H100. Les organisations entrant dans l'IA physique ont besoin de clusters GPU dedies ou de partenariats avec des neoclouds.
L'Open Source Accelere L'Adoption : En liberant AR1 ouvertement, NVIDIA favorise l'adoption de sa pile materielle. Chaque organisation entrainant ou affinant ces modeles fonctionne sur des GPU NVIDIA. La strategie de modele ouvert s'est averee efficace pour le developpement des LLM ; NVIDIA l'applique a l'IA physique.
L'Ecosysteme Robotique Murit : Figure AI, 1X, Agility Robotics et X-Humanoid construisant sur Cosmos signale que l'industrie de la robotique humanoide converge vers une infrastructure partagee. Cela est parallele a la standardisation du developpement de l'IA cloud sur PyTorch et les architectures de transformateurs.
Details Techniques
Architecture NVIDIA DRIVE Alpamayo-R1
| Composant | Specification |
|---|---|
| Base du Modele | Cosmos-Reason1-7B |
| Type de Modele | Vision-Langage-Action (VLA) |
| Caracteristique Cle | Raisonnement en chaine de pensee pour la planification de trajectoires |
| Donnees d'Entrainement | 1 727+ heures de donnees de conduite (sous-ensemble ouvert) |
| Evaluation | Cadre AlpaSim (open source) |
| Disponibilite | GitHub, Hugging Face |
Approche de raisonnement d'AR1 :5 1. Percoit l'environnement a travers des entrees multimodales 2. Raisonne a travers le processus de decision en utilisant la chaine de pensee 3. Genere des predictions de trajectoire 4. Articule les actions a travers des descriptions en langage naturel
Les evaluations montrent des performances a l'etat de l'art sur les metriques de raisonnement, de generation de trajectoire, d'alignement, de securite et de latence.6
Composants de la Plateforme Cosmos
| Modele | Objectif | Cas d'Utilisation |
|---|---|---|
| Cosmos Predict | Generation de la trame suivante | Creation de jeux de donnees de cas limites |
| Cosmos Transfer | Video structure-vers-photorealiste | Donnees d'entrainement synthetiques |
| Cosmos Reason | Evaluation en chaine de pensee | Evaluation de la qualite |
| LidarGen | Synthese de donnees lidar | Simulation AV |
| ProtoMotions3 | Cadre d'entrainement humanoide | Developpement de politiques de robots |
LidarGen
Le premier modele mondial generant des donnees lidar synthetiques pour la simulation AV :7 - Construit sur l'architecture Cosmos - Genere des cartes de portee et des nuages de points - Permet des tests de scenarios bases sur le lidar sans collecte de donnees de capteurs physiques - Reduit les besoins en donnees du monde reel pour le developpement AV
ProtoMotions3
Cadre accelere par GPU pour l'entrainement de robots humanoides :8 - Construit sur NVIDIA Newton et Isaac Lab - Utilise des scenes generees par Cosmos WFM - Entraine des humains numeriques simules physiquement et des robots humanoides - Les modeles de politique s'exportent vers NVIDIA GR00T N pour le materiel reel
Adoption par l'Industrie
Organisations utilisant les modeles fondamentaux Cosmos :9
| Entreprise | Application |
|---|---|
| 1X | Entrainement de l'humanoide NEO Gamma via Cosmos Predict/Transfer |
| Agility Robotics | Generation de donnees synthetiques a grande echelle |
| Figure AI | Developpement de l'IA physique |
| Foretellix | Tests et validation AV |
| Gatik | Transport autonome |
| Oxa | Plateforme d'autonomie universelle |
| PlusAI | Transport autonome |
| X-Humanoid | Robotique humanoide |
Pras Velagapudi, CTO d'Agility Robotics : "Cosmos nous offre l'opportunite de faire evoluer nos donnees d'entrainement photorealistes au-dela de ce que nous pouvons raisonnablement collecter dans le monde reel."10
Annonces Plus Larges de NeurIPS
Les chercheurs de NVIDIA ont presente plus de 70 articles, conferences et ateliers a NeurIPS 2025.11 Les publications ouvertes supplementaires comprennent :
Modeles d'IA Numerique : - MultiTalker Parakeet : Reconnaissance vocale pour environnements multi-locuteurs - Sortformer : Modele de diarisation des locuteurs - Nemotron Content Safety Reasoning : Evaluation de la securite
Reconnaissance : - L'Indice d'Ouverture d'Artificial Analysis a classe la famille NVIDIA Nemotron "parmi les plus ouvertes de l'ecosysteme IA"12
Prochaines Etapes
2026 : Deploiements en production de derives d'Alpamayo-R1 dans les programmes AV de niveau 4.
2026-2027 : Les fabricants de robots humanoides livrent des produits entraines avec le pipeline Cosmos/ProtoMotions3.
En Cours : La plateforme Cosmos s'enrichit de modeles mondiaux supplementaires pour des domaines specialises (fabrication, logistique, sante).
Impact sur le Marche : Les industries de fabrication et de logistique de 50 billions de dollars auxquelles Huang fait reference necessiteront une infrastructure GPU massive pour la simulation et l'inference. L'IA physique represente le prochain vecteur de croissance de NVIDIA au-dela de l'entrainement des LLM.
Points Cles a Retenir
Pour les planificateurs d'infrastructure : - La simulation d'IA physique necessite 1 000 a 10 000 heures-GPU par politique de robotique sur du materiel de classe H100 - Les flux de travail bases sur Cosmos stimulent la demande de materiel NVIDIA ; budgetez en consequence pour les programmes AV/robotique - La generation de donnees synthetiques reduit mais n'elimine pas les besoins de collecte de donnees du monde reel - Les delais d'autonomie de niveau 4 dependent des avancees dans les modeles de raisonnement comme AR1 - Isaac Sim necessite au minimum une RTX 4090 ; l'entrainement en production necessite des clusters A100/H100
Pour les equipes d'operations : - Modeles ouverts disponibles sur GitHub et Hugging Face pour evaluation - AlpaSim fournit un cadre d'evaluation standardise - Integration Isaac Lab/Isaac Sim pour le developpement robotique - LidarGen permet la simulation lidar sans materiel
Pour la planification strategique : - L'IA physique suit le manuel des LLM : modeles fondamentaux, affinage, ecosysteme ouvert - L'industrie robotique se consolide sur la pile d'infrastructure NVIDIA - Le calendrier de 1X, Figure AI et Agility suggere des produits humanoides en 2026-2027 - L'IA de fabrication/logistique represente la prochaine vague d'investissement en infrastructure
References
Pour une infrastructure GPU soutenant le developpement de l'IA physique, contactez Introl.
-
Blog NVIDIA. "At NeurIPS, NVIDIA Advances Open Model Development for Digital and Physical AI." 1er decembre 2025. ↩
-
TechCrunch. "Nvidia announces new open AI models and tools for autonomous driving research." 1er decembre 2025. ↩
-
Salle de presse NVIDIA. "NVIDIA Launches Cosmos World Foundation Model Platform to Accelerate Physical AI Development." 7 janvier 2025. ↩
-
NVIDIA Research. "Alpamayo-R1: Bridging Reasoning and Action Prediction for Generalizable Autonomous Driving in the Long Tail." Octobre 2025. ↩
-
WinBuzzer. "Alpamayo-R1: NVIDIA Releases Vision Reasoning Model and Massive 1,727-Hour Dataset." 2 decembre 2025. ↩
-
NVIDIA Research. "Alpamayo-R1 Publication." 2025. ↩
-
Blog NVIDIA. "Physical AI Open Datasets." Decembre 2025. ↩
-
Edge AI and Vision Alliance. "NVIDIA Advances Open Model Development for Digital and Physical AI." Decembre 2025. ↩
-
Salle de presse NVIDIA. "NVIDIA Announces Major Release of Cosmos World Foundation Models and Physical AI Data Tools." 18 mars 2025. ↩
-
Salle de presse NVIDIA. "Cosmos Platform Announcement." 2025. ↩
-
Blog NVIDIA. "NeurIPS 2025." Decembre 2025. ↩
-
Artificial Analysis. "Openness Index." 2025. ↩
-
Analytics India Magazine. "NVIDIA Open Sources Reasoning Model for Autonomous Driving at NeurIPS 2025." Decembre 2025. ↩
-
TechRepublic. "Nvidia Unveils Advances in Open Digital and Physical AI." Decembre 2025. ↩
-
Interesting Engineering. "NVIDIA debuts first open reasoning AI for self-driving vehicles." Decembre 2025. ↩