IA Fisica de NVIDIA en NeurIPS: Alpamayo-R1 y el Ecosistema Cosmos

NVIDIA lanza Alpamayo-R1, el primer VLA de razonamiento abierto para conduccion autonoma. La plataforma Cosmos se expande con LidarGen y ProtoMotions3. Figure AI y 1X estan adoptando.

IA Fisica de NVIDIA en NeurIPS: Alpamayo-R1 y el Ecosistema Cosmos

IA Fisica de NVIDIA en NeurIPS: Alpamayo-R1 y el Ecosistema Cosmos

12 de diciembre de 2025

Actualizacion de diciembre de 2025: NVIDIA lanzo Alpamayo-R1 (AR1) en NeurIPS 2025, el primer modelo abierto de vision-lenguaje-accion con razonamiento para conduccion autonoma. La plataforma Cosmos se expandio con LidarGen para simulacion y ProtoMotions3 para robotica humanoide. Figure AI, 1X, Agility Robotics y otros lideres en robotica estan construyendo sobre este ecosistema.


Resumen

NVIDIA esta liberando como codigo abierto los componentes fundamentales de la IA fisica. Alpamayo-R1 combina el razonamiento de cadena de pensamiento con la planificacion de trayectorias para vehiculos autonomos, una capacidad que anteriormente estaba bloqueada detras de sistemas propietarios. La plataforma de modelos fundacionales Cosmos ahora incluye generacion de video, sintesis de lidar y herramientas de entrenamiento para robots humanoides. Con las principales companias de robotica adoptando estos modelos, NVIDIA se posiciona como la capa de infraestructura para robots y vehiculos autonomos de la misma manera que domina el entrenamiento de LLM.


Que Sucedio

NVIDIA presento Alpamayo-R1 (AR1) en NeurIPS 2025 en San Diego el 1 de diciembre, describiendolo como "el primer modelo abierto de vision-lenguaje-accion (VLA) con razonamiento a escala industrial del mundo para conduccion autonoma."1

El modelo integra el razonamiento de IA con cadena de pensamiento con la planificacion de rutas. AR1 descompone los escenarios de conduccion paso a paso, considera posibles trayectorias y luego utiliza datos contextuales para seleccionar rutas optimas.2 El enfoque busca mejorar la seguridad en escenarios complejos y casos limite que desafian los sistemas AV tradicionales.

"Asi como los modelos de lenguaje grandes revolucionaron la IA generativa y agencial, los modelos fundacionales Cosmos son un avance para la IA fisica," declaro Jensen Huang en los anuncios anteriores de CES y GTC.3

AR1 se basa en Cosmos-Reason1-7B, un modelo de vision-lenguaje con razonamiento que NVIDIA lanzo como parte de la plataforma Cosmos mas amplia.4 El modelo, el marco de evaluacion (AlpaSim) y un subconjunto de datos de entrenamiento estan disponibles en GitHub y Hugging Face bajo licencias abiertas para investigacion no comercial.


Por Que Importa para la Infraestructura

La IA Fisica Escala Como los LLMs: La plataforma Cosmos aplica el mismo enfoque que funciono para los modelos de lenguaje (grandes modelos fundacionales, pesos abiertos, herramientas para desarrolladores) a la robotica y los vehiculos autonomos. Las organizaciones pueden ajustar Alpamayo-R1 o los modelos Cosmos con datos propietarios en lugar de construir desde cero.

La Simulacion Se Convierte en Diferenciador: LidarGen genera datos lidar sinteticos; Cosmos Transfer convierte simulaciones en video fotorrealista; ProtoMotions3 entrena robots humanoides en entornos con fisica precisa. Los requisitos de computo son sustanciales: entrenar una sola politica de robotica tipicamente requiere 1,000-10,000 horas-GPU en hardware clase H100. Las organizaciones que ingresan a la IA fisica necesitan clusters de GPU dedicados o asociaciones con neoclouds.

El Codigo Abierto Acelera la Adopcion: Al lanzar AR1 abiertamente, NVIDIA impulsa la adopcion de su stack de hardware. Cada organizacion que entrena o ajusta estos modelos lo hace en GPUs de NVIDIA. La estrategia de modelo abierto demostro ser efectiva para el desarrollo de LLMs; NVIDIA la aplica a la IA fisica.

El Ecosistema de Robotica Madura: Figure AI, 1X, Agility Robotics y X-Humanoid construyendo sobre Cosmos senala que la industria de robotica humanoide esta convergiendo en infraestructura compartida. Esto es paralelo a como el desarrollo de IA en la nube se estandarizo en PyTorch y arquitecturas de transformadores.


Detalles Tecnicos

Arquitectura de NVIDIA DRIVE Alpamayo-R1

Componente Especificacion
Modelo Base Cosmos-Reason1-7B
Tipo de Modelo Vision-Lenguaje-Accion (VLA)
Caracteristica Clave Razonamiento de cadena de pensamiento para planificacion de trayectorias
Datos de Entrenamiento 1,727+ horas de datos de conduccion (subconjunto abierto)
Evaluacion Marco AlpaSim (codigo abierto)
Disponibilidad GitHub, Hugging Face

Enfoque de razonamiento de AR1:5 1. Percibe el entorno a traves de entradas multimodales 2. Razona a traves del proceso de decision usando cadena de pensamiento 3. Genera predicciones de trayectoria 4. Articula acciones a traves de descripciones en lenguaje natural

Las evaluaciones muestran rendimiento de vanguardia en metricas de razonamiento, generacion de trayectorias, alineacion, seguridad y latencia.6

Componentes de la Plataforma Cosmos

Modelo Proposito Caso de Uso
Cosmos Predict Generacion del siguiente fotograma Creacion de conjuntos de datos de casos limite
Cosmos Transfer Video estructurado a fotorrealista Datos de entrenamiento sinteticos
Cosmos Reason Evaluacion de cadena de pensamiento Evaluacion de calidad
LidarGen Sintesis de datos lidar Simulacion AV
ProtoMotions3 Marco de entrenamiento humanoide Desarrollo de politicas de robots

LidarGen

El primer modelo mundial que genera datos lidar sinteticos para simulacion AV:7 - Construido sobre la arquitectura Cosmos - Genera mapas de rango y nubes de puntos - Permite pruebas de escenarios basadas en lidar sin recopilacion de datos de sensores fisicos - Reduce los requisitos de datos del mundo real para el desarrollo de AV

ProtoMotions3

Marco acelerado por GPU para entrenamiento de robots humanoides:8 - Construido sobre NVIDIA Newton e Isaac Lab - Utiliza escenas generadas por Cosmos WFM - Entrena humanos digitales simulados fisicamente y robots humanoides - Los modelos de politica se exportan a NVIDIA GR00T N para hardware real

Adopcion de la Industria

Organizaciones que utilizan modelos fundacionales Cosmos:9

Compania Aplicacion
1X Entrenamiento del humanoide NEO Gamma via Cosmos Predict/Transfer
Agility Robotics Generacion de datos sinteticos a gran escala
Figure AI Desarrollo de IA fisica
Foretellix Pruebas y validacion de AV
Gatik Transporte autonomo
Oxa Plataforma de autonomia universal
PlusAI Transporte autonomo
X-Humanoid Robotica humanoide

Pras Velagapudi, CTO de Agility Robotics: "Cosmos nos ofrece una oportunidad de escalar nuestros datos de entrenamiento fotorrealistas mas alla de lo que podemos recopilar factiblemente en el mundo real."10


Anuncios Mas Amplios de NeurIPS

Investigadores de NVIDIA presentaron mas de 70 articulos, charlas y talleres en NeurIPS 2025.11 Los lanzamientos abiertos adicionales incluyen:

Modelos de IA Digital: - MultiTalker Parakeet: Reconocimiento de voz para entornos con multiples hablantes - Sortformer: Modelo de diarizacion de hablantes - Nemotron Content Safety Reasoning: Evaluacion de seguridad

Reconocimiento: - El Indice de Apertura de Artificial Analysis califico a la familia NVIDIA Nemotron "entre las mas abiertas del ecosistema de IA"12


Que Sigue

2026: Despliegues de produccion de derivados de Alpamayo-R1 en programas de AV Nivel 4.

2026-2027: Los fabricantes de robots humanoides envian productos entrenados con la pipeline Cosmos/ProtoMotions3.

Continuo: La plataforma Cosmos se expande con modelos mundiales adicionales para dominios especializados (manufactura, logistica, salud).

Impacto en el Mercado: Las industrias de manufactura y logistica de billones que Huang menciona requeriran infraestructura GPU masiva para simulacion e inferencia. La IA fisica representa el proximo vector de crecimiento de NVIDIA mas alla del entrenamiento de LLMs.


Conclusiones Clave

Para planificadores de infraestructura: - La simulacion de IA fisica requiere 1,000-10,000 horas-GPU por politica de robotica en hardware clase H100 - Los flujos de trabajo basados en Cosmos impulsan la demanda de hardware NVIDIA; presupueste en consecuencia para programas de AV/robotica - La generacion de datos sinteticos reduce pero no elimina las necesidades de recopilacion de datos del mundo real - Los plazos de autonomia Nivel 4 dependen de avances en modelos de razonamiento como AR1 - Isaac Sim requiere RTX 4090 minimo; el entrenamiento de produccion requiere clusters A100/H100

Para equipos de operaciones: - Modelos abiertos disponibles en GitHub y Hugging Face para evaluacion - AlpaSim proporciona un marco de evaluacion estandarizado - Integracion de Isaac Lab/Isaac Sim para desarrollo de robotica - LidarGen permite simulacion lidar sin hardware

Para planificacion estrategica: - La IA fisica sigue el manual de LLMs: modelos fundacionales, ajuste fino, ecosistema abierto - La industria de robotica se consolida en el stack de infraestructura de NVIDIA - El tiempo de 1X, Figure AI y Agility sugiere productos humanoides en 2026-2027 - La IA de manufactura/logistica representa la proxima ola de inversion en infraestructura


Referencias


Para infraestructura GPU que soporte el desarrollo de IA fisica, contacte a Introl.


  1. Blog de NVIDIA. "At NeurIPS, NVIDIA Advances Open Model Development for Digital and Physical AI." 1 de diciembre de 2025. 

  2. TechCrunch. "Nvidia announces new open AI models and tools for autonomous driving research." 1 de diciembre de 2025. 

  3. Sala de prensa de NVIDIA. "NVIDIA Launches Cosmos World Foundation Model Platform to Accelerate Physical AI Development." 7 de enero de 2025. 

  4. Investigacion de NVIDIA. "Alpamayo-R1: Bridging Reasoning and Action Prediction for Generalizable Autonomous Driving in the Long Tail." Octubre 2025. 

  5. WinBuzzer. "Alpamayo-R1: NVIDIA Releases Vision Reasoning Model and Massive 1,727-Hour Dataset." 2 de diciembre de 2025. 

  6. Investigacion de NVIDIA. "Alpamayo-R1 Publication." 2025. 

  7. Blog de NVIDIA. "Physical AI Open Datasets." Diciembre 2025. 

  8. Edge AI and Vision Alliance. "NVIDIA Advances Open Model Development for Digital and Physical AI." Diciembre 2025. 

  9. Sala de prensa de NVIDIA. "NVIDIA Announces Major Release of Cosmos World Foundation Models and Physical AI Data Tools." 18 de marzo de 2025. 

  10. Sala de prensa de NVIDIA. "Cosmos Platform Announcement." 2025. 

  11. Blog de NVIDIA. "NeurIPS 2025." Diciembre 2025. 

  12. Artificial Analysis. "Openness Index." 2025. 

  13. Analytics India Magazine. "NVIDIA Open Sources Reasoning Model for Autonomous Driving at NeurIPS 2025." Diciembre 2025. 

  14. TechRepublic. "Nvidia Unveils Advances in Open Digital and Physical AI." Diciembre 2025. 

  15. Interesting Engineering. "NVIDIA debuts first open reasoning AI for self-driving vehicles." Diciembre 2025. 

Request a Quote_

Tell us about your project and we'll respond within 72 hours.

> TRANSMISSION_COMPLETE

Request Received_

Thank you for your inquiry. Our team will review your request and respond within 72 hours.

QUEUED FOR PROCESSING