IA Física de NVIDIA en NeurIPS: Alpamayo-R1 y el Ecosistema Cosmos

NVIDIA lanza Alpamayo-R1, el primer VLA de razonamiento abierto para conducción autónoma. La plataforma Cosmos se expande con LidarGen y ProtoMotions3. Figure AI y 1X adoptan el ecosistema.

IA Física de NVIDIA en NeurIPS: Alpamayo-R1 y el Ecosistema Cosmos

IA Física de NVIDIA en NeurIPS: Alpamayo-R1 y el Ecosistema Cosmos

12 de diciembre de 2025

Actualización de diciembre de 2025: NVIDIA lanzó Alpamayo-R1 (AR1) en NeurIPS 2025, el primer modelo de visión-lenguaje-acción de razonamiento abierto para conducción autónoma. La plataforma Cosmos se expandió con LidarGen para simulación y ProtoMotions3 para robótica humanoide. Figure AI, 1X, Agility Robotics y otros líderes en robótica están construyendo sobre este ecosistema.


Resumen Ejecutivo

NVIDIA está liberando como código abierto los componentes fundamentales de la IA física. Alpamayo-R1 combina razonamiento de cadena de pensamiento con planificación de trayectorias para vehículos autónomos—una capacidad anteriormente restringida a sistemas propietarios. La plataforma de modelos de fundación mundial Cosmos ahora incluye generación de video, síntesis de lidar y herramientas de entrenamiento para robots humanoides. Con importantes empresas de robótica adoptando estos modelos, NVIDIA se posiciona como la capa de infraestructura para robots y vehículos autónomos de la misma manera que domina el entrenamiento de LLMs.


Qué Ocurrió

NVIDIA presentó Alpamayo-R1 (AR1) en NeurIPS 2025 en San Diego el 1 de diciembre, describiéndolo como "el primer modelo de visión-lenguaje-acción (VLA) de razonamiento abierto a escala industrial del mundo para conducción autónoma."1

El modelo integra razonamiento de cadena de pensamiento de IA con planificación de rutas. AR1 descompone escenarios de conducción paso a paso, considera posibles trayectorias y luego utiliza datos contextuales para seleccionar rutas óptimas.2 El enfoque busca mejorar la seguridad en escenarios complejos y casos límite que desafían los sistemas tradicionales de vehículos autónomos.

"Así como los grandes modelos de lenguaje revolucionaron la IA generativa y agéntica, los modelos de fundación mundial Cosmos son un avance revolucionario para la IA física", declaró Jensen Huang en los anuncios anteriores de CES y GTC.3

AR1 se construye sobre Cosmos-Reason1-7B, un modelo de visión-lenguaje de razonamiento que NVIDIA lanzó como parte de la plataforma Cosmos más amplia.4 El modelo, el marco de evaluación (AlpaSim) y un subconjunto de datos de entrenamiento están disponibles en GitHub y Hugging Face bajo licencias abiertas para investigación no comercial.


Por Qué Importa para la Infraestructura

La IA Física Escala Como los LLMs: La plataforma Cosmos aplica el mismo enfoque que funcionó para los modelos de lenguaje (grandes modelos de fundación, pesos abiertos, herramientas para desarrolladores) a la robótica y los vehículos autónomos. Las organizaciones pueden ajustar Alpamayo-R1 o los modelos Cosmos con datos propietarios en lugar de construir desde cero.

La Simulación Se Convierte en Diferenciador: LidarGen genera datos lidar sintéticos; Cosmos Transfer convierte simulaciones en video fotorrealista; ProtoMotions3 entrena robots humanoides en entornos con física precisa. Los requisitos de cómputo son sustanciales: entrenar una sola política de robótica típicamente requiere 1,000-10,000 horas de GPU en hardware clase H100. Las organizaciones que entran en IA física necesitan clústeres de GPU dedicados o asociaciones con neoclouds.

El Código Abierto Acelera la Adopción: Al liberar AR1 abiertamente, NVIDIA impulsa la adopción de su stack de hardware. Cada organización que entrena o ajusta estos modelos lo hace en GPUs de NVIDIA. La estrategia de modelo abierto demostró ser efectiva para el desarrollo de LLMs; NVIDIA la aplica a la IA física.

El Ecosistema de Robótica Madura: Figure AI, 1X, Agility Robotics y X-Humanoid construyendo sobre Cosmos señala que la industria de robótica humanoide está convergiendo en infraestructura compartida. Esto es similar a cómo el desarrollo de IA en la nube se estandarizó en PyTorch y arquitecturas transformer.


Detalles Técnicos

Arquitectura de NVIDIA DRIVE Alpamayo-R1

Componente Especificación
Modelo Base Cosmos-Reason1-7B
Tipo de Modelo Visión-Lenguaje-Acción (VLA)
Característica Clave Razonamiento de cadena de pensamiento para planificación de trayectorias
Datos de Entrenamiento 1,727+ horas de datos de conducción (subconjunto abierto)
Evaluación Marco AlpaSim (código abierto)
Disponibilidad GitHub, Hugging Face

Enfoque de razonamiento de AR1:5 1. Percibe el entorno a través de entradas multimodales 2. Razona a través del proceso de decisión usando cadena de pensamiento 3. Genera predicciones de trayectoria 4. Articula acciones a través de descripciones en lenguaje natural

Las evaluaciones muestran rendimiento de última generación en métricas de razonamiento, generación de trayectorias, alineación, seguridad y latencia.6

Componentes de la Plataforma Cosmos

Modelo Propósito Caso de Uso
Cosmos Predict Generación del siguiente fotograma Creación de conjuntos de datos de casos límite
Cosmos Transfer Video estructurado a fotorrealista Datos de entrenamiento sintéticos
Cosmos Reason Evaluación de cadena de pensamiento Evaluación de calidad
LidarGen Síntesis de datos lidar Simulación de vehículos autónomos
ProtoMotions3 Marco de entrenamiento humanoide Desarrollo de políticas de robots

LidarGen

El primer modelo mundial que genera datos lidar sintéticos para simulación de vehículos autónomos:7 - Construido sobre la arquitectura Cosmos - Genera mapas de rango y nubes de puntos - Permite pruebas de escenarios basadas en lidar sin recolección de datos de sensores físicos - Reduce los requisitos de datos del mundo real para el desarrollo de vehículos autónomos

ProtoMotions3

Marco acelerado por GPU para entrenamiento de robots humanoides:8 - Construido sobre NVIDIA Newton e Isaac Lab - Usa escenas generadas por Cosmos WFM - Entrena humanos digitales y robots humanoides simulados físicamente - Los modelos de política se exportan a NVIDIA GR00T N para hardware real

Adopción en la Industria

Organizaciones que utilizan los modelos de fundación mundial Cosmos:9

Empresa Aplicación
1X Entrenamiento del humanoide NEO Gamma vía Cosmos Predict/Transfer
Agility Robotics Generación de datos sintéticos a gran escala
Figure AI Desarrollo de IA física
Foretellix Pruebas y validación de vehículos autónomos
Gatik Transporte autónomo de carga
Oxa Plataforma de autonomía universal
PlusAI Transporte autónomo de carga
X-Humanoid Robótica humanoide

Pras Velagapudi, CTO de Agility Robotics: "Cosmos nos ofrece la oportunidad de escalar nuestros datos de entrenamiento fotorrealistas más allá de lo que podemos recopilar factiblemente en el mundo real."10


Anuncios Más Amplios de NeurIPS

Los investigadores de NVIDIA presentaron más de 70 artículos, charlas y talleres en NeurIPS 2025.11 Los lanzamientos abiertos adicionales incluyen:

Modelos de IA Digital: - MultiTalker Parakeet: Reconocimiento de voz para entornos con múltiples hablantes - Sortformer: Modelo de diarización de hablantes - Nemotron Content Safety Reasoning: Evaluación de seguridad

Reconocimientos: - El Índice de Apertura de Artificial Analysis calificó a la familia NVIDIA Nemotron como "entre las más abiertas en el ecosistema de IA"12


Qué Viene

2026: Despliegues en producción de derivados de Alpamayo-R1 en programas de vehículos autónomos Nivel 4.

2026-2027: Los fabricantes de robots humanoides envían productos entrenados con el pipeline de Cosmos/ProtoMotions3.

En curso: La plataforma Cosmos se expande con modelos mundiales adicionales para dominios especializados (manufactura, logística, salud).

Impacto en el Mercado: Las industrias de manufactura y logística de $50 billones que Huang menciona requerirán infraestructura masiva de GPU para simulación e inferencia. La IA física representa el próximo vector de crecimiento de NVIDIA más allá del entrenamiento de LLMs.


Conclusiones Clave

Para planificadores de infraestructura: - La simulación de IA física requiere 1,000-10,000 horas de GPU por política de robótica en hardware clase H100 - Los flujos de trabajo basados en Cosmos impulsan la demanda de hardware NVIDIA; presupueste en consecuencia para programas de vehículos autónomos/robótica - La generación de datos sintéticos reduce pero no elimina las necesidades de recolección de datos del mundo real - Los plazos de autonomía Nivel 4 dependen de avances en modelos de razonamiento como AR1 - Isaac Sim requiere RTX 4090 como mínimo; el entrenamiento en producción requiere clústeres A100/H100

Para equipos de operaciones: - Modelos abiertos disponibles en GitHub y Hugging Face para evaluación - AlpaSim proporciona un marco de evaluación estandarizado - Integración con Isaac Lab/Isaac Sim para desarrollo de robótica - LidarGen permite simulación de lidar sin hardware

Para planificación estratégica: - La IA física sigue el manual de los LLM: modelos de fundación, ajuste fino, ecosistema abierto - La industria de robótica se consolida en el stack de infraestructura de NVIDIA - Los tiempos de 1X, Figure AI y Agility sugieren productos humanoides en 2026-2027 - La IA para manufactura/logística representa la próxima ola de inversión en infraestructura


Referencias


Para infraestructura GPU que soporte el desarrollo de IA física, contacte a Introl.


  1. NVIDIA Blog. "At NeurIPS, NVIDIA Advances Open Model Development for Digital and Physical AI." 1 de diciembre de 2025. 

  2. TechCrunch. "Nvidia announces new open AI models and tools for autonomous driving research." 1 de diciembre de 2025. 

  3. NVIDIA Newsroom. "NVIDIA Launches Cosmos World Foundation Model Platform to Accelerate Physical AI Development." 7 de enero de 2025. 

  4. NVIDIA Research. "Alpamayo-R1: Bridging Reasoning and Action Prediction for Generalizable Autonomous Driving in the Long Tail." Octubre de 2025. 

  5. WinBuzzer. "Alpamayo-R1: NVIDIA Releases Vision Reasoning Model and Massive 1,727-Hour Dataset." 2 de diciembre de 2025. 

  6. NVIDIA Research. "Alpamayo-R1 Publication." 2025. 

  7. NVIDIA Blog. "Physical AI Open Datasets." Diciembre de 2025. 

  8. Edge AI and Vision Alliance. "NVIDIA Advances Open Model Development for Digital and Physical AI." Diciembre de 2025. 

  9. NVIDIA Newsroom. "NVIDIA Announces Major Release of Cosmos World Foundation Models and Physical AI Data Tools." 18 de marzo de 2025. 

  10. NVIDIA Newsroom. "Cosmos Platform Announcement." 2025. 

  11. NVIDIA Blog. "NeurIPS 2025." Diciembre de 2025. 

  12. Artificial Analysis. "Openness Index." 2025. 

  13. Analytics India Magazine. "NVIDIA Open Sources Reasoning Model for Autonomous Driving at NeurIPS 2025." Diciembre de 2025. 

  14. TechRepublic. "Nvidia Unveils Advances in Open Digital and Physical AI." Diciembre de 2025. 

  15. Interesting Engineering. "NVIDIA debuts first open reasoning AI for self-driving vehicles." Diciembre de 2025. 

Solicitar Cotización_

Cuéntanos sobre tu proyecto y te responderemos en 72 horas.

> TRANSMISIÓN_COMPLETA

Solicitud Recibida_

Gracias por su consulta. Nuestro equipo revisará su solicitud y responderá dentro de 72 horas.

EN COLA PARA PROCESAMIENTO