IA Física de NVIDIA en NeurIPS: Alpamayo-R1 y el Ecosistema Cosmos
12 de diciembre de 2025
Actualización de diciembre de 2025: NVIDIA lanzó Alpamayo-R1 (AR1) en NeurIPS 2025, el primer modelo de visión-lenguaje-acción de razonamiento abierto para conducción autónoma. La plataforma Cosmos se expandió con LidarGen para simulación y ProtoMotions3 para robótica humanoide. Figure AI, 1X, Agility Robotics y otros líderes en robótica están construyendo sobre este ecosistema.
Resumen Ejecutivo
NVIDIA está liberando como código abierto los componentes fundamentales de la IA física. Alpamayo-R1 combina razonamiento de cadena de pensamiento con planificación de trayectorias para vehículos autónomos—una capacidad anteriormente restringida a sistemas propietarios. La plataforma de modelos de fundación mundial Cosmos ahora incluye generación de video, síntesis de lidar y herramientas de entrenamiento para robots humanoides. Con importantes empresas de robótica adoptando estos modelos, NVIDIA se posiciona como la capa de infraestructura para robots y vehículos autónomos de la misma manera que domina el entrenamiento de LLMs.
Qué Ocurrió
NVIDIA presentó Alpamayo-R1 (AR1) en NeurIPS 2025 en San Diego el 1 de diciembre, describiéndolo como "el primer modelo de visión-lenguaje-acción (VLA) de razonamiento abierto a escala industrial del mundo para conducción autónoma."1
El modelo integra razonamiento de cadena de pensamiento de IA con planificación de rutas. AR1 descompone escenarios de conducción paso a paso, considera posibles trayectorias y luego utiliza datos contextuales para seleccionar rutas óptimas.2 El enfoque busca mejorar la seguridad en escenarios complejos y casos límite que desafían los sistemas tradicionales de vehículos autónomos.
"Así como los grandes modelos de lenguaje revolucionaron la IA generativa y agéntica, los modelos de fundación mundial Cosmos son un avance revolucionario para la IA física", declaró Jensen Huang en los anuncios anteriores de CES y GTC.3
AR1 se construye sobre Cosmos-Reason1-7B, un modelo de visión-lenguaje de razonamiento que NVIDIA lanzó como parte de la plataforma Cosmos más amplia.4 El modelo, el marco de evaluación (AlpaSim) y un subconjunto de datos de entrenamiento están disponibles en GitHub y Hugging Face bajo licencias abiertas para investigación no comercial.
Por Qué Importa para la Infraestructura
La IA Física Escala Como los LLMs: La plataforma Cosmos aplica el mismo enfoque que funcionó para los modelos de lenguaje (grandes modelos de fundación, pesos abiertos, herramientas para desarrolladores) a la robótica y los vehículos autónomos. Las organizaciones pueden ajustar Alpamayo-R1 o los modelos Cosmos con datos propietarios en lugar de construir desde cero.
La Simulación Se Convierte en Diferenciador: LidarGen genera datos lidar sintéticos; Cosmos Transfer convierte simulaciones en video fotorrealista; ProtoMotions3 entrena robots humanoides en entornos con física precisa. Los requisitos de cómputo son sustanciales: entrenar una sola política de robótica típicamente requiere 1,000-10,000 horas de GPU en hardware clase H100. Las organizaciones que entran en IA física necesitan clústeres de GPU dedicados o asociaciones con neoclouds.
El Código Abierto Acelera la Adopción: Al liberar AR1 abiertamente, NVIDIA impulsa la adopción de su stack de hardware. Cada organización que entrena o ajusta estos modelos lo hace en GPUs de NVIDIA. La estrategia de modelo abierto demostró ser efectiva para el desarrollo de LLMs; NVIDIA la aplica a la IA física.
El Ecosistema de Robótica Madura: Figure AI, 1X, Agility Robotics y X-Humanoid construyendo sobre Cosmos señala que la industria de robótica humanoide está convergiendo en infraestructura compartida. Esto es similar a cómo el desarrollo de IA en la nube se estandarizó en PyTorch y arquitecturas transformer.
Detalles Técnicos
Arquitectura de NVIDIA DRIVE Alpamayo-R1
| Componente | Especificación |
|---|---|
| Modelo Base | Cosmos-Reason1-7B |
| Tipo de Modelo | Visión-Lenguaje-Acción (VLA) |
| Característica Clave | Razonamiento de cadena de pensamiento para planificación de trayectorias |
| Datos de Entrenamiento | 1,727+ horas de datos de conducción (subconjunto abierto) |
| Evaluación | Marco AlpaSim (código abierto) |
| Disponibilidad | GitHub, Hugging Face |
Enfoque de razonamiento de AR1:5 1. Percibe el entorno a través de entradas multimodales 2. Razona a través del proceso de decisión usando cadena de pensamiento 3. Genera predicciones de trayectoria 4. Articula acciones a través de descripciones en lenguaje natural
Las evaluaciones muestran rendimiento de última generación en métricas de razonamiento, generación de trayectorias, alineación, seguridad y latencia.6
Componentes de la Plataforma Cosmos
| Modelo | Propósito | Caso de Uso |
|---|---|---|
| Cosmos Predict | Generación del siguiente fotograma | Creación de conjuntos de datos de casos límite |
| Cosmos Transfer | Video estructurado a fotorrealista | Datos de entrenamiento sintéticos |
| Cosmos Reason | Evaluación de cadena de pensamiento | Evaluación de calidad |
| LidarGen | Síntesis de datos lidar | Simulación de vehículos autónomos |
| ProtoMotions3 | Marco de entrenamiento humanoide | Desarrollo de políticas de robots |
LidarGen
El primer modelo mundial que genera datos lidar sintéticos para simulación de vehículos autónomos:7 - Construido sobre la arquitectura Cosmos - Genera mapas de rango y nubes de puntos - Permite pruebas de escenarios basadas en lidar sin recolección de datos de sensores físicos - Reduce los requisitos de datos del mundo real para el desarrollo de vehículos autónomos
ProtoMotions3
Marco acelerado por GPU para entrenamiento de robots humanoides:8 - Construido sobre NVIDIA Newton e Isaac Lab - Usa escenas generadas por Cosmos WFM - Entrena humanos digitales y robots humanoides simulados físicamente - Los modelos de política se exportan a NVIDIA GR00T N para hardware real
Adopción en la Industria
Organizaciones que utilizan los modelos de fundación mundial Cosmos:9
| Empresa | Aplicación |
|---|---|
| 1X | Entrenamiento del humanoide NEO Gamma vía Cosmos Predict/Transfer |
| Agility Robotics | Generación de datos sintéticos a gran escala |
| Figure AI | Desarrollo de IA física |
| Foretellix | Pruebas y validación de vehículos autónomos |
| Gatik | Transporte autónomo de carga |
| Oxa | Plataforma de autonomía universal |
| PlusAI | Transporte autónomo de carga |
| X-Humanoid | Robótica humanoide |
Pras Velagapudi, CTO de Agility Robotics: "Cosmos nos ofrece la oportunidad de escalar nuestros datos de entrenamiento fotorrealistas más allá de lo que podemos recopilar factiblemente en el mundo real."10
Anuncios Más Amplios de NeurIPS
Los investigadores de NVIDIA presentaron más de 70 artículos, charlas y talleres en NeurIPS 2025.11 Los lanzamientos abiertos adicionales incluyen:
Modelos de IA Digital: - MultiTalker Parakeet: Reconocimiento de voz para entornos con múltiples hablantes - Sortformer: Modelo de diarización de hablantes - Nemotron Content Safety Reasoning: Evaluación de seguridad
Reconocimientos: - El Índice de Apertura de Artificial Analysis calificó a la familia NVIDIA Nemotron como "entre las más abiertas en el ecosistema de IA"12
Qué Viene
2026: Despliegues en producción de derivados de Alpamayo-R1 en programas de vehículos autónomos Nivel 4.
2026-2027: Los fabricantes de robots humanoides envían productos entrenados con el pipeline de Cosmos/ProtoMotions3.
En curso: La plataforma Cosmos se expande con modelos mundiales adicionales para dominios especializados (manufactura, logística, salud).
Impacto en el Mercado: Las industrias de manufactura y logística de $50 billones que Huang menciona requerirán infraestructura masiva de GPU para simulación e inferencia. La IA física representa el próximo vector de crecimiento de NVIDIA más allá del entrenamiento de LLMs.
Conclusiones Clave
Para planificadores de infraestructura: - La simulación de IA física requiere 1,000-10,000 horas de GPU por política de robótica en hardware clase H100 - Los flujos de trabajo basados en Cosmos impulsan la demanda de hardware NVIDIA; presupueste en consecuencia para programas de vehículos autónomos/robótica - La generación de datos sintéticos reduce pero no elimina las necesidades de recolección de datos del mundo real - Los plazos de autonomía Nivel 4 dependen de avances en modelos de razonamiento como AR1 - Isaac Sim requiere RTX 4090 como mínimo; el entrenamiento en producción requiere clústeres A100/H100
Para equipos de operaciones: - Modelos abiertos disponibles en GitHub y Hugging Face para evaluación - AlpaSim proporciona un marco de evaluación estandarizado - Integración con Isaac Lab/Isaac Sim para desarrollo de robótica - LidarGen permite simulación de lidar sin hardware
Para planificación estratégica: - La IA física sigue el manual de los LLM: modelos de fundación, ajuste fino, ecosistema abierto - La industria de robótica se consolida en el stack de infraestructura de NVIDIA - Los tiempos de 1X, Figure AI y Agility sugieren productos humanoides en 2026-2027 - La IA para manufactura/logística representa la próxima ola de inversión en infraestructura
Referencias
Para infraestructura GPU que soporte el desarrollo de IA física, contacte a Introl.
-
NVIDIA Blog. "At NeurIPS, NVIDIA Advances Open Model Development for Digital and Physical AI." 1 de diciembre de 2025. ↩
-
TechCrunch. "Nvidia announces new open AI models and tools for autonomous driving research." 1 de diciembre de 2025. ↩
-
NVIDIA Newsroom. "NVIDIA Launches Cosmos World Foundation Model Platform to Accelerate Physical AI Development." 7 de enero de 2025. ↩
-
NVIDIA Research. "Alpamayo-R1: Bridging Reasoning and Action Prediction for Generalizable Autonomous Driving in the Long Tail." Octubre de 2025. ↩
-
WinBuzzer. "Alpamayo-R1: NVIDIA Releases Vision Reasoning Model and Massive 1,727-Hour Dataset." 2 de diciembre de 2025. ↩
-
NVIDIA Research. "Alpamayo-R1 Publication." 2025. ↩
-
NVIDIA Blog. "Physical AI Open Datasets." Diciembre de 2025. ↩
-
Edge AI and Vision Alliance. "NVIDIA Advances Open Model Development for Digital and Physical AI." Diciembre de 2025. ↩
-
NVIDIA Newsroom. "NVIDIA Announces Major Release of Cosmos World Foundation Models and Physical AI Data Tools." 18 de marzo de 2025. ↩
-
NVIDIA Newsroom. "Cosmos Platform Announcement." 2025. ↩
-
NVIDIA Blog. "NeurIPS 2025." Diciembre de 2025. ↩
-
Artificial Analysis. "Openness Index." 2025. ↩
-
Analytics India Magazine. "NVIDIA Open Sources Reasoning Model for Autonomous Driving at NeurIPS 2025." Diciembre de 2025. ↩
-
TechRepublic. "Nvidia Unveils Advances in Open Digital and Physical AI." Diciembre de 2025. ↩
-
Interesting Engineering. "NVIDIA debuts first open reasoning AI for self-driving vehicles." Diciembre de 2025. ↩