NVIDIA NeurIPS 2025: Alpamayo-R1 y el impulso de la IA física transforman los sistemas autónomos

NVIDIA lanza Alpamayo-R1, un modelo de razonamiento de 10B parámetros para conducción autónoma con latencia de 99ms y un conjunto de datos de 1.727 horas que abarca 25 países.

NVIDIA NeurIPS 2025: Alpamayo-R1 y el impulso de la IA física transforman los sistemas autónomos

NVIDIA NeurIPS 2025: Alpamayo-R1 y el impulso de la IA física transforman los sistemas autónomos

10 de diciembre de 2025 Escrito por Blake Crosley

NVIDIA presentó DRIVE Alpamayo-R1 (AR1), un modelo de acción de lenguaje visual con razonamiento de 10 mil millones de parámetros para movilidad, en NeurIPS 2025 en San Diego.1 El lanzamiento representa la mayor contribución de código abierto de NVIDIA a la investigación de conducción autónoma, acompañada de un conjunto de datos de 1.727 horas de conducción que abarca 25 países—aproximadamente tres veces el tamaño del Waymo Open Dataset.2 Los investigadores de NVIDIA presentaron más de 70 artículos y sesiones en la conferencia, señalando la expansión del papel de la empresa más allá del hardware hacia el desarrollo de modelos de IA.3

El lanzamiento de Alpamayo-R1 aborda un desafío fundamental en el desarrollo de vehículos autónomos: la opacidad de "caja negra" en la toma de decisiones de IA. AR1 genera un "proceso de pensamiento" intermedio antes de ejecutar acciones, permitiendo la inspección de cadenas de razonamiento en lugar de solo entradas y salidas.4 El enfoque aplica el razonamiento de IA con cadena de pensamiento a sistemas físicos del mundo real donde la explicabilidad afecta la seguridad y la aceptación regulatoria.

Arquitectura de Alpamayo-R1

NVIDIA DRIVE Alpamayo-R1 integra el razonamiento con cadena de pensamiento con la planificación de trayectorias—un componente crítico para avanzar en la seguridad de vehículos autónomos en escenarios viales complejos y habilitar la autonomía de Nivel 4.5

Especificaciones técnicas

Especificación Valor
Parámetros 10B (escalable desde variantes de 0.5B a 7B)
VRAM requerida Mínimo 24GB
Latencia de inferencia 99ms (capaz de tiempo real)
Datos de entrenamiento 1B+ imágenes de 80.000 horas de conducción
Entradas de cámara 4 cámaras a 10Hz (frontal-amplia, frontal-tele, cruzada-izquierda, cruzada-derecha)
Resolución de entrada 1080x1920 (submuestreada a 320x576)

El modelo logra una mejora del 12% en la precisión de planificación en casos desafiantes versus líneas base solo de trayectoria, con una reducción del 35% en la tasa de salida de carretera y una reducción del 25% en la tasa de encuentros cercanos en simulación de bucle cerrado.6

Fundamentos y diseño

Alpamayo-R1 se basa en el modelo de fundación Cosmos-Reason de NVIDIA, específicamente Cosmos-Reason1-7B post-entrenado en 3.7 millones de muestras de Preguntas y Respuestas Visuales para desarrollar sentido común físico y razonamiento incorporado.7 La arquitectura modular combina un codificador de visión, motor de razonamiento y decodificador de trayectoria basado en difusión para la generación de planes en tiempo real.

El diseño se aparta de las redes neuronales de extremo a extremo que mapean entradas directamente a salidas. En cambio, AR1 produce razonamiento intermedio que revisores humanos y sistemas de seguridad pueden evaluar. La explicabilidad apoya tanto la iteración de desarrollo como el cumplimiento regulatorio para sistemas autónomos.

Escala del conjunto de datos

El conjunto de datos acompañante contiene 1.727 horas de filmación de conducción de 25 países, estableciendo una diversidad geográfica y de escenarios sin precedentes para la investigación de conducción autónoma.7 La escala excede el Waymo Open Dataset en aproximadamente 3 veces, proporcionando datos de entrenamiento y evaluación sustancialmente más amplios.

NVIDIA lanzó un subconjunto de los datos de entrenamiento y evaluación a través de la colección Physical AI Open Datasets. El marco de código abierto AlpaSim permite a los investigadores evaluar el rendimiento de AR1 en benchmarks estandarizados.8 La combinación de modelo, datos y marco de evaluación proporciona infraestructura completa para la investigación de conducción autónoma.

Implicaciones de infraestructura

El impulso de IA física de NVIDIA crea requisitos de cómputo específicos que afectan la planificación de infraestructura.

Requisitos de entrenamiento

Los modelos de acción de lenguaje visual como Alpamayo-R1 requieren pipelines de entrenamiento multimodal que procesan datos de video, sensores y texto simultáneamente. El corpus de entrenamiento de más de 1B de imágenes requiere infraestructura de almacenamiento a escala de petabytes. La sobrecarga de procesamiento de video empuja los requisitos de cómputo 3-5 veces más alto que modelos equivalentes solo de texto.

Infraestructura mínima de entrenamiento: - Clúster de GPU con interconexiones NVLink/NVSwitch para sincronización eficiente de gradientes - Almacenamiento de alto ancho de banda (100+ GB/s agregado) para streaming de conjuntos de datos de video - Capacidad de almacenamiento de 10+ PB para conjuntos de datos de conducción multi-cámara - Costo estimado de entrenamiento: $500K-2M para entrenamiento completo del modelo desde cero

Las organizaciones que desarrollan sistemas autónomos deben planificar infraestructura que soporte cargas de trabajo de entrenamiento intensivas en video. El ajuste fino de Alpamayo-R1 para dominios específicos requiere significativamente menos cómputo—alcanzable en clústeres de 8 GPU con 24GB+ de VRAM por GPU.

Despliegue de inferencia

La inferencia de vehículos autónomos opera bajo estrictas restricciones de latencia—el objetivo de latencia de 99ms significa que las decisiones deben completarse dentro de un solo cuadro a 10Hz. NVIDIA DRIVE Orin entrega 254 TOPS a 65-70W, permitiendo inferencia AR1 en tiempo real en vehículos.9

Opciones de despliegue en el borde: | Plataforma | Rendimiento | Potencia | Caso de uso | |----------|-------------|-------|----------| | DRIVE Orin | 254 TOPS | 65-70W | Vehículos de producción | | DRIVE Thor | 1.000+ TOPS | ~100W | Sistemas L4 de próxima generación | | Jetson AGX Orin | 275 TOPS | 15-60W | Desarrollo/robótica |

El pipeline completo abarca desde clústeres de GPU en centros de datos para entrenamiento hasta cómputo embebido en vehículos para despliegue. Las organizaciones deben planificar ambos niveles de infraestructura.

Lanzamientos adicionales de NeurIPS

NVIDIA introdujo varios modelos y marcos adicionales que apoyan el desarrollo de IA en diversos dominios.

Modelos de IA digital

NVIDIA lanzó MultiTalker Parakeet, un modelo de reconocimiento de voz para entornos con múltiples hablantes, y Sortformer, un modelo de diarización que identifica y separa hablantes.9 Nemotron Content Safety Reasoning proporciona capacidades de moderación de contenido con razonamiento explícito.

Los lanzamientos expanden el ecosistema de software de NVIDIA más allá del hardware hacia componentes de IA de producción. Las organizaciones pueden desplegar modelos de NVIDIA en hardware de NVIDIA con integración optimizada. La integración vertical fortalece la posición de NVIDIA como proveedor de plataforma de IA en lugar de vendedor puramente de hardware.

Herramientas de desarrollo

NVIDIA liberó como código abierto la NeMo Data Designer Library bajo Apache 2.0, permitiendo la generación de datos sintéticos para entrenamiento.10 NeMo Gym proporciona entornos de aprendizaje por refuerzo para desarrollo de IA. Las herramientas reducen las barreras para el desarrollo de IA mientras crean dependencia del ecosistema en plataformas NVIDIA.

Las herramientas para datos sintéticos abordan las limitaciones de datos de entrenamiento que restringen el desarrollo de IA. Las organizaciones incapaces de recopilar suficientes datos del mundo real pueden generar alternativas sintéticas. La capacidad beneficia particularmente a los sistemas autónomos donde la recopilación de datos del mundo real involucra consideraciones de seguridad.

Dinámica competitiva

Los lanzamientos de modelos de NVIDIA afectan el posicionamiento competitivo tanto para hardware como para desarrollo de IA.

Estrategia de plataforma

Al lanzar modelos capaces que funcionan óptimamente en hardware NVIDIA, la empresa fortalece su posición en el ecosistema. Las organizaciones que usan modelos NVIDIA naturalmente despliegan en GPUs NVIDIA. La integración crea costos de cambio más allá de las especificaciones de hardware.

La estrategia es paralela al enfoque de Apple de integración hardware-software que crea dependencia de plataforma. NVIDIA se extiende desde chips a sistemas a modelos, cada capa reforzando las otras. Los competidores enfrentan desafíos para igualar la pila integrada.

Posicionamiento de código abierto

Los lanzamientos de código abierto posicionan a NVIDIA como participante colaborativo en el desarrollo de IA en lugar de proveedor puramente comercial. El posicionamiento apoya la percepción regulatoria y pública mientras la IA enfrenta mayor escrutinio. Los modelos y conjuntos de datos abiertos demuestran compromiso con el acceso de la comunidad de investigación.

Sin embargo, el rendimiento óptimo requiere hardware NVIDIA. La disponibilidad de código abierto democratiza el acceso mientras los despliegues comerciales se concentran en plataformas NVIDIA. El enfoque captura los beneficios de la apertura sin sacrificar la ventaja comercial.

Marco de decisión: cuándo adoptar Alpamayo-R1

Escenario Recomendación Justificación
Investigación/academia Adoptar inmediatamente Acceso de código abierto, conjunto de datos 3 veces mayor que alternativas
Startup de VA (pre-producción) Evaluar para ajuste fino Reduce tiempo de desarrollo, latencia probada de 99ms
Proveedor Tier 1 Comparar contra existente Explicabilidad de cadena de pensamiento ayuda a la aprobación regulatoria
Operador de flota Esperar validación de producción Requisitos de hardware (DRIVE Orin) pueden requerir actualizaciones de vehículos

Pasos accionables: 1. Descargar y evaluar: Acceder a Alpamayo-R1-10B desde Hugging Face (requiere mínimo 24GB de VRAM) 2. Comparar en tus escenarios: Usar el marco AlpaSim para evaluación estandarizada 3. Planificar infraestructura de almacenamiento: Presupuestar 10+ PB para desarrollo serio de IA física 4. Considerar ruta de ajuste fino: Clúster de 8 GPU suficiente para adaptación de dominio

Soporte profesional

La infraestructura de IA compleja se beneficia de socios de implementación experimentados.

Los 550 ingenieros de campo de Introl apoyan a organizaciones que despliegan infraestructura para sistemas autónomos y aplicaciones de IA física.14 La empresa ocupó el puesto #14 en el Inc. 5000 de 2025 con un crecimiento de 9.594% en tres años.15

El despliegue profesional en 257 ubicaciones globales aborda las necesidades de infraestructura de IA física independientemente de la geografía.16 La experiencia en implementación reduce el riesgo mientras las organizaciones adoptan capacidades emergentes de IA.

Conclusiones clave

Para desarrolladores de vehículos autónomos: - Alpamayo-R1 proporciona el primer modelo VLA de razonamiento a escala industrial de código abierto con latencia de 99ms en tiempo real - El razonamiento con cadena de pensamiento permite explicabilidad compatible con regulaciones - El conjunto de datos de 1.727 horas (3 veces Waymo) proporciona diversidad de entrenamiento sin precedentes

Para planificadores de infraestructura: - El entrenamiento requiere almacenamiento a escala de petabytes e interconexiones de GPU de alto ancho de banda - El ajuste fino es alcanzable en clústeres de 8 GPU con 24GB+ de VRAM - El despliegue en el borde apunta a DRIVE Orin (254 TOPS) o Thor (1.000+ TOPS)

Para planificación estratégica: - La integración vertical de NVIDIA (chips → sistemas → modelos) crea costos de cambio - La disponibilidad de código abierto permite la adopción pero el rendimiento óptimo requiere hardware NVIDIA - La infraestructura de IA física difiere significativamente de los despliegues de IA solo de texto

Perspectiva

Los lanzamientos de NVIDIA en NeurIPS 2025 demuestran una ambición en expansión desde hardware hacia modelos de IA y herramientas de desarrollo. Alpamayo-R1 avanza la investigación de conducción autónoma mientras establece a NVIDIA como contribuyente al desarrollo abierto de IA. Los lanzamientos fortalecen la posición de NVIDIA como proveedor integrado de plataforma de IA.

Las organizaciones que construyen sistemas autónomos o aplicaciones de IA física deben evaluar los lanzamientos de NeurIPS para acelerar el desarrollo. La combinación de modelos, conjuntos de datos y herramientas reduce la carga de desarrollo mientras la disponibilidad de código abierto permite la personalización para aplicaciones específicas. La planificación de infraestructura debe acomodar los requisitos de cómputo y datos que demandan estas aplicaciones avanzadas.

Referencias


Urgencia: Media — Lanzamientos de investigación con implicaciones para planificación de infraestructura Recuento de palabras: ~2.000


  1. NVIDIA. "At NeurIPS, NVIDIA Advances Open Model Development for Digital and Physical AI." December 2025. https://blogs.nvidia.com/blog/neurips-open-source-digital-physical-ai/ 

  2. WinBuzzer. "Alpamayo-R1: NVIDIA Releases Vision Reasoning Model and Massive 1,727-Hour Dataset." December 2025. https://winbuzzer.com/2025/12/02/alpamayo-r1-nvidia-releases-vision-reasoning-model-and-massive-1727-hour-dataset-for-autonomous-driving-xcxwbn/ 

  3. NVIDIA. "At NeurIPS, NVIDIA Advances Open Model Development." December 2025. 

  4. ContentGrip. "New Nvidia AI model brings reasoning to self-driving tech." December 2025. https://www.contentgrip.com/nvidia-alpamayo-r1-ai/ 

  5. TechCrunch. "Nvidia announces new open AI models and tools for autonomous driving research." December 2025. https://techcrunch.com/2025/12/01/nvidia-announces-new-open-ai-models-and-tools-for-autonomous-driving-research/ 

  6. NVIDIA Research. "Alpamayo-R1: Bridging Reasoning and Action Prediction for Generalizable Autonomous Driving." October 2025. https://research.nvidia.com/publication/2025-10_alpamayo-r1 

  7. Hugging Face. "nvidia/Alpamayo-R1-10B Model Card." December 2025. https://huggingface.co/nvidia/Alpamayo-R1-10B 

  8. NVIDIA Developer Forums. "Physical AI at NeurIPS 2025." December 2025. https://forums.developer.nvidia.com/t/physical-ai-at-neurips-2025-annoucements/353373 

  9. NVIDIA Developer. "DRIVE AGX Autonomous Vehicle Development Platform." 2025. https://developer.nvidia.com/drive/agx 

  10. MLQ AI. "NVIDIA Unveils Alpamayo-R1 and New AI Tools for Speech, Safety and Autonomous Driving." December 2025. https://mlq.ai/news/nvidia-unveils-alpamayo-r1-and-new-ai-tools-for-speech-safety-and-autonomous-driving-at-neurips-2025/ 

  11. NVIDIA. "At NeurIPS, NVIDIA Advances Open Model Development." December 2025. 

  12. ArXiv. "Alpamayo-R1: Bridging Reasoning and Action Prediction." 2511.00088. https://arxiv.org/abs/2511.00088 

  13. NVIDIA Blog. "Next-Gen Vehicles Built on NVIDIA DRIVE Orin." 2025. https://blogs.nvidia.com/blog/new-era-transportation-drive-orin/ 

  14. Introl. "Company Overview." Introl. 2025. https://introl.com 

  15. Inc. "Inc. 5000 2025." Inc. Magazine. 2025. 

  16. Introl. "Coverage Area." Introl. 2025. https://introl.com/coverage-area 

Request a Quote_

Tell us about your project and we'll respond within 72 hours.

> TRANSMISSION_COMPLETE

Request Received_

Thank you for your inquiry. Our team will review your request and respond within 72 hours.

QUEUED FOR PROCESSING