IA Física da NVIDIA no NeurIPS: Alpamayo-R1 e o Ecossistema Cosmos

NVIDIA lança Alpamayo-R1, primeiro VLA de raciocínio aberto para direção autônoma. Plataforma Cosmos expande com LidarGen, ProtoMotions3. Figure AI, 1X adotando.

IA Física da NVIDIA no NeurIPS: Alpamayo-R1 e o Ecossistema Cosmos

IA Física da NVIDIA no NeurIPS: Alpamayo-R1 e o Ecossistema Cosmos

12 de dezembro de 2025

Atualização de dezembro de 2025: A NVIDIA lançou o Alpamayo-R1 (AR1) no NeurIPS 2025, o primeiro modelo vision-language-action de raciocínio aberto para direção autônoma. A plataforma Cosmos expandiu com LidarGen para simulação e ProtoMotions3 para robótica humanoide. Figure AI, 1X, Agility Robotics e outros líderes em robótica estão construindo sobre o ecossistema.


Resumo

A NVIDIA está disponibilizando em código aberto os blocos de construção da IA física. O Alpamayo-R1 combina raciocínio em cadeia de pensamento com planejamento de trajetória para veículos autônomos—uma capacidade anteriormente restrita a sistemas proprietários. A plataforma de modelo de fundação mundial Cosmos agora inclui geração de vídeo, síntese de lidar e ferramentas de treinamento para robôs humanoides. Com grandes empresas de robótica adotando esses modelos, a NVIDIA se posiciona como a camada de infraestrutura para robôs e veículos autônomos da mesma forma que domina o treinamento de LLMs.


O Que Aconteceu

A NVIDIA apresentou o Alpamayo-R1 (AR1) no NeurIPS 2025 em San Diego em 1º de dezembro, descrevendo-o como "o primeiro modelo vision language action (VLA) de raciocínio aberto em escala industrial do mundo para direção autônoma."1

O modelo integra raciocínio de IA em cadeia de pensamento com planejamento de trajetória. O AR1 decompõe cenários de direção passo a passo, considera trajetórias possíveis e então usa dados contextuais para selecionar rotas ideais.2 A abordagem visa melhorar a segurança em cenários complexos e casos extremos que desafiam os sistemas tradicionais de veículos autônomos.

"Assim como os grandes modelos de linguagem revolucionaram a IA generativa e agêntica, os modelos de fundação mundial Cosmos são um avanço para a IA física," declarou Jensen Huang nos anúncios anteriores da CES e GTC.3

O AR1 é construído sobre o Cosmos-Reason1-7B, um modelo vision-language de raciocínio que a NVIDIA lançou como parte da plataforma Cosmos mais ampla.4 O modelo, framework de avaliação (AlpaSim) e subconjunto de dados de treinamento estão disponíveis no GitHub e Hugging Face sob licenças abertas para pesquisa não comercial.


Por Que Isso Importa para Infraestrutura

IA Física Escala Como LLMs: A plataforma Cosmos aplica a mesma abordagem que funcionou para modelos de linguagem (grandes modelos de fundação, pesos abertos, ferramentas para desenvolvedores) à robótica e veículos autônomos. Organizações podem fazer fine-tuning do Alpamayo-R1 ou modelos Cosmos em dados proprietários em vez de construir do zero.

Simulação Se Torna Diferencial: LidarGen gera dados sintéticos de lidar; Cosmos Transfer converte simulações em vídeo fotorrealista; ProtoMotions3 treina robôs humanoides em ambientes com física precisa. Os requisitos computacionais são substanciais: treinar uma única política de robótica tipicamente requer 1.000-10.000 horas de GPU em hardware classe H100. Organizações entrando na IA física precisam de clusters de GPU dedicados ou parcerias com neoclouds.

Código Aberto Acelera Adoção: Ao lançar o AR1 abertamente, a NVIDIA impulsiona a adoção de sua stack de hardware. Toda organização treinando ou fazendo fine-tuning desses modelos roda em GPUs NVIDIA. A estratégia de modelo aberto provou ser eficaz para o desenvolvimento de LLMs; a NVIDIA a aplica à IA física.

Ecossistema de Robótica Amadurece: Figure AI, 1X, Agility Robotics e X-Humanoid construindo sobre Cosmos sinaliza que a indústria de robótica humanoide está convergindo para infraestrutura compartilhada. Isso é paralelo a como o desenvolvimento de IA em nuvem se padronizou em PyTorch e arquiteturas transformer.


Detalhes Técnicos

Arquitetura do NVIDIA DRIVE Alpamayo-R1

Componente Especificação
Base do Modelo Cosmos-Reason1-7B
Tipo de Modelo Vision-Language-Action (VLA)
Característica Principal Raciocínio em cadeia de pensamento para planejamento de trajetória
Dados de Treinamento 1.727+ horas de dados de direção (subconjunto aberto)
Avaliação Framework AlpaSim (código aberto)
Disponibilidade GitHub, Hugging Face

Abordagem de raciocínio do AR1:5 1. Percebe o ambiente através de entradas multimodais 2. Raciocina através do processo de decisão usando cadeia de pensamento 3. Gera previsões de trajetória 4. Articula ações através de descrições em linguagem natural

Avaliações mostram desempenho estado da arte em métricas de raciocínio, geração de trajetória, alinhamento, segurança e latência.6

Componentes da Plataforma Cosmos

Modelo Propósito Caso de Uso
Cosmos Predict Geração do próximo frame Criação de dataset de casos extremos
Cosmos Transfer Vídeo estruturado para fotorrealista Dados de treinamento sintéticos
Cosmos Reason Avaliação em cadeia de pensamento Avaliação de qualidade
LidarGen Síntese de dados lidar Simulação de veículos autônomos
ProtoMotions3 Framework de treinamento humanoide Desenvolvimento de políticas de robôs

LidarGen

O primeiro modelo mundial gerando dados sintéticos de lidar para simulação de veículos autônomos:7 - Construído sobre arquitetura Cosmos - Gera mapas de alcance e nuvens de pontos - Permite testes de cenários baseados em lidar sem coleta de dados de sensores físicos - Reduz requisitos de dados do mundo real para desenvolvimento de veículos autônomos

ProtoMotions3

Framework acelerado por GPU para treinamento de robôs humanoides:8 - Construído sobre NVIDIA Newton e Isaac Lab - Usa cenas geradas pelo Cosmos WFM - Treina humanos digitais e robôs humanoides fisicamente simulados - Modelos de política exportam para NVIDIA GR00T N para hardware real

Adoção pela Indústria

Organizações usando modelos de fundação mundial Cosmos:9

Empresa Aplicação
1X Treinamento do humanoide NEO Gamma via Cosmos Predict/Transfer
Agility Robotics Geração de dados sintéticos em larga escala
Figure AI Desenvolvimento de IA física
Foretellix Testes e validação de veículos autônomos
Gatik Caminhões autônomos
Oxa Plataforma de autonomia universal
PlusAI Caminhões autônomos
X-Humanoid Robótica humanoide

Pras Velagapudi, CTO da Agility Robotics: "Cosmos nos oferece uma oportunidade de escalar nossos dados de treinamento fotorrealistas além do que podemos viabilmente coletar no mundo real."10


Anúncios Mais Amplos do NeurIPS

Pesquisadores da NVIDIA apresentaram mais de 70 artigos, palestras e workshops no NeurIPS 2025.11 Lançamentos abertos adicionais incluem:

Modelos de IA Digital: - MultiTalker Parakeet: Reconhecimento de fala para ambientes com múltiplos falantes - Sortformer: Modelo de diarização de falantes - Nemotron Content Safety Reasoning: Avaliação de segurança

Reconhecimento: - O Índice de Abertura da Artificial Analysis classificou a família NVIDIA Nemotron como "entre as mais abertas no ecossistema de IA"12


O Que Vem a Seguir

2026: Implantações em produção de derivados do Alpamayo-R1 em programas de veículos autônomos Nível 4.

2026-2027: Fabricantes de robôs humanoides lançam produtos treinados no pipeline Cosmos/ProtoMotions3.

Em andamento: Plataforma Cosmos expande com modelos mundiais adicionais para domínios especializados (manufatura, logística, saúde).

Impacto de Mercado: As indústrias de manufatura e logística de 50 trilhões de dólares que Huang referencia exigirão infraestrutura massiva de GPU para simulação e inferência. A IA física representa o próximo vetor de crescimento da NVIDIA além do treinamento de LLMs.


Principais Conclusões

Para planejadores de infraestrutura: - Simulação de IA física requer 1.000-10.000 horas de GPU por política de robótica em hardware classe H100 - Fluxos de trabalho baseados em Cosmos impulsionam demanda por hardware NVIDIA; orçamente adequadamente para programas de veículos autônomos/robótica - Geração de dados sintéticos reduz mas não elimina necessidades de coleta de dados do mundo real - Cronogramas de autonomia Nível 4 dependem de avanços em modelos de raciocínio como AR1 - Isaac Sim roda em RTX 4090 no mínimo; treinamento em produção requer clusters A100/H100

Para equipes de operações: - Modelos abertos disponíveis no GitHub e Hugging Face para avaliação - AlpaSim fornece framework de avaliação padronizado - Integração Isaac Lab/Isaac Sim para desenvolvimento de robótica - LidarGen permite simulação de lidar sem hardware

Para planejamento estratégico: - IA física segue o playbook de LLMs: modelos de fundação, fine-tuning, ecossistema aberto - Indústria de robótica consolidando na stack de infraestrutura NVIDIA - Cronograma de 1X, Figure AI, Agility sugere produtos humanoides em 2026-2027 - IA para manufatura/logística representa próxima onda de investimento em infraestrutura


Referências


Para infraestrutura de GPU que suporta desenvolvimento de IA física, entre em contato com Introl.


  1. NVIDIA Blog. "At NeurIPS, NVIDIA Advances Open Model Development for Digital and Physical AI." 1 de dezembro de 2025. 

  2. TechCrunch. "Nvidia announces new open AI models and tools for autonomous driving research." 1 de dezembro de 2025. 

  3. NVIDIA Newsroom. "NVIDIA Launches Cosmos World Foundation Model Platform to Accelerate Physical AI Development." 7 de janeiro de 2025. 

  4. NVIDIA Research. "Alpamayo-R1: Bridging Reasoning and Action Prediction for Generalizable Autonomous Driving in the Long Tail." Outubro de 2025. 

  5. WinBuzzer. "Alpamayo-R1: NVIDIA Releases Vision Reasoning Model and Massive 1,727-Hour Dataset." 2 de dezembro de 2025. 

  6. NVIDIA Research. "Alpamayo-R1 Publication." 2025. 

  7. NVIDIA Blog. "Physical AI Open Datasets." Dezembro de 2025. 

  8. Edge AI and Vision Alliance. "NVIDIA Advances Open Model Development for Digital and Physical AI." Dezembro de 2025. 

  9. NVIDIA Newsroom. "NVIDIA Announces Major Release of Cosmos World Foundation Models and Physical AI Data Tools." 18 de março de 2025. 

  10. NVIDIA Newsroom. "Cosmos Platform Announcement." 2025. 

  11. NVIDIA Blog. "NeurIPS 2025." Dezembro de 2025. 

  12. Artificial Analysis. "Openness Index." 2025. 

  13. Analytics India Magazine. "NVIDIA Open Sources Reasoning Model for Autonomous Driving at NeurIPS 2025." Dezembro de 2025. 

  14. TechRepublic. "Nvidia Unveils Advances in Open Digital and Physical AI." Dezembro de 2025. 

  15. Interesting Engineering. "NVIDIA debuts first open reasoning AI for self-driving vehicles." Dezembro de 2025. 

Solicitar Orçamento_

Conte-nos sobre seu projeto e responderemos em até 72 horas.

> TRANSMISSÃO_CONCLUÍDA

Solicitação Recebida_

Obrigado por sua consulta. Nossa equipe analisará sua solicitação e responderá em até 72 horas.

EM FILA PARA PROCESSAMENTO