NVIDIA NeurIPS 2025: Alpamayo-R1 dan Dorongan Physical AI Membentuk Ulang Sistem Otonom

NVIDIA merilis Alpamayo-R1, model penalaran 10B parameter untuk mengemudi otonom dengan latensi 99ms dan dataset 1.727 jam yang mencakup 25 negara.

NVIDIA NeurIPS 2025: Alpamayo-R1 dan Dorongan Physical AI Membentuk Ulang Sistem Otonom

NVIDIA NeurIPS 2025: Alpamayo-R1 dan Dorongan Physical AI Membentuk Ulang Sistem Otonom

10 Desember 2025 Ditulis oleh Blake Crosley

NVIDIA merilis DRIVE Alpamayo-R1 (AR1), sebuah model aksi bahasa visual penalaran dengan 10 miliar parameter untuk mobilitas, di NeurIPS 2025 di San Diego.1 Peluncuran ini merupakan kontribusi open-source terbesar NVIDIA untuk penelitian mengemudi otonom, disertai dengan dataset mengemudi 1.727 jam yang mencakup 25 negara—kira-kira tiga kali ukuran Waymo Open Dataset.2 Peneliti NVIDIA mempresentasikan lebih dari 70 makalah dan sesi di konferensi, menandakan peran perusahaan yang meluas dari hardware ke pengembangan model AI.3

Peluncuran Alpamayo-R1 mengatasi tantangan fundamental dalam pengembangan kendaraan otonom: ketidakjelasan "kotak hitam" dalam pengambilan keputusan AI. AR1 menghasilkan "proses berpikir" antara sebelum mengeksekusi tindakan, memungkinkan inspeksi rantai penalaran bukan hanya input dan output.4 Pendekatan ini menerapkan penalaran AI rantai pemikiran ke sistem fisik dunia nyata di mana kemampuan penjelasan mempengaruhi keamanan dan penerimaan regulasi.

Arsitektur Alpamayo-R1

NVIDIA DRIVE Alpamayo-R1 mengintegrasikan penalaran rantai pemikiran dengan perencanaan jalur—komponen kritis untuk memajukan keselamatan kendaraan otonom dalam skenario jalan yang kompleks dan memungkinkan otonomi Level 4.5

Spesifikasi Teknis

Spesifikasi Nilai
Parameter 10B (dapat diskalakan dari varian 0,5B hingga 7B)
VRAM yang Diperlukan Minimum 24GB
Latensi Inferensi 99ms (mampu real-time)
Data Pelatihan 1B+ gambar dari 80.000 jam mengemudi
Input Kamera 4 kamera pada 10Hz (depan-lebar, depan-tele, silang-kiri, silang-kanan)
Resolusi Input 1080x1920 (didownsample ke 320x576)

Model ini mencapai peningkatan 12% dalam akurasi perencanaan pada kasus-kasus menantang dibandingkan baseline hanya-trajektori, dengan pengurangan 35% tingkat keluar jalur dan pengurangan 25% tingkat hampir bertabrakan dalam simulasi loop tertutup.6

Fondasi dan Desain

Alpamayo-R1 dibangun di atas model fondasi Cosmos-Reason NVIDIA, khususnya Cosmos-Reason1-7B yang di-post-train pada 3,7 juta sampel Visual Question Answering untuk mengembangkan akal sehat fisik dan penalaran terwujud.7 Arsitektur modular menggabungkan encoder visi, mesin penalaran, dan dekoder trajektori berbasis difusi untuk pembuatan rencana real-time.

Desain ini berbeda dari jaringan neural end-to-end yang memetakan input langsung ke output. Sebagai gantinya, AR1 menghasilkan penalaran antara yang dapat dievaluasi oleh peninjau manusia dan sistem keamanan. Kemampuan penjelasan mendukung iterasi pengembangan dan kepatuhan regulasi untuk sistem otonom.

Skala Dataset

Dataset yang menyertainya berisi 1.727 jam rekaman mengemudi dari 25 negara, menetapkan keragaman geografis dan skenario yang belum pernah terjadi sebelumnya untuk penelitian mengemudi otonom.7 Skalanya melebihi Waymo Open Dataset sekitar 3x, menyediakan data pelatihan dan evaluasi yang jauh lebih luas.

NVIDIA merilis subset data pelatihan dan evaluasi melalui koleksi Physical AI Open Datasets. Framework open-source AlpaSim memungkinkan peneliti mengevaluasi kinerja AR1 pada benchmark standar.8 Kombinasi model, data, dan framework evaluasi menyediakan infrastruktur lengkap untuk penelitian mengemudi otonom.

Implikasi Infrastruktur

Dorongan physical AI NVIDIA menciptakan persyaratan komputasi spesifik yang mempengaruhi perencanaan infrastruktur.

Persyaratan Pelatihan

Model vision-language-action seperti Alpamayo-R1 memerlukan pipeline pelatihan multimodal yang memproses data video, sensor, dan teks secara bersamaan. Korpus pelatihan 1B+ gambar memerlukan infrastruktur penyimpanan skala petabyte. Overhead pemrosesan video mendorong persyaratan komputasi 3-5x lebih tinggi dari model hanya-teks yang setara.

Infrastruktur pelatihan minimum: - Cluster GPU dengan interkoneksi NVLink/NVSwitch untuk sinkronisasi gradien yang efisien - Penyimpanan bandwidth tinggi (100+ GB/s agregat) untuk streaming dataset video - Kapasitas penyimpanan 10+ PB untuk dataset mengemudi multi-kamera - Perkiraan biaya pelatihan: $500K-2M untuk pelatihan model lengkap dari awal

Organisasi yang mengembangkan sistem otonom harus merencanakan infrastruktur yang mendukung beban kerja pelatihan intensif video. Fine-tuning Alpamayo-R1 untuk domain spesifik memerlukan komputasi yang jauh lebih sedikit—dapat dicapai pada cluster 8-GPU dengan 24GB+ VRAM per GPU.

Deployment Inferensi

Inferensi kendaraan otonom beroperasi di bawah batasan latensi yang ketat—target latensi 99ms berarti keputusan harus diselesaikan dalam satu frame pada 10Hz. NVIDIA DRIVE Orin memberikan 254 TOPS pada 65-70W, memungkinkan inferensi AR1 real-time di kendaraan.9

Opsi deployment edge: | Platform | Kinerja | Daya | Kasus Penggunaan | |----------|-------------|-------|----------| | DRIVE Orin | 254 TOPS | 65-70W | Kendaraan produksi | | DRIVE Thor | 1.000+ TOPS | ~100W | Sistem L4 generasi berikutnya | | Jetson AGX Orin | 275 TOPS | 15-60W | Pengembangan/robotika |

Pipeline lengkap mencakup dari cluster GPU pusat data untuk pelatihan hingga komputasi kendaraan tertanam untuk deployment. Organisasi harus merencanakan kedua tingkat infrastruktur.

Rilis NeurIPS Tambahan

NVIDIA memperkenalkan beberapa model dan framework tambahan yang mendukung pengembangan AI di berbagai domain.

Model AI Digital

NVIDIA merilis MultiTalker Parakeet, model pengenalan suara untuk lingkungan multi-pembicara, dan Sortformer, model diarisasi yang mengidentifikasi dan memisahkan pembicara.9 Nemotron Content Safety Reasoning menyediakan kemampuan moderasi konten dengan penalaran eksplisit.

Peluncuran ini memperluas ekosistem perangkat lunak NVIDIA dari hardware ke komponen AI produksi. Organisasi dapat men-deploy model NVIDIA pada hardware NVIDIA dengan integrasi yang dioptimalkan. Integrasi vertikal memperkuat posisi NVIDIA sebagai penyedia platform AI bukan hanya vendor hardware murni.

Alat Pengembangan

NVIDIA membuka NeMo Data Designer Library di bawah Apache 2.0, memungkinkan generasi data sintetis untuk pelatihan.10 NeMo Gym menyediakan lingkungan reinforcement learning untuk pengembangan AI. Alat-alat ini menurunkan hambatan pengembangan AI sambil menciptakan lock-in ekosistem pada platform NVIDIA.

Alat untuk data sintetis mengatasi keterbatasan data pelatihan yang membatasi pengembangan AI. Organisasi yang tidak dapat mengumpulkan data dunia nyata yang cukup dapat menghasilkan alternatif sintetis. Kemampuan ini sangat menguntungkan sistem otonom di mana pengumpulan data dunia nyata melibatkan pertimbangan keamanan.

Dinamika Kompetitif

Peluncuran model NVIDIA mempengaruhi posisi kompetitif baik untuk hardware maupun pengembangan AI.

Strategi Platform

Dengan merilis model yang mampu berjalan optimal pada hardware NVIDIA, perusahaan memperkuat posisi ekosistemnya. Organisasi yang menggunakan model NVIDIA secara alami men-deploy pada GPU NVIDIA. Integrasi menciptakan biaya switching di luar spesifikasi hardware.

Strategi ini paralel dengan pendekatan Apple tentang integrasi hardware-software yang menciptakan lock-in platform. NVIDIA meluas dari chip ke sistem ke model, setiap lapisan memperkuat yang lain. Pesaing menghadapi tantangan untuk menyamai stack terintegrasi.

Posisi Open Source

Peluncuran open source memposisikan NVIDIA sebagai peserta kolaboratif dalam pengembangan AI bukan vendor komersial murni. Posisi ini mendukung persepsi regulasi dan publik saat AI menghadapi pengawasan yang meningkat. Model dan dataset terbuka menunjukkan komitmen terhadap akses komunitas riset.

Namun, kinerja optimal memerlukan hardware NVIDIA. Ketersediaan open source mendemokratisasi akses sementara deployment komersial terkonsentrasi pada platform NVIDIA. Pendekatan ini menangkap manfaat keterbukaan tanpa mengorbankan keunggulan komersial.

Framework Keputusan: Kapan Mengadopsi Alpamayo-R1

Skenario Rekomendasi Alasan
Riset/akademik Adopsi segera Akses open-source, dataset 3x lebih besar dari alternatif
Startup AV (pra-produksi) Evaluasi untuk fine-tuning Mengurangi waktu pengembangan, latensi 99ms terbukti
Pemasok Tier 1 Benchmark terhadap yang ada Kemampuan penjelasan rantai pemikiran membantu persetujuan regulasi
Operator armada Tunggu validasi produksi Persyaratan hardware (DRIVE Orin) mungkin memerlukan pembaruan kendaraan

Langkah-langkah yang dapat ditindaklanjuti: 1. Unduh dan evaluasi: Akses Alpamayo-R1-10B dari Hugging Face (memerlukan minimum 24GB VRAM) 2. Benchmark pada skenario Anda: Gunakan framework AlpaSim untuk evaluasi standar 3. Rencanakan infrastruktur penyimpanan: Anggarkan 10+ PB untuk pengembangan physical AI serius 4. Pertimbangkan jalur fine-tuning: Cluster 8-GPU cukup untuk adaptasi domain

Dukungan Profesional

Infrastruktur AI yang kompleks mendapat manfaat dari mitra implementasi berpengalaman.

550 field engineer Introl mendukung organisasi yang men-deploy infrastruktur untuk sistem otonom dan aplikasi physical AI.14 Perusahaan ini menduduki peringkat #14 di Inc. 5000 2025 dengan pertumbuhan 9.594% selama tiga tahun.15

Deployment profesional di 257 lokasi global menangani kebutuhan infrastruktur physical AI terlepas dari geografi.16 Keahlian implementasi mengurangi risiko saat organisasi mengadopsi kemampuan AI yang muncul.

Poin Penting

Untuk pengembang kendaraan otonom: - Alpamayo-R1 menyediakan model VLA penalaran skala industri open pertama dengan latensi real-time 99ms - Penalaran rantai pemikiran memungkinkan kemampuan penjelasan ramah-regulasi - Dataset 1.727 jam (3x Waymo) menyediakan keragaman pelatihan yang belum pernah terjadi sebelumnya

Untuk perencana infrastruktur: - Pelatihan memerlukan penyimpanan skala petabyte dan interkoneksi GPU bandwidth tinggi - Fine-tuning dapat dicapai pada cluster 8-GPU dengan 24GB+ VRAM - Deployment edge menargetkan DRIVE Orin (254 TOPS) atau Thor (1.000+ TOPS)

Untuk perencanaan strategis: - Integrasi vertikal NVIDIA (chip → sistem → model) menciptakan biaya switching - Ketersediaan open-source memungkinkan adopsi tetapi kinerja optimal memerlukan hardware NVIDIA - Infrastruktur physical AI berbeda secara signifikan dari deployment AI hanya-teks

Pandangan

Peluncuran NeurIPS 2025 NVIDIA menunjukkan ambisi yang meluas dari hardware ke model AI dan alat pengembangan. Alpamayo-R1 memajukan penelitian mengemudi otonom sambil menetapkan NVIDIA sebagai kontributor pengembangan AI terbuka. Peluncuran ini memperkuat posisi NVIDIA sebagai penyedia platform AI terintegrasi.

Organisasi yang membangun sistem otonom atau aplikasi physical AI harus mengevaluasi peluncuran NeurIPS untuk akselerasi pengembangan. Kombinasi model, dataset, dan alat mengurangi beban pengembangan sementara ketersediaan open-source memungkinkan kustomisasi untuk aplikasi spesifik. Perencanaan infrastruktur harus mengakomodasi persyaratan komputasi dan data yang dituntut oleh aplikasi canggih ini.

Referensi


Urgensi: Sedang — Peluncuran riset dengan implikasi perencanaan infrastruktur Jumlah Kata: ~2.000


  1. NVIDIA. "At NeurIPS, NVIDIA Advances Open Model Development for Digital and Physical AI." December 2025. https://blogs.nvidia.com/blog/neurips-open-source-digital-physical-ai/ 

  2. WinBuzzer. "Alpamayo-R1: NVIDIA Releases Vision Reasoning Model and Massive 1,727-Hour Dataset." December 2025. https://winbuzzer.com/2025/12/02/alpamayo-r1-nvidia-releases-vision-reasoning-model-and-massive-1727-hour-dataset-for-autonomous-driving-xcxwbn/ 

  3. NVIDIA. "At NeurIPS, NVIDIA Advances Open Model Development." December 2025. 

  4. ContentGrip. "New Nvidia AI model brings reasoning to self-driving tech." December 2025. https://www.contentgrip.com/nvidia-alpamayo-r1-ai/ 

  5. TechCrunch. "Nvidia announces new open AI models and tools for autonomous driving research." December 2025. https://techcrunch.com/2025/12/01/nvidia-announces-new-open-ai-models-and-tools-for-autonomous-driving-research/ 

  6. NVIDIA Research. "Alpamayo-R1: Bridging Reasoning and Action Prediction for Generalizable Autonomous Driving." October 2025. https://research.nvidia.com/publication/2025-10_alpamayo-r1 

  7. Hugging Face. "nvidia/Alpamayo-R1-10B Model Card." December 2025. https://huggingface.co/nvidia/Alpamayo-R1-10B 

  8. NVIDIA Developer Forums. "Physical AI at NeurIPS 2025." December 2025. https://forums.developer.nvidia.com/t/physical-ai-at-neurips-2025-annoucements/353373 

  9. NVIDIA Developer. "DRIVE AGX Autonomous Vehicle Development Platform." 2025. https://developer.nvidia.com/drive/agx 

  10. MLQ AI. "NVIDIA Unveils Alpamayo-R1 and New AI Tools for Speech, Safety and Autonomous Driving." December 2025. https://mlq.ai/news/nvidia-unveils-alpamayo-r1-and-new-ai-tools-for-speech-safety-and-autonomous-driving-at-neurips-2025/ 

  11. NVIDIA. "At NeurIPS, NVIDIA Advances Open Model Development." December 2025. 

  12. ArXiv. "Alpamayo-R1: Bridging Reasoning and Action Prediction." 2511.00088. https://arxiv.org/abs/2511.00088 

  13. NVIDIA Blog. "Next-Gen Vehicles Built on NVIDIA DRIVE Orin." 2025. https://blogs.nvidia.com/blog/new-era-transportation-drive-orin/ 

  14. Introl. "Company Overview." Introl. 2025. https://introl.com 

  15. Inc. "Inc. 5000 2025." Inc. Magazine. 2025. 

  16. Introl. "Coverage Area." Introl. 2025. https://introl.com/coverage-area 

Request a Quote_

Tell us about your project and we'll respond within 72 hours.

> TRANSMISSION_COMPLETE

Request Received_

Thank you for your inquiry. Our team will review your request and respond within 72 hours.

QUEUED FOR PROCESSING