NVIDIA NeurIPS 2025: Alpamayo-R1 dan Dorongan Physical AI Membentuk Ulang Sistem Otonom
10 Des 2025 Ditulis Oleh Blake Crosley
NVIDIA merilis DRIVE Alpamayo-R1 (AR1), model reasoning vision language action dengan 10 miliar parameter untuk mobilitas, di NeurIPS 2025 di San Diego.1 Rilis ini merupakan kontribusi AI open-source terbesar NVIDIA untuk penelitian kendaraan otonom, disertai dengan dataset mengemudi berdurasi 1.727 jam yang mencakup 25 negara—sekitar tiga kali ukuran Waymo Open Dataset.2 Peneliti NVIDIA mempresentasikan lebih dari 70 makalah dan sesi di konferensi tersebut, menandakan peran perusahaan yang semakin luas melampaui perangkat keras ke pengembangan model AI.3
Rilis Alpamayo-R1 mengatasi tantangan fundamental dalam pengembangan kendaraan otonom: ketidaktransparanan "black box" dari pengambilan keputusan AI. AR1 menghasilkan "proses berpikir" perantara sebelum mengeksekusi tindakan, memungkinkan inspeksi rantai penalaran dan bukan hanya input dan output.4 Pendekatan ini menerapkan penalaran AI chain-of-thought ke sistem fisik dunia nyata di mana kemampuan untuk dijelaskan memengaruhi keselamatan dan penerimaan regulasi.
Arsitektur Alpamayo-R1
NVIDIA DRIVE Alpamayo-R1 mengintegrasikan penalaran chain-of-thought dengan perencanaan jalur—komponen kritis untuk memajukan keselamatan kendaraan otonom dalam skenario jalan yang kompleks dan memungkinkan otonomi Level 4.5
Spesifikasi teknis
| Spesifikasi | Nilai |
|---|---|
| Parameter | 10B (dapat diskalakan dari varian 0,5B hingga 7B) |
| VRAM Diperlukan | Minimum 24GB |
| Latensi Inferensi | 99ms (mampu real-time) |
| Data Pelatihan | 1B+ gambar dari 80.000 jam mengemudi |
| Input Kamera | 4 kamera pada 10Hz (front-wide, front-tele, cross-left, cross-right) |
| Resolusi Input | 1080x1920 (di-downsample ke 320x576) |
Model ini mencapai peningkatan 12% dalam akurasi perencanaan pada kasus-kasus menantang dibandingkan baseline trajectory-only, dengan pengurangan 35% dalam off-road rate dan pengurangan 25% dalam close encounter rate dalam simulasi closed-loop.6
Fondasi dan desain
Alpamayo-R1 dibangun di atas model fondasi Cosmos-Reason dari NVIDIA, khususnya Cosmos-Reason1-7B yang di-post-train pada 3,7 juta sampel Visual Question Answering untuk mengembangkan common sense fisik dan penalaran embodied.7 Arsitektur modular menggabungkan vision encoder, reasoning engine, dan diffusion-based trajectory decoder untuk generasi rencana real-time.
Desain ini berbeda dari neural network end-to-end yang memetakan input langsung ke output. Sebaliknya, AR1 menghasilkan penalaran perantara yang dapat dievaluasi oleh peninjau manusia dan sistem keselamatan. Kemampuan untuk dijelaskan ini mendukung iterasi pengembangan dan kepatuhan regulasi untuk sistem otonom.
Skala dataset
Dataset yang menyertainya berisi 1.727 jam rekaman mengemudi dari 25 negara, menetapkan keragaman geografis dan skenario yang belum pernah ada sebelumnya untuk penelitian kendaraan otonom.7 Skalanya melebihi Waymo Open Dataset sekitar 3x, menyediakan data pelatihan dan evaluasi yang jauh lebih luas.
NVIDIA merilis subset data pelatihan dan evaluasi melalui koleksi Physical AI Open Datasets. Framework AlpaSim open-source memungkinkan peneliti mengevaluasi kinerja AR1 pada benchmark standar.[^8] Kombinasi model, data, dan framework evaluasi menyediakan infrastruktur lengkap untuk penelitian kendaraan otonom.
Implikasi infrastruktur
Dorongan physical AI dari NVIDIA menciptakan kebutuhan komputasi spesifik yang memengaruhi perencanaan infrastruktur.
Kebutuhan pelatihan
Model vision-language-action seperti Alpamayo-R1 memerlukan pipeline pelatihan multimodal yang memproses video, sensor, dan data teks secara bersamaan. Korpus pelatihan 1B+ gambar memerlukan infrastruktur penyimpanan skala petabyte. Overhead pemrosesan video mendorong kebutuhan komputasi 3-5x lebih tinggi dari model text-only yang setara.
Infrastruktur pelatihan minimum: - Kluster GPU dengan interkoneksi NVLink/NVSwitch untuk sinkronisasi gradien yang efisien - Penyimpanan bandwidth tinggi (100+ GB/s agregat) untuk streaming dataset video - Kapasitas penyimpanan 10+ PB untuk dataset mengemudi multi-kamera - Estimasi biaya pelatihan: $500K-2M untuk pelatihan model penuh dari awal
Organisasi yang mengembangkan sistem otonom harus merencanakan infrastruktur yang mendukung beban kerja pelatihan intensif video. Fine-tuning Alpamayo-R1 untuk domain spesifik memerlukan komputasi yang jauh lebih sedikit—dapat dicapai pada kluster 8-GPU dengan VRAM 24GB+ per GPU.
Deployment inferensi
Inferensi kendaraan otonom beroperasi di bawah batasan latensi yang ketat—target latensi 99ms berarti keputusan harus selesai dalam satu frame pada 10Hz. NVIDIA DRIVE Orin memberikan 254 TOPS pada 65-70W, memungkinkan inferensi AR1 real-time di kendaraan.[^9]
Opsi deployment edge: | Platform | Performa | Daya | Kasus Penggunaan | |----------|----------|------|------------------| | DRIVE Orin | 254 TOPS | 65-70W | Kendaraan produksi | | DRIVE Thor | 1.000+ TOPS | ~100W | Sistem L4 generasi berikutnya | | Jetson AGX Orin | 275 TOPS | 15-60W | Pengembangan/robotika |
Pipeline lengkap mencakup kluster GPU data center untuk pelatihan hingga komputasi tertanam kendaraan untuk deployment. Organisasi harus merencanakan kedua tier infrastruktur.
Rilis NeurIPS tambahan
NVIDIA memperkenalkan beberapa model dan framework tambahan yang mendukung pengembangan AI di berbagai domain.
Model Digital AI
NVIDIA merilis MultiTalker Parakeet, model pengenalan ucapan untuk lingkungan multi-pembicara, dan Sortformer, model diarisasi yang mengidentifikasi dan memisahkan pembicara.[^9] Nemotron Content Safety Reasoning menyediakan kemampuan moderasi konten dengan penalaran eksplisit.
Rilis ini memperluas ekosistem perangkat lunak NVIDIA melampaui perangkat keras ke komponen AI produksi. Organisasi dapat men-deploy model NVIDIA pada perangkat keras NVIDIA dengan integrasi yang dioptimalkan. Integrasi vertikal memperkuat posisi NVIDIA sebagai penyedia platform AI daripada vendor perangkat keras murni.
Alat pengembangan
NVIDIA membuka kode sumber NeMo Data Designer Library di bawah Apache 2.0, memungkinkan generasi data sintetis untuk pelatihan.[^10] NeMo Gym menyediakan lingkungan reinforcement learning untuk pengembangan AI. Alat-alat ini mengurangi hambatan untuk pengembangan AI sambil menciptakan lock-in ekosistem pada platform NVIDIA.
Alat untuk data sintetis mengatasi keterbatasan data pelatihan yang membatasi pengembangan AI. Organisasi yang tidak mampu mengumpulkan data dunia nyata yang cukup dapat menghasilkan alternatif sintetis. Kemampuan ini sangat bermanfaat bagi sistem otonom di mana pengumpulan data dunia nyata melibatkan pertimbangan keselamatan.
Dinamika kompetitif
Rilis model NVIDIA memengaruhi posisi kompetitif untuk perangkat keras dan pengembangan AI.
Strategi platform
Dengan merilis model-model capable yang berjalan optimal pada perangkat keras NVIDIA, perusahaan memperkuat posisi ekosistemnya. Organisasi yang menggunakan model NVIDIA secara alami men-deploy pada GPU NVIDIA. Integrasi ini menciptakan switching cost melampaui spesifikasi perangkat keras.
Strategi ini sejajar dengan pendekatan Apple tentang integrasi perangkat keras-perangkat lunak yang menciptakan lock-in platform. NVIDIA meluas dari chip ke sistem ke model, setiap lapisan memperkuat yang lain. Pesaing menghadapi tantangan untuk menyaingi stack terintegrasi tersebut.
Posisi open source
Rilis open-source memposisikan NVIDIA sebagai partisipan kolaboratif dalam pengembangan AI daripada vendor komersial murni. Posisi ini mendukung persepsi regulasi dan publik saat AI menghadapi pengawasan yang meningkat. Model dan dataset terbuka menunjukkan komitmen terhadap akses komunitas riset.
Namun, performa optimal memerlukan perangkat keras NVIDIA. Ketersediaan open-source mendemokratisasi akses sementara deployment komersial terkonsentrasi pada platform NVIDIA. Pendekatan ini menangkap manfaat keterbukaan tanpa mengorbankan keunggulan komersial.
Framework keputusan: kapan mengadopsi Alpamayo-R1
| Skenario | Rekomendasi | Alasan |
|---|---|---|
| Riset/akademisi | Adopsi segera | Akses open-source, dataset 3x lebih besar dari alternatif |
| Startup AV (pra-produksi) | Evaluasi untuk fine-tuning | Mengurangi waktu pengembangan, latensi 99ms terbukti |
| Pemasok Tier 1 | Benchmark terhadap yang ada | Kemampuan dijelaskan chain-of-thought membantu persetujuan regulasi |
| Operator armada | Tunggu validasi produksi | Kebutuhan perangkat keras (DRIVE Orin) mungkin memerlukan pembaruan kendaraan |
Langkah-langkah yang dapat ditindaklanjuti: 1. Unduh dan evaluasi: Akses Alpamayo-R1-10B dari Hugging Face (memerlukan minimum VRAM 24GB) 2. Benchmark pada skenario Anda: Gunakan framework AlpaSim untuk evaluasi standar 3. Rencanakan infrastruktur penyimpanan: Anggarkan 10+ PB untuk pengembangan physical AI serius 4. Pertimbangkan jalur fine-tuning: Kluster 8-GPU cukup untuk adaptasi domain
Dukungan profesional
Infrastruktur AI yang kompleks mendapat manfaat dari mitra implementasi yang berpengalaman.
550 field engineer Introl mendukung organisasi yang men-deploy infrastruktur untuk sistem otonom dan aplikasi physical AI.[^14] Perusahaan ini menduduki peringkat #14 di Inc. 5000 2025 dengan pertumbuhan tiga tahun sebesar 9.594%.[^15]
Deployment profesional di 257 lokasi global memenuhi kebutuhan infrastruktur physical AI terlepas dari geografinya.[^16] Keahlian implementasi mengurangi risiko saat organisasi mengadopsi kemampuan AI yang berkembang.
Poin-poin penting
Untuk pengembang kendaraan otonom: - Alpamayo-R1 menyediakan model VLA reasoning skala industri terbuka pertama dengan latensi real-time 99ms - Penalaran chain-of-thought memungkinkan kemampuan dijelaskan yang ramah regulasi - Dataset 1.727 jam (3x Waymo) menyediakan keragaman pelatihan yang belum pernah ada sebelumnya
Untuk perencana infrastruktur: - Pelatihan memerlukan penyimpanan skala petabyte dan interkoneksi GPU bandwidth tinggi - Fine-tuning dapat dicapai pada kluster 8-GPU dengan VRAM 24GB+ - Deployment edge menargetkan DRIVE Orin (254 TOPS) atau Thor (1.000+ TOPS)
Untuk perencanaan strategis: - Integrasi vertikal NVIDIA (chip → sistem → model) menciptakan switching cost - Ketersediaan open-source memungkinkan adopsi tetapi performa optimal memerlukan perangkat keras NVIDIA - Infrastruktur physical AI berbeda secara signifikan dari deployment AI text-only
Prospek
Rilis NeurIPS 2025 NVIDIA menunjukkan ambisi yang meluas dari perangkat keras ke model AI dan alat pengembangan. Alpamayo-R1 memajukan penelitian kendaraan otonom sambil menetapkan NVIDIA sebagai kontributor untuk pengembangan AI terbuka. Rilis ini memperkuat posisi NVIDIA sebagai penyedia platform AI terintegrasi.
Organisasi yang membangun sistem otonom atau aplikasi physical AI harus mengevaluasi rilis NeurIPS untuk akselerasi pengembangan. Kombinasi model, dataset, dan alat mengurangi beban pengembangan sementara ketersediaan open-source memungkinkan kustomisasi untuk aplikasi spesifik. Perencanaan infrastruktur harus mengakomodasi kebutuhan komputasi dan data yang dituntut oleh aplikasi canggih ini.
Referensi
[Konten dipotong untuk terjemahan]
-
NVIDIA. "At NeurIPS, NVIDIA Advances Open Model Development for Digital and Physical AI." Desember 2025. https://blogs.nvidia.com/blog/neurips-open-source-digital-physical-ai/ ↩
-
WinBuzzer. "Alpamayo-R1: NVIDIA Releases Vision Reasoning Model and Massive 1,727-Hour Dataset." Desember 2025. https://winbuzzer.com/2025/12/02/alpamayo-r1-nvidia-releases-vision-reasoning-model-and-massive-1727-hour-dataset-for-autonomous-driving-xcxwbn/ ↩
-
NVIDIA. "At NeurIPS, NVIDIA Advances Open Model Development." Desember 2025. ↩
-
ContentGrip. "New Nvidia AI model brings reasoning to self-driving tech." Desember 2025. https://www.contentgrip.com/nvidia-alpamayo-r1-ai/ ↩
-
TechCrunch. "Nvidia announces new open AI models and tools for autonomous driving research." Desember 2025. https://techcrunch.com/2025/12/01/nvidia-announces-new-open-ai-models-and-tools-for-autonomous-driving-research/ ↩
-
NVIDIA Research. "Alpamayo-R1: Bridging Reasoning and Action Prediction for Generalizable Autonomous Driving." Oktober 2025. https://research.nvidia.com/publication/2025-10_alpamayo-r1 ↩
-
Hugging Face. "nvidia/Alpamayo-R1-10B Model Card." Desember 2025. https://huggingface.co/nvi ↩↩