NVIDIA NeurIPS 2025: Alpamayo-R1 và Đẩy mạnh AI Vật lý Định hình lại Hệ thống Tự trị

NVIDIA phát hành Alpamayo-R1, mô hình suy luận 10B tham số cho lái xe tự động với độ trễ 99ms và bộ dữ liệu 1.727 giờ từ 25 quốc gia.

NVIDIA NeurIPS 2025: Alpamayo-R1 và Đẩy mạnh AI Vật lý Định hình lại Hệ thống Tự trị

NVIDIA NeurIPS 2025: Alpamayo-R1 và Đẩy mạnh AI Vật lý Định hình lại Hệ thống Tự trị

Ngày 10 tháng 12 năm 2025 Tác giả: Blake Crosley

NVIDIA đã phát hành DRIVE Alpamayo-R1 (AR1), một mô hình hành động ngôn ngữ thị giác suy luận 10 tỷ tham số cho di chuyển, tại NeurIPS 2025 ở San Diego.1 Bản phát hành này đại diện cho đóng góp mã nguồn mở lớn nhất của NVIDIA cho nghiên cứu lái xe tự động, đi kèm với bộ dữ liệu lái xe 1.727 giờ từ 25 quốc gia—gấp khoảng ba lần kích thước của Waymo Open Dataset.2 Các nhà nghiên cứu NVIDIA đã trình bày hơn 70 bài báo và phiên họp tại hội nghị, báo hiệu vai trò mở rộng của công ty từ phần cứng sang phát triển mô hình AI.3

Bản phát hành Alpamayo-R1 giải quyết một thách thức cơ bản trong phát triển xe tự lái: sự mờ đục "hộp đen" của việc ra quyết định AI. AR1 tạo ra một "quy trình suy nghĩ" trung gian trước khi thực hiện hành động, cho phép kiểm tra chuỗi suy luận thay vì chỉ đầu vào và đầu ra.4 Cách tiếp cận này áp dụng suy luận AI chuỗi suy nghĩ vào các hệ thống vật lý thực tế nơi khả năng giải thích ảnh hưởng đến an toàn và sự chấp nhận của cơ quan quản lý.

Kiến trúc Alpamayo-R1

NVIDIA DRIVE Alpamayo-R1 tích hợp suy luận chuỗi suy nghĩ với lập kế hoạch đường đi—một thành phần quan trọng để nâng cao an toàn xe tự lái trong các kịch bản đường phức tạp và cho phép tự trị Cấp độ 4.5

Thông số kỹ thuật

Thông số Giá trị
Tham số 10B (có thể mở rộng từ biến thể 0,5B đến 7B)
VRAM Yêu cầu Tối thiểu 24GB
Độ trễ suy luận 99ms (có khả năng thời gian thực)
Dữ liệu huấn luyện 1B+ hình ảnh từ 80.000 giờ lái xe
Đầu vào camera 4 camera ở 10Hz (trước-rộng, trước-tele, chéo-trái, chéo-phải)
Độ phân giải đầu vào 1080x1920 (giảm mẫu xuống 320x576)

Mô hình đạt được cải thiện 12% về độ chính xác lập kế hoạch trên các trường hợp thách thức so với đường cơ sở chỉ quỹ đạo, với giảm 35% tỷ lệ lạc đường và giảm 25% tỷ lệ va chạm suýt trong mô phỏng vòng kín.6

Nền tảng và Thiết kế

Alpamayo-R1 được xây dựng trên mô hình nền tảng Cosmos-Reason của NVIDIA, cụ thể là Cosmos-Reason1-7B được huấn luyện sau trên 3,7 triệu mẫu Hỏi Đáp Thị giác để phát triển kiến thức vật lý thông thường và suy luận hiện thân.7 Kiến trúc mô-đun kết hợp bộ mã hóa thị giác, động cơ suy luận và bộ giải mã quỹ đạo dựa trên khuếch tán để tạo kế hoạch thời gian thực.

Thiết kế này khác biệt với mạng nơ-ron đầu cuối ánh xạ đầu vào trực tiếp sang đầu ra. Thay vào đó, AR1 tạo ra suy luận trung gian mà người đánh giá và hệ thống an toàn có thể đánh giá. Khả năng giải thích hỗ trợ cả lặp lại phát triển và tuân thủ quy định cho các hệ thống tự trị.

Quy mô Bộ dữ liệu

Bộ dữ liệu đi kèm chứa 1.727 giờ cảnh quay lái xe từ 25 quốc gia, thiết lập sự đa dạng địa lý và kịch bản chưa từng có cho nghiên cứu lái xe tự động.7 Quy mô vượt quá Waymo Open Dataset khoảng 3 lần, cung cấp dữ liệu huấn luyện và đánh giá rộng hơn đáng kể.

NVIDIA đã phát hành một tập con dữ liệu huấn luyện và đánh giá thông qua bộ sưu tập Physical AI Open Datasets. Framework mã nguồn mở AlpaSim cho phép các nhà nghiên cứu đánh giá hiệu suất AR1 trên các benchmark chuẩn hóa.8 Sự kết hợp của mô hình, dữ liệu và framework đánh giá cung cấp cơ sở hạ tầng hoàn chỉnh cho nghiên cứu lái xe tự động.

Tác động Cơ sở hạ tầng

Đẩy mạnh AI vật lý của NVIDIA tạo ra các yêu cầu tính toán cụ thể ảnh hưởng đến kế hoạch cơ sở hạ tầng.

Yêu cầu Huấn luyện

Các mô hình hành động-ngôn ngữ-thị giác như Alpamayo-R1 yêu cầu các pipeline huấn luyện đa phương thức xử lý đồng thời dữ liệu video, cảm biến và văn bản. Kho huấn luyện 1B+ hình ảnh yêu cầu cơ sở hạ tầng lưu trữ quy mô petabyte. Chi phí xử lý video đẩy yêu cầu tính toán cao gấp 3-5 lần so với các mô hình chỉ văn bản tương đương.

Cơ sở hạ tầng huấn luyện tối thiểu: - Cụm GPU với kết nối NVLink/NVSwitch để đồng bộ gradient hiệu quả - Lưu trữ băng thông cao (100+ GB/s tổng hợp) để streaming bộ dữ liệu video - Dung lượng lưu trữ 10+ PB cho bộ dữ liệu lái xe đa camera - Chi phí huấn luyện ước tính: $500K-2M cho huấn luyện mô hình đầy đủ từ đầu

Các tổ chức phát triển hệ thống tự trị nên lên kế hoạch cơ sở hạ tầng hỗ trợ khối lượng công việc huấn luyện chuyên sâu video. Tinh chỉnh Alpamayo-R1 cho các lĩnh vực cụ thể yêu cầu ít tính toán hơn đáng kể—có thể đạt được trên cụm 8-GPU với 24GB+ VRAM mỗi GPU.

Triển khai Suy luận

Suy luận xe tự lái hoạt động dưới các ràng buộc độ trễ nghiêm ngặt—mục tiêu độ trễ 99ms có nghĩa là quyết định phải được hoàn thành trong một khung hình ở 10Hz. NVIDIA DRIVE Orin cung cấp 254 TOPS ở 65-70W, cho phép suy luận AR1 thời gian thực trong xe.9

Tùy chọn triển khai biên: | Nền tảng | Hiệu suất | Công suất | Trường hợp sử dụng | |----------|-------------|-------|----------| | DRIVE Orin | 254 TOPS | 65-70W | Xe sản xuất | | DRIVE Thor | 1.000+ TOPS | ~100W | Hệ thống L4 thế hệ tiếp theo | | Jetson AGX Orin | 275 TOPS | 15-60W | Phát triển/robot |

Pipeline đầy đủ trải dài từ cụm GPU trung tâm dữ liệu để huấn luyện đến tính toán nhúng xe để triển khai. Các tổ chức phải lên kế hoạch cho cả hai tầng cơ sở hạ tầng.

Các Phát hành NeurIPS Bổ sung

NVIDIA đã giới thiệu một số mô hình và framework bổ sung hỗ trợ phát triển AI trong các lĩnh vực khác nhau.

Mô hình AI Kỹ thuật số

NVIDIA phát hành MultiTalker Parakeet, một mô hình nhận dạng giọng nói cho môi trường đa người nói, và Sortformer, một mô hình phân tách người nói xác định và tách biệt người nói.9 Nemotron Content Safety Reasoning cung cấp khả năng kiểm duyệt nội dung với suy luận rõ ràng.

Các bản phát hành mở rộng hệ sinh thái phần mềm của NVIDIA từ phần cứng sang các thành phần AI sản xuất. Các tổ chức có thể triển khai mô hình NVIDIA trên phần cứng NVIDIA với tích hợp tối ưu hóa. Tích hợp dọc củng cố vị thế của NVIDIA như nhà cung cấp nền tảng AI thay vì nhà cung cấp phần cứng thuần túy.

Công cụ Phát triển

NVIDIA đã mở nguồn NeMo Data Designer Library theo Apache 2.0, cho phép tạo dữ liệu tổng hợp để huấn luyện.10 NeMo Gym cung cấp môi trường học tăng cường cho phát triển AI. Các công cụ giảm rào cản phát triển AI trong khi tạo ra sự phụ thuộc hệ sinh thái trên nền tảng NVIDIA.

Các công cụ cho dữ liệu tổng hợp giải quyết các hạn chế dữ liệu huấn luyện ràng buộc phát triển AI. Các tổ chức không thể thu thập đủ dữ liệu thực tế có thể tạo ra các giải pháp thay thế tổng hợp. Khả năng này đặc biệt có lợi cho các hệ thống tự trị nơi việc thu thập dữ liệu thực tế liên quan đến các cân nhắc an toàn.

Động lực Cạnh tranh

Các bản phát hành mô hình của NVIDIA ảnh hưởng đến vị thế cạnh tranh cho cả phần cứng và phát triển AI.

Chiến lược Nền tảng

Bằng cách phát hành các mô hình có khả năng chạy tối ưu trên phần cứng NVIDIA, công ty củng cố vị thế hệ sinh thái của mình. Các tổ chức sử dụng mô hình NVIDIA tự nhiên triển khai trên GPU NVIDIA. Tích hợp tạo ra chi phí chuyển đổi vượt ra ngoài thông số phần cứng.

Chiến lược này song song với cách tiếp cận của Apple về tích hợp phần cứng-phần mềm tạo ra sự phụ thuộc nền tảng. NVIDIA mở rộng từ chip sang hệ thống sang mô hình, mỗi lớp củng cố các lớp khác. Các đối thủ cạnh tranh đối mặt với thách thức trong việc phù hợp với ngăn xếp tích hợp.

Định vị Mã nguồn mở

Các bản phát hành mã nguồn mở định vị NVIDIA như một người tham gia hợp tác trong phát triển AI thay vì nhà cung cấp thương mại thuần túy. Định vị này hỗ trợ nhận thức của cơ quan quản lý và công chúng khi AI đối mặt với sự giám sát gia tăng. Các mô hình và bộ dữ liệu mở thể hiện cam kết với việc tiếp cận của cộng đồng nghiên cứu.

Tuy nhiên, hiệu suất tối ưu yêu cầu phần cứng NVIDIA. Tính khả dụng mã nguồn mở dân chủ hóa quyền truy cập trong khi các triển khai thương mại tập trung vào nền tảng NVIDIA. Cách tiếp cận này nắm bắt lợi ích của sự cởi mở mà không hy sinh lợi thế thương mại.

Khung Quyết định: Khi nào Áp dụng Alpamayo-R1

Kịch bản Khuyến nghị Lý do
Nghiên cứu/học thuật Áp dụng ngay Truy cập mã nguồn mở, bộ dữ liệu lớn gấp 3 lần các giải pháp thay thế
Startup AV (tiền sản xuất) Đánh giá để tinh chỉnh Giảm thời gian phát triển, độ trễ 99ms đã được chứng minh
Nhà cung cấp Tier 1 So sánh với hiện có Khả năng giải thích chuỗi suy nghĩ hỗ trợ phê duyệt quy định
Nhà điều hành đội xe Chờ xác nhận sản xuất Yêu cầu phần cứng (DRIVE Orin) có thể yêu cầu cập nhật xe

Các bước hành động: 1. Tải xuống và đánh giá: Truy cập Alpamayo-R1-10B từ Hugging Face (yêu cầu tối thiểu 24GB VRAM) 2. Benchmark trên kịch bản của bạn: Sử dụng framework AlpaSim để đánh giá chuẩn hóa 3. Lên kế hoạch cơ sở hạ tầng lưu trữ: Ngân sách 10+ PB cho phát triển AI vật lý nghiêm túc 4. Xem xét đường tinh chỉnh: Cụm 8-GPU đủ cho thích ứng miền

Hỗ trợ Chuyên nghiệp

Cơ sở hạ tầng AI phức tạp được hưởng lợi từ các đối tác triển khai có kinh nghiệm.

550 kỹ sư hiện trường của Introl hỗ trợ các tổ chức triển khai cơ sở hạ tầng cho các hệ thống tự trị và ứng dụng AI vật lý.14 Công ty xếp hạng #14 trong Inc. 5000 năm 2025 với tăng trưởng 9.594% trong ba năm.15

Triển khai chuyên nghiệp tại 257 địa điểm toàn cầu giải quyết nhu cầu cơ sở hạ tầng AI vật lý bất kể địa lý.16 Chuyên môn triển khai giảm rủi ro khi các tổ chức áp dụng các khả năng AI mới nổi.

Điểm mấu chốt

Cho các nhà phát triển xe tự lái: - Alpamayo-R1 cung cấp mô hình VLA suy luận quy mô công nghiệp mở đầu tiên với độ trễ thời gian thực 99ms - Suy luận chuỗi suy nghĩ cho phép khả năng giải thích thân thiện với quy định - Bộ dữ liệu 1.727 giờ (3x Waymo) cung cấp sự đa dạng huấn luyện chưa từng có

Cho các nhà quy hoạch cơ sở hạ tầng: - Huấn luyện yêu cầu lưu trữ quy mô petabyte và kết nối GPU băng thông cao - Tinh chỉnh có thể đạt được trên cụm 8-GPU với 24GB+ VRAM - Triển khai biên nhắm mục tiêu DRIVE Orin (254 TOPS) hoặc Thor (1.000+ TOPS)

Cho quy hoạch chiến lược: - Tích hợp dọc của NVIDIA (chip → hệ thống → mô hình) tạo ra chi phí chuyển đổi - Tính khả dụng mã nguồn mở cho phép áp dụng nhưng hiệu suất tối ưu yêu cầu phần cứng NVIDIA - Cơ sở hạ tầng AI vật lý khác biệt đáng kể với triển khai AI chỉ văn bản

Triển vọng

Các bản phát hành NeurIPS 2025 của NVIDIA thể hiện tham vọng mở rộng từ phần cứng sang mô hình AI và công cụ phát triển. Alpamayo-R1 thúc đẩy nghiên cứu lái xe tự động trong khi thiết lập NVIDIA như một người đóng góp cho phát triển AI mở. Các bản phát hành củng cố vị thế của NVIDIA như nhà cung cấp nền tảng AI tích hợp.

Các tổ chức xây dựng hệ thống tự trị hoặc ứng dụng AI vật lý nên đánh giá các bản phát hành NeurIPS để tăng tốc phát triển. Sự kết hợp của mô hình, bộ dữ liệu và công cụ giảm gánh nặng phát triển trong khi tính khả dụng mã nguồn mở cho phép tùy chỉnh cho các ứng dụng cụ thể. Quy hoạch cơ sở hạ tầng nên đáp ứng các yêu cầu tính toán và dữ liệu mà các ứng dụng tiên tiến này đòi hỏi.

Tài liệu tham khảo


Mức độ cấp bách: Trung bình — Bản phát hành nghiên cứu với tác động quy hoạch cơ sở hạ tầng Số từ: ~2.000


  1. NVIDIA. "At NeurIPS, NVIDIA Advances Open Model Development for Digital and Physical AI." December 2025. https://blogs.nvidia.com/blog/neurips-open-source-digital-physical-ai/ 

  2. WinBuzzer. "Alpamayo-R1: NVIDIA Releases Vision Reasoning Model and Massive 1,727-Hour Dataset." December 2025. https://winbuzzer.com/2025/12/02/alpamayo-r1-nvidia-releases-vision-reasoning-model-and-massive-1727-hour-dataset-for-autonomous-driving-xcxwbn/ 

  3. NVIDIA. "At NeurIPS, NVIDIA Advances Open Model Development." December 2025. 

  4. ContentGrip. "New Nvidia AI model brings reasoning to self-driving tech." December 2025. https://www.contentgrip.com/nvidia-alpamayo-r1-ai/ 

  5. TechCrunch. "Nvidia announces new open AI models and tools for autonomous driving research." December 2025. https://techcrunch.com/2025/12/01/nvidia-announces-new-open-ai-models-and-tools-for-autonomous-driving-research/ 

  6. NVIDIA Research. "Alpamayo-R1: Bridging Reasoning and Action Prediction for Generalizable Autonomous Driving." October 2025. https://research.nvidia.com/publication/2025-10_alpamayo-r1 

  7. Hugging Face. "nvidia/Alpamayo-R1-10B Model Card." December 2025. https://huggingface.co/nvidia/Alpamayo-R1-10B 

  8. NVIDIA Developer Forums. "Physical AI at NeurIPS 2025." December 2025. https://forums.developer.nvidia.com/t/physical-ai-at-neurips-2025-annoucements/353373 

  9. NVIDIA Developer. "DRIVE AGX Autonomous Vehicle Development Platform." 2025. https://developer.nvidia.com/drive/agx 

  10. MLQ AI. "NVIDIA Unveils Alpamayo-R1 and New AI Tools for Speech, Safety and Autonomous Driving." December 2025. https://mlq.ai/news/nvidia-unveils-alpamayo-r1-and-new-ai-tools-for-speech-safety-and-autonomous-driving-at-neurips-2025/ 

  11. NVIDIA. "At NeurIPS, NVIDIA Advances Open Model Development." December 2025. 

  12. ArXiv. "Alpamayo-R1: Bridging Reasoning and Action Prediction." 2511.00088. https://arxiv.org/abs/2511.00088 

  13. NVIDIA Blog. "Next-Gen Vehicles Built on NVIDIA DRIVE Orin." 2025. https://blogs.nvidia.com/blog/new-era-transportation-drive-orin/ 

  14. Introl. "Company Overview." Introl. 2025. https://introl.com 

  15. Inc. "Inc. 5000 2025." Inc. Magazine. 2025. 

  16. Introl. "Coverage Area." Introl. 2025. https://introl.com/coverage-area 

Request a Quote_

Tell us about your project and we'll respond within 72 hours.

> TRANSMISSION_COMPLETE

Request Received_

Thank you for your inquiry. Our team will review your request and respond within 72 hours.

QUEUED FOR PROCESSING