NeurIPS में NVIDIA Physical AI: Alpamayo-R1 और Cosmos इकोसिस्टम

NVIDIA ने Alpamayo-R1 जारी किया, स्वायत्त ड्राइविंग के लिए पहला ओपन रीज़निंग VLA। Cosmos प्लेटफॉर्म LidarGen, ProtoMotions3 के साथ विस्तारित। Figure AI, 1X अपना रहे हैं।

NeurIPS में NVIDIA Physical AI: Alpamayo-R1 और Cosmos इकोसिस्टम

NeurIPS में NVIDIA Physical AI: Alpamayo-R1 और Cosmos इकोसिस्टम

12 दिसंबर, 2025

दिसंबर 2025 अपडेट: NVIDIA ने NeurIPS 2025 में Alpamayo-R1 (AR1) जारी किया, जो स्वायत्त ड्राइविंग के लिए पहला ओपन रीज़निंग vision-language-action मॉडल है। Cosmos प्लेटफॉर्म सिमुलेशन के लिए LidarGen और ह्यूमनॉइड रोबोटिक्स के लिए ProtoMotions3 के साथ विस्तारित हुआ। Figure AI, 1X, Agility Robotics, और अन्य रोबोटिक्स लीडर्स इस इकोसिस्टम पर निर्माण कर रहे हैं।


संक्षेप में

NVIDIA Physical AI के बिल्डिंग ब्लॉक्स को ओपन-सोर्स कर रहा है। Alpamayo-R1 स्वायत्त वाहनों के लिए chain-of-thought रीज़निंग को ट्रैजेक्टरी प्लानिंग के साथ जोड़ता है—एक क्षमता जो पहले प्रोप्राइटरी सिस्टम्स के पीछे बंद थी। Cosmos world foundation model प्लेटफॉर्म में अब वीडियो जेनरेशन, lidar सिंथेसिस, और ह्यूमनॉइड रोबोट ट्रेनिंग टूल्स शामिल हैं। प्रमुख रोबोटिक्स कंपनियों द्वारा इन मॉडल्स को अपनाने के साथ, NVIDIA खुद को रोबोट्स और स्वायत्त वाहनों के लिए इन्फ्रास्ट्रक्चर लेयर के रूप में स्थापित कर रहा है, उसी तरह जैसे यह LLM ट्रेनिंग में प्रभुत्व रखता है।


क्या हुआ

NVIDIA ने 1 दिसंबर को सैन डिएगो में NeurIPS 2025 में Alpamayo-R1 (AR1) का अनावरण किया, इसे "स्वायत्त ड्राइविंग के लिए दुनिया का पहला इंडस्ट्री-स्केल ओपन रीज़निंग vision language action (VLA) मॉडल" बताया।1

यह मॉडल chain-of-thought AI रीज़निंग को पाथ प्लानिंग के साथ एकीकृत करता है। AR1 ड्राइविंग परिदृश्यों को चरण-दर-चरण विश्लेषित करता है, संभावित ट्रैजेक्टरीज़ पर विचार करता है, फिर इष्टतम मार्गों का चयन करने के लिए संदर्भात्मक डेटा का उपयोग करता है।2 इस दृष्टिकोण का उद्देश्य जटिल, एज-केस परिदृश्यों में सुरक्षा में सुधार करना है जो पारंपरिक AV सिस्टम्स को चुनौती देते हैं।

"जिस तरह large language models ने generative और agentic AI में क्रांति ला दी, Cosmos world foundation models Physical AI के लिए एक सफलता हैं," Jensen Huang ने पहले के CES और GTC घोषणाओं में कहा।3

AR1 Cosmos-Reason1-7B पर बनाया गया है, एक रीज़निंग vision-language मॉडल जिसे NVIDIA ने व्यापक Cosmos प्लेटफॉर्म के हिस्से के रूप में जारी किया।4 मॉडल, मूल्यांकन फ्रेमवर्क (AlpaSim), और ट्रेनिंग डेटा सबसेट गैर-व्यावसायिक अनुसंधान के लिए ओपन लाइसेंस के तहत GitHub और Hugging Face पर उपलब्ध हैं।


इन्फ्रास्ट्रक्चर के लिए क्यों महत्वपूर्ण है

Physical AI LLMs की तरह स्केल करता है: Cosmos प्लेटफॉर्म उसी दृष्टिकोण को लागू करता है जो language models के लिए काम किया (large foundation models, open weights, developer tools) रोबोटिक्स और स्वायत्त वाहनों के लिए। संगठन खरोंच से निर्माण करने के बजाय Alpamayo-R1 या Cosmos मॉडल्स को प्रोप्राइटरी डेटा पर fine-tune कर सकते हैं।

सिमुलेशन विभेदक बन जाता है: LidarGen सिंथेटिक lidar डेटा जेनरेट करता है; Cosmos Transfer सिमुलेशन को फोटोरियलिस्टिक वीडियो में बदलता है; ProtoMotions3 फिजिक्स-एक्यूरेट वातावरण में ह्यूमनॉइड रोबोट्स को ट्रेन करता है। कंप्यूट आवश्यकताएं पर्याप्त हैं: एक सिंगल रोबोटिक्स पॉलिसी को ट्रेन करने के लिए आमतौर पर H100-क्लास हार्डवेयर पर 1,000-10,000 GPU-घंटे की आवश्यकता होती है। Physical AI में प्रवेश करने वाले संगठनों को समर्पित GPU क्लस्टर्स या नियोक्लाउड पार्टनरशिप की आवश्यकता है।

ओपन सोर्स अपनाने को तेज करता है: AR1 को खुले तौर पर जारी करके, NVIDIA अपने हार्डवेयर स्टैक के अपनाने को बढ़ावा देता है। इन मॉडल्स को ट्रेन या fine-tune करने वाला प्रत्येक संगठन NVIDIA GPUs पर चलता है। ओपन मॉडल रणनीति LLM डेवलपमेंट के लिए प्रभावी साबित हुई; NVIDIA इसे Physical AI पर लागू करता है।

रोबोटिक्स इकोसिस्टम परिपक्व होता है: Figure AI, 1X, Agility Robotics, और X-Humanoid का Cosmos पर निर्माण करना संकेत देता है कि ह्यूमनॉइड रोबोटिक्स उद्योग साझा इन्फ्रास्ट्रक्चर पर अभिसरण कर रहा है। यह उसी तरह है जैसे क्लाउड AI डेवलपमेंट PyTorch और transformer आर्किटेक्चर पर मानकीकृत हुआ।


तकनीकी विवरण

NVIDIA DRIVE Alpamayo-R1 आर्किटेक्चर

घटक विनिर्देश
मॉडल बेस Cosmos-Reason1-7B
मॉडल प्रकार Vision-Language-Action (VLA)
मुख्य विशेषता ट्रैजेक्टरी प्लानिंग के लिए Chain-of-thought रीज़निंग
ट्रेनिंग डेटा 1,727+ घंटे ड्राइविंग डेटा (सबसेट ओपन)
मूल्यांकन AlpaSim फ्रेमवर्क (ओपन सोर्स)
उपलब्धता GitHub, Hugging Face

AR1 का रीज़निंग दृष्टिकोण:5 1. मल्टी-मोडल इनपुट्स के माध्यम से वातावरण को समझता है 2. Chain-of-thought का उपयोग करके निर्णय प्रक्रिया के माध्यम से तर्क करता है 3. ट्रैजेक्टरी पूर्वानुमान जेनरेट करता है 4. प्राकृतिक भाषा विवरण के माध्यम से क्रियाओं को व्यक्त करता है

मूल्यांकन रीज़निंग, ट्रैजेक्टरी जेनरेशन, अलाइनमेंट, सेफ्टी, और लेटेंसी मेट्रिक्स में state-of-the-art प्रदर्शन दिखाते हैं।6

Cosmos प्लेटफॉर्म घटक

मॉडल उद्देश्य उपयोग मामला
Cosmos Predict अगला-फ्रेम जेनरेशन एज केस डेटासेट निर्माण
Cosmos Transfer स्ट्रक्चर्ड-टू-फोटोरियल वीडियो सिंथेटिक ट्रेनिंग डेटा
Cosmos Reason Chain-of-thought मूल्यांकन गुणवत्ता आकलन
LidarGen Lidar डेटा सिंथेसिस AV सिमुलेशन
ProtoMotions3 ह्यूमनॉइड ट्रेनिंग फ्रेमवर्क रोबोट पॉलिसी डेवलपमेंट

LidarGen

AV सिमुलेशन के लिए सिंथेटिक lidar डेटा जेनरेट करने वाला पहला world model:7 - Cosmos आर्किटेक्चर पर निर्मित - रेंज मैप्स और पॉइंट क्लाउड्स जेनरेट करता है - भौतिक सेंसर डेटा संग्रह के बिना lidar-आधारित परिदृश्य परीक्षण सक्षम करता है - AV डेवलपमेंट के लिए वास्तविक-दुनिया डेटा आवश्यकताओं को कम करता है

ProtoMotions3

ह्यूमनॉइड रोबोट ट्रेनिंग के लिए GPU-त्वरित फ्रेमवर्क:8 - NVIDIA Newton और Isaac Lab पर निर्मित - Cosmos WFM-जेनरेटेड सीन्स का उपयोग करता है - भौतिक रूप से सिम्युलेटेड डिजिटल ह्यूमन्स और ह्यूमनॉइड रोबोट्स को ट्रेन करता है - पॉलिसी मॉडल्स वास्तविक हार्डवेयर के लिए NVIDIA GR00T N में एक्सपोर्ट होते हैं

उद्योग अपनाना

Cosmos world foundation models का उपयोग करने वाले संगठन:9

कंपनी एप्लिकेशन
1X Cosmos Predict/Transfer के माध्यम से NEO Gamma ह्यूमनॉइड ट्रेनिंग
Agility Robotics बड़े पैमाने पर सिंथेटिक डेटा जेनरेशन
Figure AI Physical AI डेवलपमेंट
Foretellix AV टेस्टिंग और वैलिडेशन
Gatik स्वायत्त ट्रकिंग
Oxa यूनिवर्सल ऑटोनॉमी प्लेटफॉर्म
PlusAI स्वायत्त ट्रकिंग
X-Humanoid ह्यूमनॉइड रोबोटिक्स

Agility Robotics CTO Pras Velagapudi: "Cosmos हमें वास्तविक दुनिया में संभव संग्रह से परे हमारे फोटोरियलिस्टिक ट्रेनिंग डेटा को स्केल करने का अवसर प्रदान करता है।"10


व्यापक NeurIPS घोषणाएं

NVIDIA शोधकर्ताओं ने NeurIPS 2025 में 70+ पेपर्स, टॉक्स, और वर्कशॉप्स प्रस्तुत किए।11 अतिरिक्त ओपन रिलीज़ में शामिल हैं:

Digital AI मॉडल्स: - MultiTalker Parakeet: मल्टी-स्पीकर वातावरण के लिए स्पीच रिकग्निशन - Sortformer: स्पीकर डायराइज़ेशन मॉडल - Nemotron Content Safety Reasoning: सेफ्टी मूल्यांकन

मान्यता: - Artificial Analysis Openness Index ने NVIDIA Nemotron फैमिली को "AI इकोसिस्टम में सबसे ओपन में से एक" रेट किया12


आगे क्या है

2026: Level 4 AV प्रोग्राम्स में Alpamayo-R1 डेरिवेटिव्स के प्रोडक्शन डिप्लॉयमेंट।

2026-2027: ह्यूमनॉइड रोबोट निर्माता Cosmos/ProtoMotions3 पाइपलाइन पर ट्रेन किए गए प्रोडक्ट्स शिप करते हैं।

जारी: Cosmos प्लेटफॉर्म विशेष डोमेन (मैन्युफैक्चरिंग, लॉजिस्टिक्स, हेल्थकेयर) के लिए अतिरिक्त world models के साथ विस्तारित होता है।

मार्केट इम्पैक्ट: $50 ट्रिलियन मैन्युफैक्चरिंग और लॉजिस्टिक्स उद्योग जिनका Huang संदर्भ देते हैं, सिमुलेशन और इन्फरेंस के लिए बड़े पैमाने पर GPU इन्फ्रास्ट्रक्चर की आवश्यकता होगी। Physical AI LLM ट्रेनिंग से परे NVIDIA के अगले विकास वेक्टर का प्रतिनिधित्व करता है।


मुख्य बातें

इन्फ्रास्ट्रक्चर प्लानर्स के लिए: - Physical AI सिमुलेशन के लिए H100-क्लास हार्डवेयर पर प्रति रोबोटिक्स पॉलिसी 1,000-10,000 GPU-घंटे की आवश्यकता होती है - Cosmos-आधारित वर्कफ्लो NVIDIA हार्डवेयर मांग को बढ़ाते हैं; AV/रोबोटिक्स प्रोग्राम्स के लिए तदनुसार बजट बनाएं - सिंथेटिक डेटा जेनरेशन वास्तविक-दुनिया डेटा संग्रह की आवश्यकता को कम करता है लेकिन समाप्त नहीं करता - Level 4 ऑटोनॉमी टाइमलाइन AR1 जैसे रीज़निंग मॉडल्स में प्रगति पर निर्भर करती है - Isaac Sim न्यूनतम RTX 4090 पर चलता है; प्रोडक्शन ट्रेनिंग के लिए A100/H100 क्लस्टर्स की आवश्यकता होती है

ऑपरेशंस टीमों के लिए: - मूल्यांकन के लिए GitHub और Hugging Face पर ओपन मॉडल्स उपलब्ध हैं - AlpaSim मानकीकृत मूल्यांकन फ्रेमवर्क प्रदान करता है - रोबोटिक्स डेवलपमेंट के लिए Isaac Lab/Isaac Sim एकीकरण - LidarGen हार्डवेयर के बिना lidar सिमुलेशन सक्षम करता है

रणनीतिक योजना के लिए: - Physical AI LLM प्लेबुक का अनुसरण करता है: foundation models, fine-tuning, open ecosystem - रोबोटिक्स उद्योग NVIDIA इन्फ्रास्ट्रक्चर स्टैक पर समेकित हो रहा है - 1X, Figure AI, Agility टाइमिंग 2026-2027 में ह्यूमनॉइड प्रोडक्ट्स का सुझाव देती है - मैन्युफैक्चरिंग/लॉजिस्टिक्स AI अगली इन्फ्रास्ट्रक्चर निवेश लहर का प्रतिनिधित्व करता है


संदर्भ


Physical AI डेवलपमेंट को सपोर्ट करने वाले GPU इन्फ्रास्ट्रक्चर के लिए, Introl से संपर्क करें।


  1. NVIDIA Blog. "At NeurIPS, NVIDIA Advances Open Model Development for Digital and Physical AI." December 1, 2025. 

  2. TechCrunch. "Nvidia announces new open AI models and tools for autonomous driving research." December 1, 2025. 

  3. NVIDIA Newsroom. "NVIDIA Launches Cosmos World Foundation Model Platform to Accelerate Physical AI Development." January 7, 2025. 

  4. NVIDIA Research. "Alpamayo-R1: Bridging Reasoning and Action Prediction for Generalizable Autonomous Driving in the Long Tail." October 2025. 

  5. WinBuzzer. "Alpamayo-R1: NVIDIA Releases Vision Reasoning Model and Massive 1,727-Hour Dataset." December 2, 2025. 

  6. NVIDIA Research. "Alpamayo-R1 Publication." 2025. 

  7. NVIDIA Blog. "Physical AI Open Datasets." December 2025. 

  8. Edge AI and Vision Alliance. "NVIDIA Advances Open Model Development for Digital and Physical AI." December 2025. 

  9. NVIDIA Newsroom. "NVIDIA Announces Major Release of Cosmos World Foundation Models and Physical AI Data Tools." March 18, 2025. 

  10. NVIDIA Newsroom. "Cosmos Platform Announcement." 2025. 

  11. NVIDIA Blog. "NeurIPS 2025." December 2025. 

  12. Artificial Analysis. "Openness Index." 2025. 

  13. Analytics India Magazine. "NVIDIA Open Sources Reasoning Model for Autonomous Driving at NeurIPS 2025." December 2025. 

  14. TechRepublic. "Nvidia Unveils Advances in Open Digital and Physical AI." December 2025. 

  15. Interesting Engineering. "NVIDIA debuts first open reasoning AI for self-driving vehicles." December 2025. 

कोटेशन का अनुरोध करें_

अपने प्रोजेक्ट के बारे में बताएं और हम 72 घंटों के भीतर जवाب देंगे।

> TRANSMISSION_COMPLETE

अनुरोध प्राप्त हुआ_

आपकी पूछताछ के लिए धन्यवाद। हमारी टीम आपके अनुरोध की समीक्षा करेगी और 72 घंटों के भीतर उत्तर देगी।

QUEUED FOR PROCESSING