NeurIPS में NVIDIA फिजिकल AI: Alpamayo-R1 और Cosmos इकोसिस्टम
12 दिसंबर 2025
दिसंबर 2025 अपडेट: NVIDIA ने NeurIPS 2025 में Alpamayo-R1 (AR1) जारी किया, स्वायत्त ड्राइविंग के लिए पहला ओपन रीजनिंग विजन-लैंग्वेज-एक्शन मॉडल। Cosmos प्लेटफॉर्म सिमुलेशन के लिए LidarGen और ह्यूमनॉइड रोबोटिक्स के लिए ProtoMotions3 के साथ विस्तारित हुआ। Figure AI, 1X, Agility Robotics और अन्य रोबोटिक्स लीडर इस इकोसिस्टम पर निर्माण कर रहे हैं।
सारांश
NVIDIA फिजिकल AI के बिल्डिंग ब्लॉक्स को ओपन-सोर्स कर रहा है। Alpamayo-R1 स्वायत्त वाहनों के लिए चेन-ऑफ-थॉट रीजनिंग को ट्रेजेक्टरी प्लानिंग के साथ जोड़ता है। Cosmos वर्ल्ड फाउंडेशन मॉडल प्लेटफॉर्म में अब वीडियो जेनरेशन, लिडार सिंथेसिस और ह्यूमनॉइड रोबोट ट्रेनिंग टूल्स शामिल हैं।
क्या हुआ
NVIDIA ने 1 दिसंबर को सैन डिएगो में NeurIPS 2025 में Alpamayo-R1 (AR1) का अनावरण किया। मॉडल चेन-ऑफ-थॉट AI रीजनिंग को पाथ प्लानिंग के साथ एकीकृत करता है। AR1 ड्राइविंग परिदृश्यों को चरण-दर-चरण विभाजित करता है और इष्टतम मार्गों का चयन करने के लिए संदर्भित डेटा का उपयोग करता है।
इंफ्रास्ट्रक्चर के लिए यह महत्वपूर्ण क्यों है
फिजिकल AI LLMs की तरह स्केल करता है: Cosmos प्लेटफॉर्म भाषा मॉडलों के लिए काम करने वाले समान दृष्टिकोण को रोबोटिक्स और स्वायत्त वाहनों पर लागू करता है।
सिमुलेशन विभेदक बन जाता है: LidarGen सिंथेटिक लिडार डेटा उत्पन्न करता है; Cosmos Transfer सिमुलेशन को फोटोरियलिस्टिक वीडियो में बदलता है; ProtoMotions3 भौतिक रूप से सटीक वातावरण में ह्यूमनॉइड रोबोट को प्रशिक्षित करता है।
तकनीकी विवरण
| घटक | विनिर्देश |
|---|---|
| मॉडल बेस | Cosmos-Reason1-7B |
| मॉडल प्रकार | विजन-लैंग्वेज-एक्शन (VLA) |
| ट्रेनिंग डेटा | 1,727+ घंटे ड्राइविंग डेटा |
| मूल्यांकन | AlpaSim फ्रेमवर्क (ओपन सोर्स) |
उद्योग अपनाना
| कंपनी | अनुप्रयोग |
|---|---|
| 1X | Cosmos Predict/Transfer के माध्यम से NEO Gamma ह्यूमनॉइड ट्रेनिंग |
| Agility Robotics | बड़े पैमाने पर सिंथेटिक डेटा जेनरेशन |
| Figure AI | फिजिकल AI विकास |
| Gatik | स्वायत्त ट्रकिंग |
मुख्य बिंदु
इंफ्रास्ट्रक्चर प्लानर्स के लिए: - फिजिकल AI सिमुलेशन के लिए H100-क्लास हार्डवेयर पर प्रति रोबोटिक्स पॉलिसी 1,000-10,000 GPU-घंटे की आवश्यकता होती है - Isaac Sim के लिए न्यूनतम RTX 4090 आवश्यक है; प्रोडक्शन ट्रेनिंग के लिए A100/H100 क्लस्टर की आवश्यकता है
ऑपरेशंस टीमों के लिए: - मूल्यांकन के लिए GitHub और Hugging Face पर ओपन मॉडल उपलब्ध हैं - AlpaSim मानकीकृत मूल्यांकन फ्रेमवर्क प्रदान करता है
रणनीतिक योजना के लिए: - फिजिकल AI LLM प्लेबुक का अनुसरण करता है: फाउंडेशन मॉडल, फाइन-ट्यूनिंग, ओपन इकोसिस्टम - रोबोटिक्स उद्योग NVIDIA इंफ्रास्ट्रक्चर स्टैक पर समेकित हो रहा है
फिजिकल AI विकास का समर्थन करने वाले GPU इंफ्रास्ट्रक्चर के लिए, Introl से संपर्क करें।