الذكاء الاصطناعي الفيزيائي من NVIDIA في NeurIPS: Alpamayo-R1 ونظام Cosmos البيئي
12 ديسمبر 2025
تحديث ديسمبر 2025: أطلقت NVIDIA نموذج Alpamayo-R1 (AR1) في مؤتمر NeurIPS 2025، وهو أول نموذج مفتوح للرؤية واللغة والفعل مع الاستدلال للقيادة الذاتية. توسعت منصة Cosmos مع LidarGen للمحاكاة وProtoMotions3 للروبوتات البشرية. Figure AI و1X وAgility Robotics وقادة آخرون في مجال الروبوتات يبنون على هذا النظام البيئي.
ملخص
تقوم NVIDIA بإتاحة اللبنات الأساسية للذكاء الاصطناعي الفيزيائي كمصدر مفتوح. يجمع Alpamayo-R1 بين الاستدلال بسلسلة الأفكار وتخطيط المسار للمركبات ذاتية القيادة - وهي قدرة كانت محصورة سابقاً في الأنظمة المملوكة. تتضمن منصة نماذج Cosmos الأساسية العالمية الآن توليد الفيديو وتوليف الليدار وأدوات تدريب الروبوتات البشرية. مع تبني شركات الروبوتات الكبرى لهذه النماذج، تضع NVIDIA نفسها كطبقة البنية التحتية للروبوتات والمركبات ذاتية القيادة بنفس الطريقة التي تهيمن بها على تدريب نماذج اللغة الكبيرة.
ما الذي حدث
كشفت NVIDIA عن Alpamayo-R1 (AR1) في مؤتمر NeurIPS 2025 في سان دييغو في 1 ديسمبر، واصفة إياه بأنه "أول نموذج مفتوح للرؤية واللغة والفعل (VLA) مع الاستدلال على نطاق صناعي في العالم للقيادة الذاتية."1
يدمج النموذج الاستدلال بسلسلة الأفكار للذكاء الاصطناعي مع تخطيط المسار. يقوم AR1 بتحليل سيناريوهات القيادة خطوة بخطوة، ويدرس المسارات المحتملة، ثم يستخدم البيانات السياقية لاختيار الطرق المثلى.2 يهدف هذا النهج إلى تحسين السلامة في السيناريوهات المعقدة والحالات الحدية التي تتحدى أنظمة المركبات ذاتية القيادة التقليدية.
"تماماً كما أحدثت نماذج اللغة الكبيرة ثورة في الذكاء الاصطناعي التوليدي والوكيل، فإن نماذج Cosmos الأساسية العالمية هي اختراق للذكاء الاصطناعي الفيزيائي،" صرح Jensen Huang في إعلانات CES وGTC السابقة.3
يبني AR1 على Cosmos-Reason1-7B، وهو نموذج رؤية ولغة مع استدلال أطلقته NVIDIA كجزء من منصة Cosmos الأوسع.4 النموذج وإطار التقييم (AlpaSim) ومجموعة فرعية من بيانات التدريب متاحة على GitHub وHugging Face تحت تراخيص مفتوحة للبحث غير التجاري.
أهمية ذلك للبنية التحتية
الذكاء الاصطناعي الفيزيائي يتوسع مثل نماذج اللغة الكبيرة: تطبق منصة Cosmos نفس النهج الذي نجح مع نماذج اللغة (نماذج أساسية كبيرة، أوزان مفتوحة، أدوات للمطورين) على الروبوتات والمركبات ذاتية القيادة. يمكن للمؤسسات ضبط Alpamayo-R1 أو نماذج Cosmos على بيانات خاصة بدلاً من البناء من الصفر.
المحاكاة تصبح عامل تمييز: يولد LidarGen بيانات ليدار اصطناعية؛ يحول Cosmos Transfer المحاكاة إلى فيديو واقعي؛ يدرب ProtoMotions3 الروبوتات البشرية في بيئات فيزيائية دقيقة. متطلبات الحوسبة كبيرة: تدريب سياسة روبوتية واحدة يتطلب عادة 1,000-10,000 ساعة GPU على أجهزة من فئة H100. تحتاج المؤسسات الداخلة في مجال الذكاء الاصطناعي الفيزيائي إلى مجموعات GPU مخصصة أو شراكات مع السحب الجديدة.
المصدر المفتوح يسرع التبني: من خلال إطلاق AR1 بشكل مفتوح، تدفع NVIDIA تبني مجموعة أجهزتها. كل مؤسسة تدرب أو تضبط هذه النماذج تعمل على وحدات GPU من NVIDIA. أثبتت استراتيجية النموذج المفتوح فعاليتها لتطوير نماذج اللغة الكبيرة؛ تطبقها NVIDIA على الذكاء الاصطناعي الفيزيائي.
نضوج نظام الروبوتات البيئي: بناء Figure AI و1X وAgility Robotics وX-Humanoid على Cosmos يشير إلى تقارب صناعة الروبوتات البشرية نحو بنية تحتية مشتركة. يوازي هذا كيف توحد تطوير الذكاء الاصطناعي السحابي على PyTorch وبنيات المحولات.
التفاصيل التقنية
بنية NVIDIA DRIVE Alpamayo-R1
| المكون | المواصفات |
|---|---|
| قاعدة النموذج | Cosmos-Reason1-7B |
| نوع النموذج | رؤية-لغة-فعل (VLA) |
| الميزة الرئيسية | استدلال سلسلة الأفكار لتخطيط المسار |
| بيانات التدريب | أكثر من 1,727 ساعة من بيانات القيادة (مجموعة فرعية مفتوحة) |
| التقييم | إطار AlpaSim (مفتوح المصدر) |
| التوفر | GitHub، Hugging Face |
نهج استدلال AR1:5 1. يدرك البيئة من خلال مدخلات متعددة الوسائط 2. يستدل من خلال عملية اتخاذ القرار باستخدام سلسلة الأفكار 3. يولد توقعات المسار 4. يصيغ الإجراءات من خلال أوصاف اللغة الطبيعية
تظهر التقييمات أداءً متطوراً عبر مقاييس الاستدلال وتوليد المسار والمحاذاة والسلامة والكمون.6
مكونات منصة Cosmos
| النموذج | الغرض | حالة الاستخدام |
|---|---|---|
| Cosmos Predict | توليد الإطار التالي | إنشاء مجموعات بيانات الحالات الحدية |
| Cosmos Transfer | فيديو من منظم إلى واقعي | بيانات تدريب اصطناعية |
| Cosmos Reason | تقييم سلسلة الأفكار | تقييم الجودة |
| LidarGen | توليف بيانات الليدار | محاكاة المركبات ذاتية القيادة |
| ProtoMotions3 | إطار تدريب بشري | تطوير سياسات الروبوت |
LidarGen
أول نموذج عالمي يولد بيانات ليدار اصطناعية لمحاكاة المركبات ذاتية القيادة:7 - مبني على بنية Cosmos - يولد خرائط المدى وسحب النقاط - يتيح اختبار السيناريوهات القائمة على الليدار بدون جمع بيانات المستشعرات الفيزيائية - يقلل متطلبات بيانات العالم الحقيقي لتطوير المركبات ذاتية القيادة
ProtoMotions3
إطار معجل بـ GPU لتدريب الروبوتات البشرية:8 - مبني على NVIDIA Newton وIsaac Lab - يستخدم مشاهد مولدة بواسطة Cosmos WFM - يدرب البشر الرقميين والروبوتات البشرية المحاكاة فيزيائياً - تُصدَّر نماذج السياسات إلى NVIDIA GR00T N للأجهزة الحقيقية
تبني الصناعة
المؤسسات التي تستخدم نماذج Cosmos الأساسية العالمية:9
| الشركة | التطبيق |
|---|---|
| 1X | تدريب الروبوت البشري NEO Gamma عبر Cosmos Predict/Transfer |
| Agility Robotics | توليد بيانات اصطناعية على نطاق واسع |
| Figure AI | تطوير الذكاء الاصطناعي الفيزيائي |
| Foretellix | اختبار والتحقق من المركبات ذاتية القيادة |
| Gatik | النقل بالشاحنات الذاتية |
| Oxa | منصة الاستقلالية الشاملة |
| PlusAI | النقل بالشاحنات الذاتية |
| X-Humanoid | الروبوتات البشرية |
Pras Velagapudi، CTO في Agility Robotics: "يوفر لنا Cosmos فرصة لتوسيع بيانات التدريب الواقعية لدينا إلى ما يتجاوز ما يمكننا جمعه بشكل عملي في العالم الحقيقي."10
إعلانات NeurIPS الأوسع
قدم باحثو NVIDIA أكثر من 70 ورقة بحثية ومحادثة وورشة عمل في NeurIPS 2025.11 تشمل الإصدارات المفتوحة الإضافية:
نماذج الذكاء الاصطناعي الرقمي: - MultiTalker Parakeet: التعرف على الكلام لبيئات متعددة المتحدثين - Sortformer: نموذج فصل المتحدثين - Nemotron Content Safety Reasoning: تقييم السلامة
التقدير: - صنف مؤشر الانفتاح من Artificial Analysis عائلة NVIDIA Nemotron "من بين الأكثر انفتاحاً في نظام الذكاء الاصطناعي البيئي"12
ما التالي
2026: نشر إنتاجي لمشتقات Alpamayo-R1 في برامج المركبات ذاتية القيادة من المستوى 4.
2026-2027: مصنعو الروبوتات البشرية يشحنون منتجات مدربة على خط أنابيب Cosmos/ProtoMotions3.
مستمر: منصة Cosmos تتوسع بنماذج عالمية إضافية للمجالات المتخصصة (التصنيع، اللوجستيات، الرعاية الصحية).
تأثير السوق: ستتطلب صناعات التصنيع واللوجستيات البالغة 50 تريليون دولار التي يشير إليها Huang بنية تحتية GPU ضخمة للمحاكاة والاستدلال. يمثل الذكاء الاصطناعي الفيزيائي ناقل النمو التالي لـ NVIDIA بعد تدريب نماذج اللغة الكبيرة.
النقاط الرئيسية
لمخططي البنية التحتية: - محاكاة الذكاء الاصطناعي الفيزيائي تتطلب 1,000-10,000 ساعة GPU لكل سياسة روبوتية على أجهزة من فئة H100 - تدفع سير عمل Cosmos الطلب على أجهزة NVIDIA؛ خطط ميزانيتك وفقاً لذلك لبرامج المركبات ذاتية القيادة/الروبوتات - توليد البيانات الاصطناعية يقلل لكن لا يلغي احتياجات جمع بيانات العالم الحقيقي - تعتمد الجداول الزمنية للاستقلالية من المستوى 4 على التقدم في نماذج الاستدلال مثل AR1 - يتطلب Isaac Sim حداً أدنى من RTX 4090؛ التدريب الإنتاجي يتطلب مجموعات A100/H100
لفرق العمليات: - النماذج المفتوحة متاحة على GitHub وHugging Face للتقييم - يوفر AlpaSim إطار تقييم موحد - تكامل Isaac Lab/Isaac Sim لتطوير الروبوتات - يتيح LidarGen محاكاة الليدار بدون أجهزة
للتخطيط الاستراتيجي: - الذكاء الاصطناعي الفيزيائي يتبع دليل نماذج اللغة الكبيرة: نماذج أساسية، ضبط دقيق، نظام بيئي مفتوح - صناعة الروبوتات تتوحد على مجموعة البنية التحتية لـ NVIDIA - توقيت 1X وFigure AI وAgility يشير إلى منتجات بشرية في 2026-2027 - الذكاء الاصطناعي للتصنيع/اللوجستيات يمثل الموجة التالية من الاستثمار في البنية التحتية
المراجع
للحصول على بنية تحتية GPU تدعم تطوير الذكاء الاصطناعي الفيزيائي، تواصل مع Introl.
-
مدونة NVIDIA. "At NeurIPS, NVIDIA Advances Open Model Development for Digital and Physical AI." 1 ديسمبر 2025. ↩
-
TechCrunch. "Nvidia announces new open AI models and tools for autonomous driving research." 1 ديسمبر 2025. ↩
-
غرفة أخبار NVIDIA. "NVIDIA Launches Cosmos World Foundation Model Platform to Accelerate Physical AI Development." 7 يناير 2025. ↩
-
أبحاث NVIDIA. "Alpamayo-R1: Bridging Reasoning and Action Prediction for Generalizable Autonomous Driving in the Long Tail." أكتوبر 2025. ↩
-
WinBuzzer. "Alpamayo-R1: NVIDIA Releases Vision Reasoning Model and Massive 1,727-Hour Dataset." 2 ديسمبر 2025. ↩
-
أبحاث NVIDIA. "Alpamayo-R1 Publication." 2025. ↩
-
مدونة NVIDIA. "Physical AI Open Datasets." ديسمبر 2025. ↩
-
Edge AI and Vision Alliance. "NVIDIA Advances Open Model Development for Digital and Physical AI." ديسمبر 2025. ↩
-
غرفة أخبار NVIDIA. "NVIDIA Announces Major Release of Cosmos World Foundation Models and Physical AI Data Tools." 18 مارس 2025. ↩
-
غرفة أخبار NVIDIA. "Cosmos Platform Announcement." 2025. ↩
-
مدونة NVIDIA. "NeurIPS 2025." ديسمبر 2025. ↩
-
Artificial Analysis. "Openness Index." 2025. ↩
-
Analytics India Magazine. "NVIDIA Open Sources Reasoning Model for Autonomous Driving at NeurIPS 2025." ديسمبر 2025. ↩
-
TechRepublic. "Nvidia Unveils Advances in Open Digital and Physical AI." ديسمبر 2025. ↩
-
Interesting Engineering. "NVIDIA debuts first open reasoning AI for self-driving vehicles." ديسمبر 2025. ↩