الذكاء الاصطناعي الفيزيائي من NVIDIA في NeurIPS: نموذج Alpamayo-R1 ومنظومة Cosmos
12 ديسمبر 2025
تحديث ديسمبر 2025: أطلقت NVIDIA نموذج Alpamayo-R1 (AR1) في مؤتمر NeurIPS 2025، وهو أول نموذج مفتوح للرؤية واللغة والفعل يعتمد على الاستدلال مخصص للقيادة الذاتية. توسعت منصة Cosmos لتشمل LidarGen للمحاكاة وProtoMotions3 للروبوتات البشرية. شركات Figure AI و1X وAgility Robotics وغيرها من رواد صناعة الروبوتات تبني أنظمتها على هذه المنظومة.
ملخص سريع
تقوم NVIDIA بنشر اللبنات الأساسية للذكاء الاصطناعي الفيزيائي كمصادر مفتوحة. يجمع نموذج Alpamayo-R1 بين الاستدلال المتسلسل وتخطيط المسارات للمركبات ذاتية القيادة—وهي قدرة كانت حكراً على الأنظمة المغلقة. تضم منصة Cosmos للنماذج التأسيسية العالمية الآن أدوات لتوليد الفيديو وتخليق بيانات الليدار وتدريب الروبوتات البشرية. مع تبني كبرى شركات الروبوتات لهذه النماذج، تضع NVIDIA نفسها كطبقة البنية التحتية للروبوتات والمركبات ذاتية القيادة بنفس الطريقة التي تهيمن بها على تدريب النماذج اللغوية الكبيرة.
ما الذي حدث
كشفت NVIDIA عن نموذج Alpamayo-R1 (AR1) في مؤتمر NeurIPS 2025 بسان دييغو في الأول من ديسمبر، واصفةً إياه بأنه "أول نموذج مفتوح للرؤية واللغة والفعل يعتمد على الاستدلال على المستوى الصناعي للقيادة الذاتية في العالم."1
يدمج النموذج الاستدلال المتسلسل بالذكاء الاصطناعي مع تخطيط المسارات. يقوم AR1 بتحليل سيناريوهات القيادة خطوة بخطوة، ويدرس المسارات المحتملة، ثم يستخدم البيانات السياقية لاختيار المسارات المثلى.2 يهدف هذا النهج إلى تحسين السلامة في السيناريوهات المعقدة والحالات الاستثنائية التي تواجه أنظمة المركبات ذاتية القيادة التقليدية.
صرّح جنسن هوانغ في إعلانات CES وGTC السابقة: "كما أحدثت النماذج اللغوية الكبيرة ثورة في الذكاء الاصطناعي التوليدي والوكيل، تُعد نماذج Cosmos التأسيسية العالمية طفرة في الذكاء الاصطناعي الفيزيائي."3
يُبنى AR1 على نموذج Cosmos-Reason1-7B، وهو نموذج للرؤية واللغة يعتمد على الاستدلال أطلقته NVIDIA كجزء من منصة Cosmos الأوسع.4 النموذج وإطار التقييم (AlpaSim) ومجموعة فرعية من بيانات التدريب متاحة على GitHub وHugging Face تحت تراخيص مفتوحة للأبحاث غير التجارية.
أهمية ذلك للبنية التحتية
الذكاء الاصطناعي الفيزيائي يتوسع كالنماذج اللغوية الكبيرة: تطبق منصة Cosmos نفس النهج الذي نجح مع النماذج اللغوية (نماذج تأسيسية كبيرة، أوزان مفتوحة، أدوات للمطورين) على الروبوتات والمركبات ذاتية القيادة. يمكن للمؤسسات ضبط نموذج Alpamayo-R1 أو نماذج Cosmos على بياناتها الخاصة بدلاً من البناء من الصفر.
المحاكاة تصبح عامل تمييز: يولّد LidarGen بيانات ليدار اصطناعية؛ ويحوّل Cosmos Transfer المحاكاة إلى فيديو واقعي؛ ويدرّب ProtoMotions3 الروبوتات البشرية في بيئات دقيقة فيزيائياً. متطلبات الحوسبة كبيرة: تدريب سياسة روبوتية واحدة يتطلب عادةً من 1,000 إلى 10,000 ساعة GPU على عتاد بمستوى H100. تحتاج المؤسسات الداخلة في مجال الذكاء الاصطناعي الفيزيائي إلى مجموعات GPU مخصصة أو شراكات مع مزودي السحابة المتخصصة.
المصادر المفتوحة تُسرّع التبني: بإطلاق AR1 بشكل مفتوح، تدفع NVIDIA نحو تبني منظومة عتادها. كل مؤسسة تدرّب هذه النماذج أو تضبطها تعمل على وحدات GPU من NVIDIA. أثبتت استراتيجية النماذج المفتوحة فعاليتها في تطوير النماذج اللغوية الكبيرة؛ وتطبقها NVIDIA على الذكاء الاصطناعي الفيزيائي.
نضج منظومة الروبوتات: بناء Figure AI و1X وAgility Robotics وX-Humanoid على Cosmos يشير إلى تقارب صناعة الروبوتات البشرية على بنية تحتية مشتركة. يوازي هذا كيفية توحيد تطوير الذكاء الاصطناعي السحابي على PyTorch وبنيات المحولات.
التفاصيل التقنية
بنية NVIDIA DRIVE Alpamayo-R1
| المكوّن | المواصفات |
|---|---|
| النموذج الأساسي | Cosmos-Reason1-7B |
| نوع النموذج | رؤية-لغة-فعل (VLA) |
| الميزة الرئيسية | الاستدلال المتسلسل لتخطيط المسارات |
| بيانات التدريب | أكثر من 1,727 ساعة من بيانات القيادة (جزء مفتوح) |
| التقييم | إطار AlpaSim (مفتوح المصدر) |
| التوفر | GitHub، Hugging Face |
نهج الاستدلال في AR1:5 1. يدرك البيئة من خلال مدخلات متعددة الوسائط 2. يستدل عبر عملية اتخاذ القرار باستخدام التفكير المتسلسل 3. يولّد تنبؤات المسارات 4. يصف الإجراءات من خلال أوصاف باللغة الطبيعية
تُظهر التقييمات أداءً رائداً في الاستدلال وتوليد المسارات والمحاذاة والسلامة وزمن الاستجابة.6
مكونات منصة Cosmos
| النموذج | الغرض | حالة الاستخدام |
|---|---|---|
| Cosmos Predict | توليد الإطار التالي | إنشاء مجموعات بيانات للحالات الاستثنائية |
| Cosmos Transfer | تحويل الفيديو المهيكل إلى واقعي | بيانات تدريب اصطناعية |
| Cosmos Reason | تقييم التفكير المتسلسل | تقييم الجودة |
| LidarGen | تخليق بيانات الليدار | محاكاة المركبات ذاتية القيادة |
| ProtoMotions3 | إطار تدريب الروبوتات البشرية | تطوير سياسات الروبوت |
LidarGen
أول نموذج عالمي يولّد بيانات ليدار اصطناعية لمحاكاة المركبات ذاتية القيادة:7 - مبني على بنية Cosmos - يولّد خرائط المدى وسحب النقاط - يتيح اختبار سيناريوهات الليدار دون جمع بيانات المستشعر الفعلي - يقلل متطلبات البيانات الواقعية لتطوير المركبات ذاتية القيادة
ProtoMotions3
إطار عمل معجّل بوحدات GPU لتدريب الروبوتات البشرية:8 - مبني على NVIDIA Newton وIsaac Lab - يستخدم مشاهد مولّدة بنماذج Cosmos WFM - يدرّب البشر الرقميين والروبوتات البشرية المحاكاة فيزيائياً - تُصدَّر نماذج السياسات إلى NVIDIA GR00T N للعتاد الحقيقي
التبني الصناعي
المؤسسات التي تستخدم نماذج Cosmos التأسيسية العالمية:9
| الشركة | التطبيق |
|---|---|
| 1X | تدريب الروبوت البشري NEO Gamma عبر Cosmos Predict/Transfer |
| Agility Robotics | توليد بيانات اصطناعية واسعة النطاق |
| Figure AI | تطوير الذكاء الاصطناعي الفيزيائي |
| Foretellix | اختبار والتحقق من المركبات ذاتية القيادة |
| Gatik | النقل بالشاحنات الذاتية |
| Oxa | منصة الاستقلالية الشاملة |
| PlusAI | النقل بالشاحنات الذاتية |
| X-Humanoid | الروبوتات البشرية |
براس فيلاغابودي، المدير التقني لـ Agility Robotics: "يوفر لنا Cosmos فرصة لتوسيع نطاق بيانات التدريب الواقعية بصرياً إلى ما يتجاوز ما يمكننا جمعه فعلياً في العالم الحقيقي."10
إعلانات NeurIPS الأوسع
قدّم باحثو NVIDIA أكثر من 70 ورقة بحثية ومحاضرة وورشة عمل في NeurIPS 2025.11 تشمل الإصدارات المفتوحة الإضافية:
نماذج الذكاء الاصطناعي الرقمي: - MultiTalker Parakeet: التعرف على الكلام في بيئات متعددة المتحدثين - Sortformer: نموذج تحديد المتحدثين - Nemotron Content Safety Reasoning: تقييم السلامة
التقدير: - صنّف مؤشر الانفتاح من Artificial Analysis عائلة NVIDIA Nemotron "من بين الأكثر انفتاحاً في منظومة الذكاء الاصطناعي"12
ما التالي
2026: نشر إنتاجي لمشتقات Alpamayo-R1 في برامج المركبات ذاتية القيادة من المستوى الرابع.
2026-2027: مصنعو الروبوتات البشرية يطلقون منتجات مدربة على خط Cosmos/ProtoMotions3.
مستمر: توسع منصة Cosmos بنماذج عالمية إضافية لمجالات متخصصة (التصنيع، اللوجستيات، الرعاية الصحية).
التأثير السوقي: ستتطلب صناعات التصنيع واللوجستيات البالغة قيمتها 50 تريليون دولار التي يشير إليها هوانغ بنية تحتية ضخمة من GPU للمحاكاة والاستدلال. يمثل الذكاء الاصطناعي الفيزيائي متجه النمو التالي لـ NVIDIA بعد تدريب النماذج اللغوية الكبيرة.
النقاط الرئيسية
لمخططي البنية التحتية: - محاكاة الذكاء الاصطناعي الفيزيائي تتطلب 1,000-10,000 ساعة GPU لكل سياسة روبوتية على عتاد بمستوى H100 - سير عمل Cosmos يدفع الطلب على عتاد NVIDIA؛ خطط الميزانية وفقاً لبرامج المركبات ذاتية القيادة/الروبوتات - توليد البيانات الاصطناعية يقلل لكن لا يلغي الحاجة لجمع بيانات العالم الحقيقي - الجداول الزمنية للاستقلالية من المستوى الرابع تعتمد على التقدم في نماذج الاستدلال مثل AR1 - Isaac Sim يتطلب RTX 4090 كحد أدنى؛ التدريب الإنتاجي يتطلب مجموعات A100/H100
لفرق العمليات: - النماذج المفتوحة متاحة على GitHub وHugging Face للتقييم - AlpaSim يوفر إطار تقييم موحد - تكامل Isaac Lab/Isaac Sim لتطوير الروبوتات - LidarGen يتيح محاكاة الليدار بدون عتاد
للتخطيط الاستراتيجي: - الذكاء الاصطناعي الفيزيائي يتبع دليل النماذج اللغوية الكبيرة: نماذج تأسيسية، ضبط دقيق، منظومة مفتوحة - صناعة الروبوتات تتوحد على منظومة البنية التحتية من NVIDIA - توقيتات 1X وFigure AI وAgility تشير إلى منتجات روبوتات بشرية في 2026-2027 - الذكاء الاصطناعي للتصنيع/اللوجستيات يمثل موجة الاستثمار التالية في البنية التحتية
المراجع
للحصول على بنية تحتية GPU تدعم تطوير الذكاء الاصطناعي الفيزيائي، تواصل مع Introl.
-
NVIDIA Blog. "At NeurIPS, NVIDIA Advances Open Model Development for Digital and Physical AI." December 1, 2025. ↩
-
TechCrunch. "Nvidia announces new open AI models and tools for autonomous driving research." December 1, 2025. ↩
-
NVIDIA Newsroom. "NVIDIA Launches Cosmos World Foundation Model Platform to Accelerate Physical AI Development." January 7, 2025. ↩
-
NVIDIA Research. "Alpamayo-R1: Bridging Reasoning and Action Prediction for Generalizable Autonomous Driving in the Long Tail." October 2025. ↩
-
WinBuzzer. "Alpamayo-R1: NVIDIA Releases Vision Reasoning Model and Massive 1,727-Hour Dataset." December 2, 2025. ↩
-
NVIDIA Research. "Alpamayo-R1 Publication." 2025. ↩
-
NVIDIA Blog. "Physical AI Open Datasets." December 2025. ↩
-
Edge AI and Vision Alliance. "NVIDIA Advances Open Model Development for Digital and Physical AI." December 2025. ↩
-
NVIDIA Newsroom. "NVIDIA Announces Major Release of Cosmos World Foundation Models and Physical AI Data Tools." March 18, 2025. ↩
-
NVIDIA Newsroom. "Cosmos Platform Announcement." 2025. ↩
-
NVIDIA Blog. "NeurIPS 2025." December 2025. ↩
-
Artificial Analysis. "Openness Index." 2025. ↩
-
Analytics India Magazine. "NVIDIA Open Sources Reasoning Model for Autonomous Driving at NeurIPS 2025." December 2025. ↩
-
TechRepublic. "Nvidia Unveils Advances in Open Digital and Physical AI." December 2025. ↩
-
Interesting Engineering. "NVIDIA debuts first open reasoning AI for self-driving vehicles." December 2025. ↩