قدم Jensen Huang الإعلان الذي قلب توقعات الصناعة في CES 2026: منصة Rubin من NVIDIA دخلت الإنتاج الكامل. ليس عينات. ليس تأهيل. إنتاج كامل—مع شحنات بكميات كبيرة مستهدفة للنصف الثاني من 2026.
فاجأ التوقيت المحللين الذين خططوا لتوفر Rubin في أوائل 2027. نفذت NVIDIA دورة تطوير عدوانية مدتها 18 شهراً من إطلاق Blackwell إلى إنتاج Rubin، مما ضغط ما يمتد عادةً على 24-30 شهراً في تطوير أشباه الموصلات.
يمثل Rubin أكثر من مجرد ترقية GPU تدريجية. تقدم المنصة بنية كاملة من ست شرائح مصممة لعصر الذكاء الاصطناعي الوكيل—حيث تهيمن أحمال عمل الاستدلال وتحدد التكلفة لكل رمز الجدوى التجارية.
معالج Rubin GPU: 336 مليار ترانزستور من كثافة الحوسبة
يدفع معالج Rubin GPU هندسة أشباه الموصلات إلى حدود جديدة. مع 336 مليار ترانزستور مصنعة على عملية N3 من TSMC، يضاعف Rubin تقريباً عدد ترانزستورات Blackwell البالغ 208 مليار مع الحفاظ على أغلفة طاقة مماثلة من خلال مكاسب الكفاءة المعمارية.[^1]
المواصفات الأساسية
| المواصفة | Rubin | Blackwell | التحسين |
|---|---|---|---|
| عدد الترانزستورات | 336B | 208B | 1.6x |
| عقدة العملية | TSMC N3 | TSMC 4NP | جيل واحد |
| سعة HBM | 288GB HBM4 | 192GB HBM3e | 1.5x |
| عرض نطاق الذاكرة | 22 TB/s | 8 TB/s | 2.75x |
| استدلال FP4 | 50 PFLOPS | 20 PFLOPS | 2.5x |
| الربط البيني | NVLink 6 | NVLink 5 | 3.6 TB/s لكل GPU |
يمثل النظام الفرعي للذاكرة التقدم الأكثر أهمية في Rubin. يوفر تكامل HBM4 سعة 288GB لكل GPU مع عرض نطاق 22 TB/s—مما يتيح الاستدلال على نماذج تتجاوز تريليون معلمة دون عقوبات زمن الاستجابة للتوزيع متعدد العقد.[^2]
الابتكارات المعمارية
يقدم Rubin محركات Transformer من الجيل الرابع المحسنة لآليات الانتباه التي تهيمن على بنى الذكاء الاصطناعي الحديثة. تدعم هذه المحركات التحجيم الديناميكي للدقة—اختيار حساب FP4 أو FP8 أو FP16 تلقائياً بناءً على متطلبات الطبقة دون تدخل برمجي.[^4]
معالج Vera: مصمم خصيصاً لمراكز بيانات الذكاء الاصطناعي
يُنشر Rubin جنباً إلى جنب مع Vera، أول معالج مركزي مخصص من NVIDIA مصمم خصيصاً للبنية التحتية للذكاء الاصطناعي.[^7]
مواصفات Vera
| المواصفة | معالج Vera | Grace (السابق) |
|---|---|---|
| البنية | مخصصة قائمة على ARM | ARM Neoverse V2 |
| عدد النوى | 96 نواة | 72 نواة |
| الذاكرة | 512GB LPDDR6 | 480GB LPDDR5X |
| عرض نطاق الذاكرة | 800 GB/s | 546 GB/s |
| واجهة NVLink | 1.8 TB/s | 900 GB/s |
Vera Rubin NVL72: الحاسوب الفائق المرجعي
تغلف NVIDIA معالجات Rubin وVera في Vera Rubin NVL72—نظام بحجم الخزانة يحتوي على 72 معالج Rubin GPU و36 معالج Vera CPU يعملون كنسيج حوسبة موحد.[^10]
مواصفات النظام
| المواصفة | Vera Rubin NVL72 | Blackwell NVL72 |
|---|---|---|
| GPUs | 72x Rubin | 72x Blackwell |
| CPUs | 36x Vera | 36x Grace |
| إجمالي HBM | 20.7 TB | 13.8 TB |
| استدلال FP4 | 3.6 EFLOPS | 1.4 EFLOPS |
| تدريب FP8 | 2.5 EFLOPS | 0.72 EFLOPS |
| عرض نطاق NVLink | 259 TB/s | 130 TB/s |
| طاقة الخزانة | 120-130 kW | 120 kW |
ادعاء تخفيض التكلفة 10x
يتطلب ادعاء NVIDIA الرئيسي بتخفيض تكاليف الاستدلال 10 أضعاف مقارنة بـ Blackwell تدقيقاً. يجمع الحساب عدة عوامل:[^12]
تحسين الحوسبة الخام: 2.57x المزيد من FLOPS FP4 لكل نظام
سعة الذاكرة: 1.5x المزيد من HBM يتيح أحجام دفعات أكبر
كفاءة الربط البيني: NVLink 6 يقلل حمل الاتصالات بنسبة 40%
فك التشفير التخميني: تسريع الأجهزة يوفر تحسين إنتاجية 3-4x
كفاءة الطاقة: الأداء لكل واط يتحسن 2.2x
متطلبات البنية التحتية للتبريد والطاقة
يتطلب Vera Rubin NVL72 تبريداً سائلاً 100%—لا توجد تكوينات مبردة بالهواء.[^18]
مواصفات التبريد
| المعلمة | المتطلب |
|---|---|
| طريقة التبريد | سائل مباشر إلى الشريحة |
| درجة حرارة المبرد | 15-25°C إمداد |
| معدل التدفق | 45-60 لتر/دقيقة لكل خزانة |
| رفض الحرارة | 120-130 kW لكل خزانة |
التموضع التنافسي
مقارنة AMD MI455X
يستهدف MI455X من AMD نفس سوق البنية التحتية للذكاء الاصطناعي الراقية:[^24]
| المواصفة | NVIDIA Rubin | AMD MI455X |
|---|---|---|
| عدد الترانزستورات | 336B | 320B |
| العملية | TSMC N3 | TSMC N3/N2 هجين |
| سعة HBM | 288GB HBM4 | 432GB HBM4 |
| عرض نطاق الذاكرة | 22 TB/s | 24 TB/s |
| استدلال FP4 | 50 PFLOPS | 40 PFLOPS |
التزامات العملاء
التزم كل عميل رئيسي للبنية التحتية للذكاء الاصطناعي بنشر Rubin:
| المزود | الالتزام | الجدول الزمني |
|---|---|---|
| AWS | اتفاقية سعة متعددة السنوات | إطلاق H2 2026 |
| Microsoft Azure | البنية التحتية الأساسية للذكاء الاصطناعي | Q4 2026 |
| Google Cloud | استراتيجية مزدوجة TPU + Rubin | H2 2026 |
| Oracle Cloud | شراكة موسعة | Q3 2026 |
ماذا يعني هذا لمشغلي مراكز البيانات
يمثل إنتاج Rubin نقطة انعطاف لاستراتيجية البنية التحتية للذكاء الاصطناعي:
تصرف الآن بشأن البنية التحتية: تتطلب ترقيات التبريد السائل والطاقة فترات انتظار 12-18 شهراً.
أمّن السعة مبكراً: ستستهلك الشركات الضخمة أحجام الإنتاج الأولية.
خطط للكثافة: تتطلب أنظمة Rubin 120+ kW لكل خزانة كحد أدنى.
تتخصص Introl في البنية التحتية لمراكز البيانات لأحمال عمل الذكاء الاصطناعي. يدعم 550 مهندساً ميدانياً لدينا عمليات النشر في 257 موقعاً عالمياً. اتصل بنا لمناقشة متطلبات البنية التحتية لـ Rubin الخاصة بك.