NVIDIA Rubin يدخل الإنتاج الكامل: معالج GPU بـ 336 مليار ترانزستور يعيد تشكيل البنية التحتية للذكاء الاصطناعي

صدم Jensen Huang مؤتمر CES 2026 بخبر أن منصة Rubin من الجيل التالي من NVIDIA دخلت بالفعل الإنتاج الكامل—قبل أشهر من المتوقع. تعد البنية المكونة من ست شرائح بتخفيض 10 أضعاف في تكاليف الاستدلال وتشير إلى تحول جوهري في اقتصاديات مراكز البيانات.

NVIDIA Rubin يدخل الإنتاج الكامل: معالج GPU بـ 336 مليار ترانزستور يعيد تشكيل البنية التحتية للذكاء الاصطناعي

قدم Jensen Huang الإعلان الذي قلب توقعات الصناعة في CES 2026: منصة Rubin من NVIDIA دخلت الإنتاج الكامل. ليس عينات. ليس تأهيل. إنتاج كامل—مع شحنات بكميات كبيرة مستهدفة للنصف الثاني من 2026.

فاجأ التوقيت المحللين الذين خططوا لتوفر Rubin في أوائل 2027. نفذت NVIDIA دورة تطوير عدوانية مدتها 18 شهراً من إطلاق Blackwell إلى إنتاج Rubin، مما ضغط ما يمتد عادةً على 24-30 شهراً في تطوير أشباه الموصلات.

يمثل Rubin أكثر من مجرد ترقية GPU تدريجية. تقدم المنصة بنية كاملة من ست شرائح مصممة لعصر الذكاء الاصطناعي الوكيل—حيث تهيمن أحمال عمل الاستدلال وتحدد التكلفة لكل رمز الجدوى التجارية.

معالج Rubin GPU: 336 مليار ترانزستور من كثافة الحوسبة

يدفع معالج Rubin GPU هندسة أشباه الموصلات إلى حدود جديدة. مع 336 مليار ترانزستور مصنعة على عملية N3 من TSMC، يضاعف Rubin تقريباً عدد ترانزستورات Blackwell البالغ 208 مليار مع الحفاظ على أغلفة طاقة مماثلة من خلال مكاسب الكفاءة المعمارية.[^1]

المواصفات الأساسية

المواصفة Rubin Blackwell التحسين
عدد الترانزستورات 336B 208B 1.6x
عقدة العملية TSMC N3 TSMC 4NP جيل واحد
سعة HBM 288GB HBM4 192GB HBM3e 1.5x
عرض نطاق الذاكرة 22 TB/s 8 TB/s 2.75x
استدلال FP4 50 PFLOPS 20 PFLOPS 2.5x
الربط البيني NVLink 6 NVLink 5 3.6 TB/s لكل GPU

يمثل النظام الفرعي للذاكرة التقدم الأكثر أهمية في Rubin. يوفر تكامل HBM4 سعة 288GB لكل GPU مع عرض نطاق 22 TB/s—مما يتيح الاستدلال على نماذج تتجاوز تريليون معلمة دون عقوبات زمن الاستجابة للتوزيع متعدد العقد.[^2]

الابتكارات المعمارية

يقدم Rubin محركات Transformer من الجيل الرابع المحسنة لآليات الانتباه التي تهيمن على بنى الذكاء الاصطناعي الحديثة. تدعم هذه المحركات التحجيم الديناميكي للدقة—اختيار حساب FP4 أو FP8 أو FP16 تلقائياً بناءً على متطلبات الطبقة دون تدخل برمجي.[^4]

معالج Vera: مصمم خصيصاً لمراكز بيانات الذكاء الاصطناعي

يُنشر Rubin جنباً إلى جنب مع Vera، أول معالج مركزي مخصص من NVIDIA مصمم خصيصاً للبنية التحتية للذكاء الاصطناعي.[^7]

مواصفات Vera

المواصفة معالج Vera Grace (السابق)
البنية مخصصة قائمة على ARM ARM Neoverse V2
عدد النوى 96 نواة 72 نواة
الذاكرة 512GB LPDDR6 480GB LPDDR5X
عرض نطاق الذاكرة 800 GB/s 546 GB/s
واجهة NVLink 1.8 TB/s 900 GB/s

Vera Rubin NVL72: الحاسوب الفائق المرجعي

تغلف NVIDIA معالجات Rubin وVera في Vera Rubin NVL72—نظام بحجم الخزانة يحتوي على 72 معالج Rubin GPU و36 معالج Vera CPU يعملون كنسيج حوسبة موحد.[^10]

مواصفات النظام

المواصفة Vera Rubin NVL72 Blackwell NVL72
GPUs 72x Rubin 72x Blackwell
CPUs 36x Vera 36x Grace
إجمالي HBM 20.7 TB 13.8 TB
استدلال FP4 3.6 EFLOPS 1.4 EFLOPS
تدريب FP8 2.5 EFLOPS 0.72 EFLOPS
عرض نطاق NVLink 259 TB/s 130 TB/s
طاقة الخزانة 120-130 kW 120 kW

ادعاء تخفيض التكلفة 10x

يتطلب ادعاء NVIDIA الرئيسي بتخفيض تكاليف الاستدلال 10 أضعاف مقارنة بـ Blackwell تدقيقاً. يجمع الحساب عدة عوامل:[^12]

تحسين الحوسبة الخام: 2.57x المزيد من FLOPS FP4 لكل نظام

سعة الذاكرة: 1.5x المزيد من HBM يتيح أحجام دفعات أكبر

كفاءة الربط البيني: NVLink 6 يقلل حمل الاتصالات بنسبة 40%

فك التشفير التخميني: تسريع الأجهزة يوفر تحسين إنتاجية 3-4x

كفاءة الطاقة: الأداء لكل واط يتحسن 2.2x

متطلبات البنية التحتية للتبريد والطاقة

يتطلب Vera Rubin NVL72 تبريداً سائلاً 100%—لا توجد تكوينات مبردة بالهواء.[^18]

مواصفات التبريد

المعلمة المتطلب
طريقة التبريد سائل مباشر إلى الشريحة
درجة حرارة المبرد 15-25°C إمداد
معدل التدفق 45-60 لتر/دقيقة لكل خزانة
رفض الحرارة 120-130 kW لكل خزانة

التموضع التنافسي

مقارنة AMD MI455X

يستهدف MI455X من AMD نفس سوق البنية التحتية للذكاء الاصطناعي الراقية:[^24]

المواصفة NVIDIA Rubin AMD MI455X
عدد الترانزستورات 336B 320B
العملية TSMC N3 TSMC N3/N2 هجين
سعة HBM 288GB HBM4 432GB HBM4
عرض نطاق الذاكرة 22 TB/s 24 TB/s
استدلال FP4 50 PFLOPS 40 PFLOPS

التزامات العملاء

التزم كل عميل رئيسي للبنية التحتية للذكاء الاصطناعي بنشر Rubin:

المزود الالتزام الجدول الزمني
AWS اتفاقية سعة متعددة السنوات إطلاق H2 2026
Microsoft Azure البنية التحتية الأساسية للذكاء الاصطناعي Q4 2026
Google Cloud استراتيجية مزدوجة TPU + Rubin H2 2026
Oracle Cloud شراكة موسعة Q3 2026

ماذا يعني هذا لمشغلي مراكز البيانات

يمثل إنتاج Rubin نقطة انعطاف لاستراتيجية البنية التحتية للذكاء الاصطناعي:

تصرف الآن بشأن البنية التحتية: تتطلب ترقيات التبريد السائل والطاقة فترات انتظار 12-18 شهراً.

أمّن السعة مبكراً: ستستهلك الشركات الضخمة أحجام الإنتاج الأولية.

خطط للكثافة: تتطلب أنظمة Rubin 120+ kW لكل خزانة كحد أدنى.


تتخصص Introl في البنية التحتية لمراكز البيانات لأحمال عمل الذكاء الاصطناعي. يدعم 550 مهندساً ميدانياً لدينا عمليات النشر في 257 موقعاً عالمياً. اتصل بنا لمناقشة متطلبات البنية التحتية لـ Rubin الخاصة بك.

طلب عرض سعر_

أخبرنا عن مشروعك وسنرد خلال 72 ساعة.

> TRANSMISSION_COMPLETE

تم استلام الطلب_

شكراً لاستفسارك. سيقوم فريقنا بمراجعة طلبك والرد خلال 72 ساعة.

QUEUED FOR PROCESSING