NVIDIA Rubin يدخل الإنتاج الكامل: معالج GPU بـ 336 مليار ترانزستور يعيد تشكيل البنية التحتية للذكاء الاصطناعي

صدم Jensen Huang مؤتمر CES 2026 بخبر أن منصة Rubin من الجيل التالي من NVIDIA دخلت بالفعل الإنتاج الكامل—قبل أشهر من المتوقع. تعد البنية المكونة من ست شرائح بتخفيض 10 أضعاف في تكاليف الاستدلال وتشير إلى تحول جوهري في اقتصاديات مراكز البيانات.

Blake Crosley

Jan 08, 2026 4 min read Disclaimer

NVIDIA Rubin يدخل الإنتاج الكامل: معالج GPU بـ 336 مليار ترانزستور يعيد تشكيل البنية التحتية للذكاء الاصطناعي

قدم Jensen Huang الإعلان الذي قلب توقعات الصناعة في CES 2026: منصة Rubin من NVIDIA دخلت الإنتاج الكامل. ليس عينات. ليس تأهيل. إنتاج كامل—مع شحنات بكميات كبيرة مستهدفة للنصف الثاني من 2026.

فاجأ التوقيت المحللين الذين خططوا لتوفر Rubin في أوائل 2027. نفذت NVIDIA دورة تطوير عدوانية مدتها 18 شهراً من إطلاق Blackwell إلى إنتاج Rubin، مما ضغط ما يمتد عادةً على 24-30 شهراً في تطوير أشباه الموصلات.

يمثل Rubin أكثر من مجرد ترقية GPU تدريجية. تقدم المنصة بنية كاملة من ست شرائح مصممة لعصر الذكاء الاصطناعي الوكيل—حيث تهيمن أحمال عمل الاستدلال وتحدد التكلفة لكل رمز الجدوى التجارية.

معالج Rubin GPU: 336 مليار ترانزستور من كثافة الحوسبة

يدفع معالج Rubin GPU هندسة أشباه الموصلات إلى حدود جديدة. مع 336 مليار ترانزستور مصنعة على عملية N3 من TSMC، يضاعف Rubin تقريباً عدد ترانزستورات Blackwell البالغ 208 مليار مع الحفاظ على أغلفة طاقة مماثلة من خلال مكاسب الكفاءة المعمارية.[^1]

المواصفات الأساسية

المواصفة	Rubin	Blackwell	التحسين
عدد الترانزستورات	336B	208B	1.6x
عقدة العملية	TSMC N3	TSMC 4NP	جيل واحد
سعة HBM	288GB HBM4	192GB HBM3e	1.5x
عرض نطاق الذاكرة	22 TB/s	8 TB/s	2.75x
استدلال FP4	50 PFLOPS	20 PFLOPS	2.5x
الربط البيني	NVLink 6	NVLink 5	3.6 TB/s لكل GPU

يمثل النظام الفرعي للذاكرة التقدم الأكثر أهمية في Rubin. يوفر تكامل HBM4 سعة 288GB لكل GPU مع عرض نطاق 22 TB/s—مما يتيح الاستدلال على نماذج تتجاوز تريليون معلمة دون عقوبات زمن الاستجابة للتوزيع متعدد العقد.[^2]

الابتكارات المعمارية

يقدم Rubin محركات Transformer من الجيل الرابع المحسنة لآليات الانتباه التي تهيمن على بنى الذكاء الاصطناعي الحديثة. تدعم هذه المحركات التحجيم الديناميكي للدقة—اختيار حساب FP4 أو FP8 أو FP16 تلقائياً بناءً على متطلبات الطبقة دون تدخل برمجي.[^4]

معالج Vera: مصمم خصيصاً لمراكز بيانات الذكاء الاصطناعي

يُنشر Rubin جنباً إلى جنب مع Vera، أول معالج مركزي مخصص من NVIDIA مصمم خصيصاً للبنية التحتية للذكاء الاصطناعي.[^7]

مواصفات Vera

المواصفة	معالج Vera	Grace (السابق)
البنية	مخصصة قائمة على ARM	ARM Neoverse V2
عدد النوى	96 نواة	72 نواة
الذاكرة	512GB LPDDR6	480GB LPDDR5X
عرض نطاق الذاكرة	800 GB/s	546 GB/s
واجهة NVLink	1.8 TB/s	900 GB/s

Vera Rubin NVL72: الحاسوب الفائق المرجعي

تغلف NVIDIA معالجات Rubin وVera في Vera Rubin NVL72—نظام بحجم الخزانة يحتوي على 72 معالج Rubin GPU و36 معالج Vera CPU يعملون كنسيج حوسبة موحد.[^10]

مواصفات النظام

المواصفة	Vera Rubin NVL72	Blackwell NVL72
GPUs	72x Rubin	72x Blackwell
CPUs	36x Vera	36x Grace
إجمالي HBM	20.7 TB	13.8 TB
استدلال FP4	3.6 EFLOPS	1.4 EFLOPS
تدريب FP8	2.5 EFLOPS	0.72 EFLOPS
عرض نطاق NVLink	259 TB/s	130 TB/s
طاقة الخزانة	120-130 kW	120 kW

ادعاء تخفيض التكلفة 10x

يتطلب ادعاء NVIDIA الرئيسي بتخفيض تكاليف الاستدلال 10 أضعاف مقارنة بـ Blackwell تدقيقاً. يجمع الحساب عدة عوامل:[^12]

تحسين الحوسبة الخام: 2.57x المزيد من FLOPS FP4 لكل نظام

سعة الذاكرة: 1.5x المزيد من HBM يتيح أحجام دفعات أكبر

كفاءة الربط البيني: NVLink 6 يقلل حمل الاتصالات بنسبة 40%

فك التشفير التخميني: تسريع الأجهزة يوفر تحسين إنتاجية 3-4x

كفاءة الطاقة: الأداء لكل واط يتحسن 2.2x

متطلبات البنية التحتية للتبريد والطاقة

يتطلب Vera Rubin NVL72 تبريداً سائلاً 100%—لا توجد تكوينات مبردة بالهواء.[^18]

مواصفات التبريد

المعلمة	المتطلب
طريقة التبريد	سائل مباشر إلى الشريحة
درجة حرارة المبرد	15-25°C إمداد
معدل التدفق	45-60 لتر/دقيقة لكل خزانة
رفض الحرارة	120-130 kW لكل خزانة

التموضع التنافسي

مقارنة AMD MI455X

يستهدف MI455X من AMD نفس سوق البنية التحتية للذكاء الاصطناعي الراقية:[^24]

المواصفة	NVIDIA Rubin	AMD MI455X
عدد الترانزستورات	336B	320B
العملية	TSMC N3	TSMC N3/N2 هجين
سعة HBM	288GB HBM4	432GB HBM4
عرض نطاق الذاكرة	22 TB/s	24 TB/s
استدلال FP4	50 PFLOPS	40 PFLOPS

التزامات العملاء

التزم كل عميل رئيسي للبنية التحتية للذكاء الاصطناعي بنشر Rubin:

المزود	الالتزام	الجدول الزمني
AWS	اتفاقية سعة متعددة السنوات	إطلاق H2 2026
Microsoft Azure	البنية التحتية الأساسية للذكاء الاصطناعي	Q4 2026
Google Cloud	استراتيجية مزدوجة TPU + Rubin	H2 2026
Oracle Cloud	شراكة موسعة	Q3 2026

ماذا يعني هذا لمشغلي مراكز البيانات

يمثل إنتاج Rubin نقطة انعطاف لاستراتيجية البنية التحتية للذكاء الاصطناعي:

تصرف الآن بشأن البنية التحتية: تتطلب ترقيات التبريد السائل والطاقة فترات انتظار 12-18 شهراً.

أمّن السعة مبكراً: ستستهلك الشركات الضخمة أحجام الإنتاج الأولية.

خطط للكثافة: تتطلب أنظمة Rubin 120+ kW لكل خزانة كحد أدنى.

تتخصص Introl في البنية التحتية لمراكز البيانات لأحمال عمل الذكاء الاصطناعي. يدعم 550 مهندساً ميدانياً لدينا عمليات النشر في 257 موقعاً عالمياً. اتصل بنا لمناقشة متطلبات البنية التحتية لـ Rubin الخاصة بك.