منصة NVIDIA Vera Rubin: أداء 8 إكسافلوبس ومتطلبات البنية التحتية
تم التحديث في 11 ديسمبر 2025
تحديث ديسمبر 2025: Vera Rubin (2026) تقدم 8 إكسافلوبس — الأداء المجمع لقائمة TOP500 بأكملها. حوالي 500 مليار ترانزستور على تقنية TSMC N2، ذاكرة HBM4 بعرض نطاق 13 تيرابايت/ثانية، NVLink 6 بسرعة 5 تيرابايت/ثانية ثنائية الاتجاه. 600 كيلوواط لكل خزانة، 2,000 واط TDP لكل شريحة. Rubin Ultra (النصف الثاني من 2027) مع ذاكرة HBM4e تصل إلى 365 تيرابايت عبر NVL576. تتطلب توصيل طاقة 48 فولت مباشر للشريحة.
ثمانية إكسافلوبس من القدرة الحسابية تبدو مجردة حتى تدرك أنها تعادل الأداء المجمع لكل حاسوب خارق في قائمة TOP500 على الأرض، مضغوطة في بنية تحتية تتسع في صف واحد من مركز البيانات.¹ منصة NVIDIA Vera Rubin، المقرر نشرها في 2026، تعد بهذه القدرة بالضبط من خلال تطورات معمارية جذرية تجعل أقوى الأنظمة اليوم تبدو قديمة. المؤسسات التي تخطط للبنية التحتية اليوم يجب أن تأخذ في الحسبان أنظمة ستستهلك ما يصل إلى 600 كيلوواط لكل خزانة وتتطلب تقنيات تبريد تدفع الحدود التجارية.
تأخذ المنصة اسمها من عالمة الفلك Vera Rubin، التي أحدثت ملاحظاتها حول المادة المظلمة ثورة في علم الكونيات — تكريم مناسب لمعمارية تعد بإحداث ثورة في قدرات الذكاء الاصطناعي.² كشف Jensen Huang عن المواصفات في GTC 2025: شرائح مصنعة على عملية TSMC بتقنية 3 نانومتر (N3P)، ذاكرة HBM4 تقدم عرض نطاق يصل إلى 13 تيرابايت في الثانية، والجيل السادس من NVLink يدعم اتصال GPU إلى GPU بسرعات متعددة التيرابايت في الثانية.³ كل رقم يمثل مضاعفة أو ثلاثة أضعاف القدرات الحالية، مما يتطلب تطور البنية التحتية الذي يتحدى الافتراضات الأساسية حول تصميم مراكز البيانات.
كبار مزودي الخدمات السحابية يحجزون بالفعل سعة لنشر Vera Rubin رغم عدم اليقين بشأن المواصفات النهائية. التزمت Microsoft بـ 15 مليار دولار للبنية التحتية الداعمة للمنصات من الجيل التالي، مع منشآت مصممة لكثافات خزانات بقدرة 500 كيلوواط.⁴ تبني Amazon Web Services مناطق جديدة خصيصاً للحوسبة عالية الكثافة، مع محطات كهرباء فرعية توفر 500 ميغاواط لمنشآت فردية.⁵ يكشف سباق التسلح في البنية التحتية حقيقة صارخة: المؤسسات غير المستعدة لمتطلبات Vera Rubin ستجد نفسها مستبعدة تماماً من قدرات الذكاء الاصطناعي المتقدمة.
قفزة معمارية تعيد تعريف مقياس الحوسبة
تتخلى معمارية Vera Rubin عن التحسين التدريجي لصالح إعادة تصميم ثورية. تحتوي كل شريحة على ما يقدر بـ 500 مليار ترانزستور، أي ما يقارب ثلاثة أضعاف 208 مليار في Blackwell، بفضل عملية TSMC N2 التي تحقق كثافة غير مسبوقة.⁶ ميزانية الترانزستور تمكن من 20,000 نواة tensor لكل شريحة، كل منها قادرة على عمليات الدقة المختلطة من INT4 إلى FP64. تتحول فلسفة التصميم من التسريع العام إلى التحسين الخاص بالذكاء الاصطناعي، مع تخصيص 80% من مساحة القالب لوحدات ضرب المصفوفات.
تكسر معمارية الذاكرة كل سابقة من خلال تكامل HBM4 الذي يوفر عرض نطاق يصل إلى 13 تيرابايت/ثانية لكل شريحة. تظهر خارطة طريق Samsung لـ HBM4 مكدسات بواجهات 2048 بت تعمل بسرعات عالية، مع منصة NVL144 الكاملة التي تحقق 75 تيرابايت من الذاكرة السريعة.⁷ كل GPU من Rubin يوفر سعة ذاكرة HBM4 تبلغ 288 جيجابايت، كافية لخدمة نماذج بـ 400 مليار معامل من ذاكرة GPU واحدة. نظام الذاكرة الفرعي وحده يستهلك طاقة كبيرة، مما يتطلب تبريداً متقدماً فقط لإدارة حرارة DRAM. Rubin Ultra، القادم في النصف الثاني من 2027، سيستخدم ذاكرة HBM4e بسعة تصل إلى 365 تيرابايت عبر تكوين NVL576.
يمكّن تطور الربط البيني من الحوسبة الموزعة الحقيقية على نطاق غير مسبوق. يدعم الجيل السادس من NVLink 200 مسار بسرعة 25 جيجابت/ثانية لكل منها، مما يوفر عرض نطاق ثنائي الاتجاه بقدرة 5 تيرابايت/ثانية بين GPUs.⁸ يسمح عرض النطاق لـ 256 GPU بالعمل كوحدة حسابية متماسكة مع زمن وصول موحد للذاكرة أقل من 500 نانوثانية. تختفي عقوبات الحوسبة الموزعة التقليدية حيث يعمل النظام أشبه بمعالج ضخم واحد منه بمجموعة عنقودية.
تبرز معمارية الرقائق الصغيرة (chiplet) كمفتاح لجدوى التصنيع. تواجه القوالب الأحادية التي تقترب من 1,000 ملم² تحديات عائد كارثية، مع معدلات عيوب تجعل الإنتاج مستحيلاً اقتصادياً. من المرجح أن توظف Vera Rubin تكديس الرقائق الصغيرة ثلاثي الأبعاد مع قوالب حوسبة مصنعة على N2 وقوالب IO على عمليات N4 الناضجة.⁹ تمكّن التغليف المتقدم باستخدام تقنية TSMC SoIC من 50,000 اتصال لكل ملليمتر مربع بين الرقائق الصغيرة، مع الحفاظ على سلامة الإشارة بسرعات متعددة التيرابت.¹⁰
تتطلب معمارية توصيل الطاقة إعادة تخيل كاملة عند استهلاك شريحة بقدرة 2,000 واط. تولد تحويل الطاقة التقليدي بجهد 12 فولت خسائر غير مقبولة عند هذه المستويات من التيار. تنفذ Vera Rubin توصيل طاقة 48 فولت مباشر للشريحة مع تنظيم جهد على مستوى الحزمة.¹¹ تُظهر معمارية Vicor للطاقة المجزأة كفاءة 98% عند أحمال 2,000 واط، لكنها تتطلب تبريداً سائلاً لمكونات توصيل الطاقة نفسها.¹² يصبح نظام الطاقة معقداً مثل معمارية الحوسبة التي يدعمها.
متطلبات البنية التحتية تتجاوز القدرات الحالية
تحطم متطلبات الطاقة لنشر Vera Rubin افتراضات تصميم مراكز البيانات التقليدية. يمكن لخزانة واحدة أن تسحب ما يصل إلى 600 كيلوواط باستمرار، ما يعادل ما يقارب 500 منزل أمريكي.¹³ تصل كثافة الطاقة إلى أكثر من 700 كيلوواط لكل متر مربع، أي 10 أضعاف عمليات النشر عالية الكثافة الحالية. تتطلب المنشآت تغذيات مخصصة للجهد المتوسط 13.8 كيلوفولت مع محطات فرعية داخل الموقع توفر توزيع 4,160 فولت. تكلف البنية التحتية الكهربائية لنشر 100 خزانة 100 مليون دولار قبل النظر في أجهزة الحوسبة.
تبريد 500 كيلوواط لكل خزانة يدفع إلى ما وراء قدرات التبريد السائل الحالية نحو أرض مجهولة. يتجاوز تدفق الحرارة على مستوى الشريحة 500 واط/سم²، مقترباً من الكثافة الحرارية لغرف احتراق محركات الصواريخ.¹⁴ يصبح التبريد السائل ثنائي الطور إلزامياً، باستخدام سوائل مهندسة تغلي عند درجات حرارة محكومة بدقة. تتعامل سوائل 3M من الجيل التالي من Novec مع 1,000 واط/سم² في العروض المختبرية لكنها تتطلب ظروفاً بيئية نقية يصعب الحفاظ عليها في مراكز البيانات الإنتاجية.¹⁵
يتطور التبريد المباشر للشريحة إلى معماريات القنوات الدقيقة بميزات أصغر من شعر الإنسان. يُظهر بحث IBM قنوات دقيقة من السيليكون بعرض 50 ميكرومتر تزيل 1 كيلوواط/سم² مع ارتفاع درجة حرارة 5 درجات مئوية.¹⁶ يتطلب تصنيع حلول التبريد هذه تقنيات تصنيع أشباه الموصلات، مما يجعل المبردات متطورة مثل الشرائح التي تبردها. تكلف كل لوحة تبريد 10,000-15,000 دولار وتتطلب صيانة ربع سنوية لمنع تراكم المعادن الذي يُضعف الأداء.
يتخلى تصميم المنشأة عن الأرضيات المرتفعة التقليدية لصالح ألواح هيكلية تدعم أحمال 2,000 كجم/م². يتطلب توزيع السائل أنابيب بقطر 12 بوصة توفر 1,000 جالون في الدقيقة لكل صف. يجب أن تتعامل أنظمة احتواء التسرب مع الأعطال الكارثية التي يمكن أن تطلق 5,000 جالون من سائل التبريد في ثوانٍ. يضاعف الاحتواء الثانوي تكاليف بناء المنشأة لكنه يمنع الكوارث البيئية التي قد تؤدي إلى الإغلاق التنظيمي.
تتوسع البنية التحتية للشبكة بشكل متناسب مع قوة الحوسبة. يتطلب كل نظام Vera Rubin 16 منفذاً من 800GbE للاتصال الخارجي، بإجمالي 12.8 تيرابت/ثانية لكل نظام.¹⁷ يصبح التبديل الضوئي إلزامياً لأن كابلات النحاس لا يمكنها دعم عرض النطاق المطلوب عبر مسافات مركز البيانات. توفر المفاتيح الفوتونية من شركات مثل Lightmatter أوقات تبديل بالنانوثانية مع صفر استهلاك للطاقة لنسيج التبديل نفسه.¹⁸ تمثل الشبكة وحدها استثماراً بقيمة 50 مليون دولار لنشر متوسط.
المنظومة البرمجية تتطلب تطوراً جوهرياً
تفشل نماذج البرمجة المصممة لـ GPUs المنفصلة بشكل كارثي على معمارية Vera Rubin الموحدة. تقسم الأطر التقليدية العمل عبر الأجهزة، على افتراض مساحات ذاكرة مستقلة ومزامنة صريحة. أنظمة Vera Rubin المتماسكة بـ 256 GPU تعمل كأجهزة منطقية واحدة مع ذاكرة افتراضية موحدة تمتد عبر 36 تيرابايت. يجب على المطورين إعادة التفكير في استراتيجيات التوازي، معاملين المنصة كنظام NUMA ضخم بدلاً من مجموعة موزعة.
تُظهر خارطة طريق CUDA 15.0 من NVIDIA تغييرات جوهرية في API تدعم الحوسبة فائقة النطاق. تتوسع المجموعات التعاونية لدعم ملايين الخيوط المتنسقة عبر أنظمة كاملة.¹⁹ تتطور الذاكرة الموحدة للتعامل مع تخصيصات بحجم البيتابايت مع ترحيل صفحات تلقائي بين طبقات الحوسبة والتخزين. يجرد نموذج البرمجة تعقيد الأجهزة لكنه يتطلب فهماً عميقاً للتسلسل الهرمي للذاكرة لتحقيق الأداء الأمثل.
تصبح تقنية المترجم حاسمة لاستخراج قدرات المنصة. تلتقط التمثيلات الوسيطة القائمة على الرسم البياني بنية التطبيق، مما يمكّن من تحسينات جريئة عبر النظام بأكمله. يبرز MLIR (التمثيل الوسيط متعدد المستويات) كأساس للمترجمات من الجيل التالي التي تحسن من العمليات الرياضية عالية المستوى وصولاً إلى تعليمات نواة tensor الفردية.²⁰ تمتد أوقات الترجمة للنماذج الكبيرة إلى ساعات، لكن الكود المُولد يحقق 90% من الأداء النظري الأقصى.
تتطلب منصات تنسيق الحاويات إصلاحاً معمارياً لإدارة عمليات نشر Vera Rubin. تنهار تجريدات Kubernetes عندما تتطلب pods فردية 256 GPU وميزانيات طاقة بقدرة 500 كيلوواط. تظهر منسقات جديدة تفهم قيود البنية التحتية: توفر الطاقة، سعة التبريد، طوبولوجيا الشبكة، ونطاقات الفشل. تأخذ قرارات الجدولة في الاعتبار الحالة الحرارية وظروف شبكة الطاقة إلى جانب توفر الحوسبة التقليدي.
تواجه أدوات التصحيح والتنميط تعقيداً طاغياً. يولد نظام Vera Rubin واحد 100 جيجابايت/ثانية من بيانات الأداء عن بُعد، مما يتطلب بنية تحتية مخصصة فقط للمراقبة.²¹ لا تستطيع أدوات التنميط التقليدية التعامل مع أنظمة حيث تتضمن عمليات إطلاق kernel الفردية مليارات الخيوط. يصبح التحليل المدفوع بالذكاء الاصطناعي ضرورياً لتحديد اختناقات الأداء وفرص التحسين في طوفان البيانات عن بُعد. يعتمد المطورون على التعلم الآلي لفهم سلوك نظام التعلم الآلي.
النماذج الاقتصادية تتحدى منطق الاستثمار
يبدو سعر Vera Rubin المتوقع بـ 10 ملايين دولار لكل نظام فلكياً حتى تقارنه بالقدرة المقدمة. ثمانية إكسافلوبس تساوي 1,000 GPU من NVIDIA H100 في الحوسبة الخام لكنها تقدم أداءً فعالاً أفضل بـ 10 أضعاف من خلال الكفاءة المعمارية.²² بناء قدرة مكافئة بالتقنية الحالية سيكلف 40 مليون دولار ويستهلك 5 ميغاواط من الطاقة. الكفاءة الرأسمالية بـ 4 أضعاف وكفاءة الطاقة بـ 10 أضعاف تحول حسابات التكلفة الإجمالية للملكية.
تتجاوز التكاليف التشغيلية النفقات الرأسمالية على مدى عمر النظام. استهلاك الطاقة بقدرة 500 كيلوواط يكلف 400,000 دولار سنوياً بالأسعار الصناعية. يضيف التبريد 100,000 دولار أخرى. تساهم المنشآت والصيانة والعمليات بـ 500,000 دولار سنوياً. يكلف كل نظام Vera Rubin مليون دولار سنوياً للتشغيل، مما يجعل الاستخدام حاسماً للجدوى الاقتصادية. المؤسسات التي تحقق استخداماً بنسبة 80% توزع التكاليف على المزيد من الحوسبة، مما يقلل نفقات كل عملية بنسبة 60%.
تتطلب استراتيجيات الإهلاك إعادة تفكير مع تسارع تطور التقنية. يفترض الإهلاك التقليدي لثلاث سنوات انخفاضاً سنوياً في القيمة بنسبة 33%، لكن أنظمة Vera Rubin قد تحافظ على قيمتها لفترة أطول من خلال تحسين البرمجيات. تظل GPUs Volta المبكرة من 2017 قابلة للاستمرار اقتصادياً لأحمال عمل محددة بعد سبع سنوات.²³ يشير الاحتياطي الهائل لقدرات Vera Rubin إلى عمر إنتاجي لخمس سنوات، مما يحسن عوائد الاستثمار بشكل كبير.
يجب أن تتطور نماذج الإيرادات لدعم استثمارات البنية التحتية. قد يكلف تدريب نماذج من فئة GPT-5 على بنية Vera Rubin التحتية 100 مليون دولار لكنه يكتمل في أسابيع بدلاً من أشهر.²⁴ علاوة السرعة تبرر التكاليف للمؤسسات حيث يحدد وقت الوصول إلى السوق النجاح. يجب أن يعكس تسعير API للنماذج المدربة على Vera Rubin تكاليف البنية التحتية مع البقاء تنافسياً مع النماذج الأصغر المدربة على أجهزة أقدم.
تتكيف آليات التمويل مع حجم البنية التحتية. يفشل التأجير التقليدي للمعدات عندما تكلف الأنظمة الفردية 10 ملايين دولار مع قيمة متبقية غير مؤكدة. تظهر نماذج جديدة تجمع بين تمويل المعدات والطاقة
[تم اقتطاع المحتوى للترجمة]