كولوسوس ممفيس من xAI: تشريح حاسوب فائق يضم 100,000 وحدة معالجة رسومات

بنت xAI مجموعة كولوسوس المؤلفة من 100,000 وحدة معالجة رسومات في 122 يوماً، ثم ضاعفتها إلى 200,000 في 92 يوماً إضافياً. طاقة 250 ميغاواط، شبكة Spectrum-X Ethernet. نظرة داخل أكبر حاسوب فائق للذكاء الاصطناعي في العالم.

كولوسوس ممفيس من xAI: تشريح حاسوب فائق يضم 100,000 وحدة معالجة رسومات

كولوسوس ممفيس من xAI: تشريح مجموعة تضم 100,000 وحدة معالجة رسومات

آخر تحديث: 11 ديسمبر 2025

تحديث ديسمبر 2025: تضم كولوسوس الآن 150,000 وحدة H100 + 50,000 وحدة H200 + 30,000 وحدة GB200 — أكبر مجموعة تدريب ذكاء اصطناعي متماسكة في العالم. بُنيت في 122 يوماً (100,000 وحدة في المرحلة الأولى)، وتضاعفت في 92 يوماً إضافياً. يُخطط للتوسع إلى مليون وحدة معالجة رسومات. تستهلك 250 ميغاواط من شبكة ممفيس الكهربائية. تحقق شبكة Spectrum-X Ethernet معدل نقل بيانات 95% مقارنة بـ 60% على شبكات Ethernet التقليدية.

في 122 يوماً فقط، نشرت مجموعة كولوسوس التابعة لـ xAI عدد 100,000 وحدة معالجة رسومات NVIDIA H100 في مصنع أجهزة منزلية سابق في ممفيس، تينيسي.¹ ثم ضاعفت xAI النظام إلى 200,000 وحدة معالجة رسومات في 92 يوماً إضافياً.² تضم المجموعة حالياً 150,000 وحدة H100، و50,000 وحدة H200، و30,000 وحدة GB200، مما يجعلها أكبر مجموعة تدريب ذكاء اصطناعي متماسكة وعاملة بالكامل في العالم.³ تخطط xAI للتوسع إلى مليون وحدة معالجة رسومات.⁴ يُظهر المشروع كيف يبدو النشر القوي للبنية التحتية عندما تُعطي المؤسسة الأولوية للسرعة على الجداول الزمنية التقليدية للتخطيط.

يقدم مشروع كولوسوس دروساً لأي مؤسسة تبني بنية تحتية للذكاء الاصطناعي على نطاق واسع. تكشف القرارات المتعلقة بالطاقة والتبريد والشبكات واختيار المرافق كيف يمكن التغلب على القيود عندما تثبت الأساليب التقليدية بطئها. كما تكشف المقايضات عن مخاطر تتجنبها عمليات النشر الأكثر منهجية.

الجدول الزمني للبناء والنهج المتبع

تلقى ماسك عروض أسعار أولية تتراوح بين 18 و24 شهراً لبناء مركز البيانات.⁵ رفض ماسك هذا الجدول الزمني، فوجدت xAI مصنع Electrolux السابق في ممفيس، الذي افتتحته الشركة المصنعة للأجهزة المنزلية في 2012 وأغلقته في 2020.⁶ وفر المرفق المهجور مساحة مستودعات كبيرة و15 ميغاواط من الطاقة الصناعية الأولية.⁷

أكد تشارلز ليانغ، الرئيس التنفيذي لـ Supermicro، أن شركته تعاونت مع xAI لبناء مركز بيانات كولوسوس الضخم في 122 يوماً.⁸ شاركت كل من Dell Technologies وSupermicro في البناء مع xAI.⁹ تطلب الجدول الزمني المضغوط مسارات عمل متوازية عبر إعداد المرافق والبنية التحتية للطاقة وأنظمة التبريد ونشر الحوسبة.

تستخدم مجموعة الـ 100,000 وحدة معالجة رسومات خوادم HGX التي تحتوي على ثماني وحدات لكل خادم، موضوعة في حوامل Supermicro المبردة بالسوائل مع 64 وحدة معالجة رسومات لكل حامل.¹⁰ يتألف النشر الإجمالي من 1,500 حامل لوحدات المعالجة الرسومية.¹¹ تطلبت كثافة الحوامل التبريد السائل منذ البداية، حيث وفرت أنظمة Supermicro المبردة بالسوائل بحجم 4U الإدارة الحرارية.¹²

بعد ثلاثة أشهر من النشر الأولي، أعلنت xAI عن التوسع إلى 200,000 وحدة معالجة رسومات مع خطط للاستمرار في التوسع إلى مليون وحدة.¹³ أثبت التوسع أن بنية البنية التحتية يمكن أن تستوعب النمو دون إعادة تصميم جوهرية.

البنية التحتية للطاقة بحجم غير مسبوق

يستهلك مرفق كولوسوس حالياً حوالي 250 ميغاواط، ارتفاعاً من التكوين الأولي البالغ 150 ميغاواط.¹⁴ ركّبت xAI عدد 35 توربيناً غازياً قادراً على إنتاج 420 ميغاواط من الطاقة إلى جانب أنظمة بطاريات Tesla Megapack.¹⁵ يوفر النهج الهجين كلاً من الطاقة الأساسية والاستقلالية عن الشبكة.

صممت xAI وبنت أول محطة فرعية لـ MLGW في 97 يوماً، مُكملةً محطة فرعية بقدرة 150 ميغاواط كانت ستستغرق عادةً سنتين ونصف.¹⁶ تطلب التسريع العمل مع Memphis Light, Gas and Water مع نشر حلول طاقة مؤقتة في الوقت نفسه.

نشرت الشركة 208 وحدة Tesla Megapack لتشغيل الحاسوب الفائق، عازلةً إياه في البداية عن شبكة MLGW.¹⁷ تخزن وحدات Megapack كميات كبيرة من الكهرباء، موفرةً نسخاً احتياطياً أثناء انقطاعات الشبكة ومُمكّنةً العمليات قبل اكتمال التوصيلات الدائمة للمرافق.

تمتلك Solaris Energy Infrastructure أسطولاً من التوربينات الغازية بقدرة 600 ميغاواط، منها حوالي 400 ميغاواط تخدم حالياً xAI.¹⁸ تمثل xAI نسبة 67% من دفتر طلبات Solaris البالغ 1,700 ميغاواط، بإجمالي 1,140 ميغاواط.¹⁹ تتوقع Solaris أن يكون لديها أكثر من 1.1 غيغاواط من التوربينات العاملة بالكامل لـ xAI بحلول الربع الثاني من 2027.²⁰

يتضمن توسع كولوسوس 2 في موقع Tulane Road ما لا يقل عن 110,000 وحدة NVIDIA GB200 بحمل طاقة يبلغ حوالي 170 ميغاواط.²¹ تدعم وحدات Megapack إضافية وسعة توربينات إضافية البصمة الموسعة.

حصلت xAI على تصاريح لتوربينات تعمل بالغاز لتشغيل الحاسوب الفائق.²² تنتهي صلاحية التصريح في 2027، وبحلول ذلك الوقت تنوي xAI الاعتماد على مصادر طاقة متعددة بما في ذلك محطتان فرعيتان لـ MLGW ممولتان ومبنيتان في حرم كولوسوس.²³ تخطط xAI لبدء بناء مزرعة شمسية بمساحة 500 فدان بالقرب من الموقع.²⁴

أنظمة التبريد والبنية التحتية للمياه

منذ البداية، نقلت xAI المياه بالشاحنات وأعادت تدويرها عبر نظام حلقة مغلقة داخلي لتبريد الحاسوب الفائق.²⁵ مكّن النهج غير التقليدي العمليات قبل اكتمال البنية التحتية الدائمة للمياه. التزمت xAI ببناء منشأة لإعادة تدوير مياه الصرف الصحي بقيمة 80 مليون دولار لتلبية احتياجات المياه طويلة المدى.²⁶

تخطط الشركة لبناء أكبر محطة لإعادة تدوير مياه الصرف الصحي بتقنية المفاعل الحيوي بالأغشية الخزفية في العالم.²⁷ بمجرد اكتمالها، ستحمي المنشأة ما يُقدر بـ 4.745 مليار غالون من مياه الطبقة الجوفية.²⁸ يجري بناء برج تبريد ضخم للمياه الرمادية سيضخ المياه المعاد تدويرها المُبردة إلى كولوسوس من محطة المياه الرمادية القريبة.²⁹

يستخدم كولوسوس 2 نهجاً هجيناً للتبريد. يأتي حوالي نصف التبريد من منشأة المياه الرمادية التابعة لـ xAI بينما يستخدم النصف الآخر التبريد بالهواء.³⁰ بحلول أغسطس 2025، وفرت 119 مبرداً هوائياً حوالي 200 ميغاواط من سعة التبريد، وهو ما يكفي لحوالي 110,000 وحدة GB200 NVL72.³¹

خلال مرحلة البناء الأولية، استأجرت xAI مولدات وحوالي ربع سعة التبريد المتنقل في الولايات المتحدة لبدء العمليات بسرعة.³² مكّن الشراء القوي للبنية التحتية المؤقتة الجدول الزمني المضغوط بينما اكتملت الأنظمة الدائمة.

شبكة Spectrum-X Ethernet

على عكس معظم مجموعات تدريب الذكاء الاصطناعي التي تستخدم InfiniBand، تستخدم كولوسوس من xAI منصة Spectrum-X Ethernet من NVIDIA لشبكة RDMA الخاصة بها.³³ يُظهر هذا الاختيار أن Ethernet يمكن أن تدعم أكبر مجموعات تدريب الذكاء الاصطناعي عند تكوينها بشكل صحيح.

تستخدم كولوسوس Spectrum SN5600 بسرعة 51.2 تيرابت في الثانية، والذي يوفر 64 منفذ Ethernet بسرعة 800 غيغابت في شكل 2U.³⁴ تستخدم العقد الفردية بطاقات BlueField-3 SuperNICs من NVIDIA التي تتميز باتصال واحد بسرعة 400 غيغابت لكل وحدة معالجة رسومات.³⁵

حققت الشبكة صفر تدهور في زمن الوصول للتطبيقات أو فقدان للحزم بسبب تصادمات التدفق عبر جميع المستويات الثلاثة للنسيج.³⁶ حافظ النظام على معدل نقل بيانات 95% بفضل التحكم في الازدحام من Spectrum-X.³⁷ عادةً ما تقدم شبكات Ethernet القياسية 60% فقط من معدل النقل على هذا النطاق بسبب آلاف تصادمات التدفق.³⁸

تعاني شبكات Ethernet التقليدية من مشاكل التدفق الداخلي عندما تتواصل آلاف وحدات المعالجة الرسومية في وقت واحد.³⁹ حلت InfiniBand هذا تقليدياً باستخدام التحكم في تدفق الأولوية المدمج وإدارة الازدحام على مستوى الأجهزة.⁴⁰ تحقق Spectrum-X نتائج مماثلة باستخدام RoCE v2 مع آليات محسنة للتحكم في الازدحام.⁴¹

يوفر نهج Ethernet فوائد من حيث التكلفة والمرونة مقارنة بـ InfiniBand مع الحفاظ على الأداء. تُمكّن ميزات Spectrum-X بما في ذلك التوجيه التكيفي مع تقنية وضع البيانات المباشر، والتحكم في الازدحام، ورؤية محسنة لنسيج الذكاء الاصطناعي من تحقيق أداء مشابه لـ InfiniBand على بنية Ethernet التحتية.⁴²

مقارنة الحجم

تتفوق كولوسوس بـ 200,000 وحدة معالجة رسومات على الحواسيب الفائقة الكبرى الأخرى بفوارق كبيرة.⁴³ يحتوي الحاسوب الفائق للذكاء الاصطناعي بمقياس زيتا من Oracle على 131,072 وحدة معالجة رسومات NVIDIA.⁴⁴ يحتوي El Capitan في مختبر لورنس ليفرمور الوطني على 44,544 وحدة معالجة رسومات.⁴⁵ يحتوي Frontier في مختبر أوك ريدج الوطني على 37,632 وحدة معالجة رسومات.⁴⁶

وفقاً لمواصفات xAI، تحقق كولوسوس عرض نطاق ذاكرة إجمالي يبلغ 194 بيتابايت في الثانية مع سعة تخزين تتجاوز إكسابايت واحد.⁴⁷ يُمكّن عرض نطاق الذاكرة العمليات الجماعية التي يتطلبها تدريب الذكاء الاصطناعي عبر مئات الآلاف من وحدات المعالجة الرسومية.

تُدرّب المجموعة روبوت المحادثة Grok التابع لـ xAI وتوفر دعم الحوسبة لـ X ومشاريع ماسك الأخرى بما في ذلك SpaceX.⁴⁸ يُبرر الاستخدام متعدد الأغراض الاستثمار في البنية التحتية عبر خطوط أعمال متعددة.

توسع كولوسوس 2

أطلقت xAI مشروع كولوسوس 2 في 7 مارس 2025، واستحوذت على مستودع بمساحة مليون قدم مربع في ممفيس بالإضافة إلى موقعين مجاورين بمساحة إجمالية 100 فدان.⁴⁹ سيستضيف موقع Tulane Road أسطول وحدات المعالجة الرسومية الموسع.

يستهدف التوسع 350,000 وحدة معالجة رسومات مع أكبر نشر في العالم لبطاريات Tesla Megapack للطاقة الاحتياطية أثناء الأحمال العالية على الشبكة.⁵⁰ سيضم الموقع من 60 إلى 70 وحدة Megapack إلى جانب البنية التحتية لوحدات المعالجة الرسومية.⁵¹

تدّعي غرفة التجارة في ممفيس أن xAI تنوي التوسع إلى مليون وحدة معالجة رسومات إجمالاً.⁵² يتطلب تحقيق هذا النطاق استمرار تطوير البنية التحتية للطاقة بما يتجاوز السعة الحالية. ستدعم الـ 1.1 غيغاواط التي تخطط لها Solaris لعام 2027 حوالي نصف مليون وحدة معالجة رسومات عالية الطاقة بمستويات الكثافة الحالية.

دروس البنية التحتية

يُظهر مشروع كولوسوس عدة أساليب تُسرّع نشر البنية التحتية للذكاء الاصطناعي.

يمكن لإعادة استخدام المرافق أن تضغط الجداول الزمنية بشكل كبير. أدى العثور على منشأة صناعية قائمة مع بنية تحتية للطاقة إلى إلغاء وقت البناء الذي تتطلبه المباني الجديدة. قد تجد المؤسسات التي لديها إمكانية الوصول إلى المرافق الصناعية المُوقفة فرصاً لنشر سريع للبنية التحتية للذكاء الاصطناعي.

تُمكّن البنية التحتية المؤقتة المسارات المتوازية. سمح استئجار المولدات والتبريد المتنقل ونقل المياه بالشاحنات ببدء العمليات بينما اكتملت البنية التحتية الدائمة. قد تثبت علاوة تكلفة الحلول المؤقتة جدواها عندما يحدد وقت بدء التشغيل الموقف التنافسي.

يمكن لـ Ethernet دعم أكبر المجموعات. يُثبت نشر Spectrum-X أن InfiniBand ليست مطلوبة لتدريب الذكاء الاصطناعي على نطاق واسع. قد لا تحتاج المؤسسات ذات الخبرة والبنية التحتية في Ethernet إلى تبني InfiniBand حتى لأكبر عمليات النشر.

تبقى الطاقة القيد الأساسي. على الرغم من الحلول الإبداعية بما في ذلك تخزين البطاريات والتوربينات الغازية وبناء المحطات الفرعية المُسرّع، حدّ توفر الطاقة من سرعة ونطاق النشر. يجب على المؤسسات التي تخطط لمجموعات ذكاء اصطناعي كبيرة تأمين سعة الطاقة أولاً.

تشمل المقايضات التحديات التنظيمية ومشكلات العلاقات المجتمعية والمخاطر التقنية من الجداول الزمنية المضغوطة. ينتهي تصريح xAI للتوربينات الغازية في 2027، مما يخلق متطلبات انتقال.⁵³ أعرب المسؤولون المحليون عن مخاوف بشأن محدودية الرؤية في عمليات xAI.⁵⁴ قد تخلق السرعة التي تُمكّن الميزة التنافسية ديوناً تقنية تتجنبها عمليات النشر الأبطأ.

مرجع سريع: مواصفات كولوسوس

المواصفات القيمة
إجمالي وحدات المعالجة الرسومية أكثر من 200,000 (150,000 H100، 50,000 H200، 30,000 GB200)
وقت البناء 122 يوماً (المرحلة 1)، 92 يوماً (المرحلة 2)
استهلاك الطاقة 250 ميغاواط حالياً
البنية التحتية للطاقة 35 توربيناً غازياً (420 ميغاواط)، 208 وحدة Tesla Megapack
الشبكات NVIDIA Spectrum-X 800G Ethernet
التخزين أكثر من 1 إكسابايت
عرض نطاق الذاكرة 194 بيتابايت/ثانية
تكوين الحوامل 64 وحدة معالجة رسومية لكل حامل، 1,500 حامل
التبريد تبريد سائل + إعادة تدوير المياه الرمادية
هدف التوسع مليون وحدة معالجة رسومية

النقاط الرئيسية

لقادة البنية التحتية: - عروض أسعار مراكز البيانات التقليدية: 18-24 شهراً؛ سلّمت xAI في 122 يوماً باستخدام إعادة استخدام المرافق - البنية التحتية المؤقتة (مولدات مستأجرة، تبريد متنقل، مياه منقولة بالشاحنات) تُمكّن المسارات المتوازية - تبقى الطاقة القيد الأساسي—أمّن السعة قبل شراء وحدات المعالجة الرسومية - أثبتت Spectrum-X Ethernet جدواها على نطاق 200,000 وحدة معالجة رسومية، متحديةً ضرورة InfiniBand

لفرق المرافق: - توفر المرافق الصناعية المُوقفة فرصاً للنشر السريع - تتطلب 250 ميغاواط مصادر طاقة متعددة—توربينات غازية، بطاريات، محطات فرعية للمرافق - تعالج إعادة تدوير المياه الرمادية مخاوف المياه على نطاق واسع—منشأة بقيمة 80 مليون دولار تحمي 4.7 مليار غالون من الطبقة الجوفية - توفر 119 مبرداً هوائياً حوالي 200 ميغاواط من سعة التبريد

للتخطيط الاستراتيجي: - مقايضة السرعة مقابل الاستدامة: تنتهي تصاريح التوربينات الغازية في 2027 - تخلق الجداول الزمنية المضغوطة ديوناً تقنية تتجنبها عمليات النشر المنهجية - يُبرر الاستخدام متعدد الأغراض (Grok، X، SpaceX) الاستثمار في البنية التحتية - يتطلب هدف المليون وحدة معالجة رسومية

[تم اقتطاع المحتوى للترجمة]

طلب عرض سعر_

أخبرنا عن مشروعك وسنرد خلال 72 ساعة.

> TRANSMISSION_COMPLETE

تم استلام الطلب_

شكراً لاستفسارك. سيقوم فريقنا بمراجعة طلبك والرد خلال 72 ساعة.

QUEUED FOR PROCESSING