محولات InfiniBand: NVIDIA Quantum-X800 وجيل XDR الذي يدعم الحواسيب الفائقة للذكاء الاصطناعي
تحديث 11 ديسمبر 2025
تحديث ديسمبر 2025: سوق InfiniBand يصل إلى 25.7 مليار دولار في 2025، مع توقعات بـ 127 مليار دولار بحلول 2030 (معدل نمو سنوي مركب 38%). يوفر Quantum-X800 عدد 144 منفذًا بسرعة 800Gbps XDR مع قدرة حوسبة شبكية داخلية 14.4 TFLOPS (9 أضعاف مقارنة بـ NDR). زمن انتقال أقل من 100 نانوثانية بين المنافذ. مجموعة Stargate المكونة من 64,000 نظام GB200 ومجموعة Oracle الفائقة بقدرة زيتا-سكيل والمكونة من 131,000 وحدة GPU تعمل على InfiniBand.
ارتفعت مبيعات محولات InfiniBand في الربع الثاني من 2025 مع تصاعد الطلب على شبكات 800Gbps بفضل منصة Blackwell Ultra من NVIDIA.¹ يُقدَّر سوق InfiniBand بـ 25.74 مليار دولار في 2025، مع توقعات بالنمو إلى 126.99 مليار دولار بحلول 2030 بمعدل نمو سنوي مركب يبلغ 37.60%.² بينما تحافظ Ethernet على ريادتها الإجمالية في سوق الشبكات الخلفية للذكاء الاصطناعي، تهيمن InfiniBand على عمليات النشر الأعلى أداءً حيث يحدد زمن الانتقال المقاس بمئات النانوثانية كفاءة التدريب.
تمثل منصة Quantum-X800 إجابة NVIDIA على متطلبات نماذج التريليون معامل. مع 144 منفذًا بسعة اتصال 800Gbps، و14.4 تيرافلوبس من الحوسبة الشبكية الداخلية عبر SHARP v4، وزمن انتقال أقل من 100 نانوثانية بين المنافذ، يضاعف جيل XDR عرض النطاق الترددي مع توفير قدرة حوسبة شبكية داخلية تفوق منصة NDR السابقة بتسعة أضعاف.³ تعتمد المنشآت الكبرى بما في ذلك أنظمة Stargate المكونة من 64,000 وحدة GB200 ومجموعة Oracle الفائقة بقدرة زيتا-سكيل والمكونة من 131,000 وحدة GPU على NVIDIA InfiniBand للحفاظ على التزامن الدقيق الذي يتطلبه تدريب الذكاء الاصطناعي الموزع.⁴
التطور من NDR إلى XDR
تتقدم أجيال InfiniBand عبر زيادات سرعة موحدة: QDR (40Gbps)، FDR (56Gbps)، EDR (100Gbps)، HDR (200Gbps)، NDR (400Gbps)، والآن XDR (800Gbps).⁵ يضاعف كل جيل عرض النطاق الترددي لكل منفذ مع الحفاظ على زمن الانتقال المنخفض والموثوقية على مستوى الأجهزة التي تميز InfiniBand عن بدائل Ethernet.
قدم NDR (معدل البيانات التالي) الذي أُطلق في 2021 منافذ بسرعة 400Gbps باستخدام أربع مسارات من SerDes المشفرة بـ PAM-4 تعمل بتردد 51.6 GHz.⁶ توفر شرائح Quantum-2 ASICs التي تشغل محولات NDR عدد 256 مسار SerDes بعرض نطاق ترددي أحادي الاتجاه يبلغ 25.6Tbps، معالجةً 66.5 مليار حزمة في الثانية عبر 64 منفذًا بسعة 400Gbps.⁷ جلب NDR موصلات OSFP إلى InfiniBand، مما يتيح رابطًا واحدًا أو اثنين بتكوينات 2x (NDR200) أو 4x (NDR400).⁸
صدرت مواصفات XDR (معدل البيانات الفائق) من جمعية InfiniBand التجارية في أكتوبر 2023 لمضاعفة عرض النطاق الترددي لتلبية متطلبات مراكز بيانات الذكاء الاصطناعي والحوسبة عالية الأداء.⁹ يتيح دعم SerDes بسرعة 200Gbps لكل مسار منافذ بسرعة 800Gbps، مع وصول الاتصالات بين المحولات إلى 1.6Tbps.¹⁰ يقدم XDR الجيل الرابع من SHARP، وتحسينات زمن الانتقال الفائق، وقدرات الإصلاح الذاتي، وتكامل فوتونيات السيليكون.¹¹
تستمر خارطة الطريق نحو تقنية GDR (معدل البيانات الجيجا) التي توفر 1.6Tbps لكل منفذ للأجيال المستقبلية، مما يضمن احتفاظ InfiniBand بموقعها الريادي في الأداء.¹²
بنية منصة NVIDIA Quantum-X800
تقدم منصة Quantum-X800 أول تطبيق لـ InfiniBand XDR، مصمم خصيصًا لنماذج الذكاء الاصطناعي بمقياس تريليون معامل.¹³ يستفيد محول Q3400-RA بحجم 4U من تقنية SerDes بسرعة 200Gbps لكل مسار، وهو أول سيليكون محول يحقق هذه الدرجة من السرعة.¹⁴
تتوسع كثافة المنافذ بشكل كبير. يوفر المحول 144 منفذًا بسعة اتصال 800Gbps موزعة على 72 فتحة OSFP.¹⁵ يتيح الترابط العالي طوبولوجيات نسيج فعالة، حيث تستطيع شجرة دهنية من مستويين ربط ما يصل إلى 10,368 بطاقة ConnectX-8 NIC بأقل زمن انتقال وموقع مهام أمثل.¹⁶
تستهدف مواصفات الأداء أكثر أحمال عمل الذكاء الاصطناعي تطلبًا. يُقاس زمن الانتقال بين المنافذ بأقل من 100 نانوثانية.¹⁷ يوزع التوجيه التكيفي حركة المرور عبر المسارات المتاحة ديناميكيًا. يمنع التحكم في الازدحام القائم على القياس عن بُعد تشبع الشبكة قبل أن يؤثر على استخدام وحدات GPU.¹⁸
توفر الحاويات ثنائية المحولات في طرازات مثل Q3200-RA عدد 72 منفذًا بسرعة 800Gbps عبر عرض نطاق ترددي مجمع يبلغ 1.6Tbps بين المحولات، مما يتيح طوبولوجيات spine-leaf التي تتطلبها مجموعات الذكاء الاصطناعي الكبيرة.¹⁹ تسهل قدرات التوجيه الاختيارية توسيع مجموعات InfiniBand عبر مواقع متعددة، داعمةً بيئات التدريب الموزع الممتدة عبر مواقع جغرافية.²⁰
الحوسبة الشبكية الداخلية SHARP تزيل الاختناقات
يمثل بروتوكول التجميع والاختزال الهرمي القابل للتوسع (SHARP) من NVIDIA الميزة التقنية الحاسمة لـ InfiniBand على بدائل Ethernet. من خلال تفريغ العمليات الجماعية مثل all-reduce والبث إلى محولات الشبكة، يقلل SHARP بشكل كبير حجم نقل البيانات ويقلل التذبذب في الخوادم أثناء التدريب الموزع.²¹
توسعت قدرات SHARP تدريجيًا عبر أربعة أجيال:
SHARPv1 ركز على عمليات الاختزال للرسائل الصغيرة للحوسبة العلمية، مُظهرًا تحسينات أداء كبيرة تبنتها مكتبات MPI الرائدة.²²
SHARPv2 الذي أُطلق مع محولات HDR 200Gbps Quantum أضاف دعم أحمال عمل الذكاء الاصطناعي بما في ذلك عمليات اختزال الرسائل الكبيرة. أظهرت الاختبارات المرجعية تحسنًا بنسبة 17% في أداء تدريب BERT.²³
SHARPv3 مكّن الحوسبة الشبكية الداخلية متعددة المستأجرين، مما يسمح لأحمال عمل الذكاء الاصطناعي المتعددة بالاستفادة من قدرات SHARP في وقت واحد. عرضت Microsoft Azure فائدة أداء تقارب رتبة من حيث الحجم لزمن انتقال AllReduce باستخدام هذا الجيل.²⁴
SHARPv4 يأتي قياسيًا مع محولات Quantum-X800 وQuantum-X Photonics، مما يتيح التجميع والاختزال داخل الشبكة الذي يقلل من النفقات العامة للاتصال بين وحدات GPU.²⁵ بالاقتران مع دعم دقة FP8، يسرّع SHARP v4 تدريب نماذج تريليون المعامل من خلال تقليل متطلبات عرض النطاق الترددي والحوسبة، مما يوفر تقاربًا أسرع وإنتاجية أعلى.²⁶
تتكامل التقنية مع مكتبة الاتصالات الجماعية من NVIDIA (NCCL)، مما يمكّن أطر تدريب الذكاء الاصطناعي الموزع من الاستفادة من SHARP تلقائيًا. يُبلغ مزودو الخدمات عن تحسينات أداء بنسبة 10-20% لأحمال عمل الذكاء الاصطناعي من خلال تكامل SHARP.²⁷ تؤدي محولات الشبكة التجميع والاختزال مباشرةً، متجاوزةً وحدات المعالجة المركزية ووحدات GPU لهذه المهام مع مضاعفة عرض النطاق الترددي لـ AllReduce مقارنةً بالتكوينات التي لا تستخدم SHARP.²⁸
ConnectX-8 SuperNIC يوفر نقاط نهاية بسرعة 800Gbps
تُقترن منصة Quantum-X800 بمحولات ConnectX-8 SuperNIC لتحقيق إنتاجية شاملة بسرعة 800Gbps.²⁹ يمثل C8180 أول SuperNIC ثنائي البروتوكول بسرعة 800Gbps من NVIDIA يدعم كلاً من InfiniBand وEthernet، مصمم لمجموعات الحوسبة عالية الأداء للذكاء الاصطناعي وشبكات الحوسبة الفائقة وبنى مراكز البيانات من الجيل التالي.³⁰
تدفع المواصفات التقنية قدرات المحول إلى الأمام بشكل كبير. توفر واجهة OSFP أحادية المنفذ سرعة 800Gbps XDR InfiniBand أو منفذين بسرعة 400Gbps Ethernet.³¹ يوفر اتصال PCIe Gen6 x16 عرض نطاق ترددي لواجهة المضيف يطابق سرعات الشبكة.³² يدعم التفاوض التلقائي التوافق العكسي عبر سرعات InfiniBand XDR وNDR وNDR200 وHDR وHDR100 وEDR وFDR وSDR.³³
تمتد ابتكارات البنية إلى ما هو أبعد من عرض النطاق الترددي الخام. يدمج ConnectX-8 دعم PCIe Gen6 الأصلي مع نسيج تبديل PCIe على اللوحة، مما يلغي متطلبات محول PCIe الخارجي.³⁴ يحتوي المحول على 48 مسارًا من PCIe Gen6 خلف واجهة الموصل x16.³⁵ يسرّع دعم SHARP الأصلي عمليات التجميع والاختزال مباشرةً في أجهزة المحول.³⁶
تعالج تقنية Socket Direct بنى الخوادم ثنائية المقابس. يحسن الوصول المباشر من كل وحدة معالجة مركزية إلى الشبكة عبر واجهات PCIe مخصصة الأداء في الأنظمة التي تؤثر فيها طوبولوجيا وحدة المعالجة المركزية إلى الشبكة على زمن الانتقال.³⁷ يمثل GB300 NVL72 أول نشر لقدرة SuperNIC PCIe Gen6، متصلاً بوحدات Grace CPUs بسرعات Gen5 مع الحفاظ على روابط Gen6 إلى وحدات B300 GPUs.³⁸
Unified Fabric Manager ينسق على نطاق واسع
تُحدث منصة UFM ثورة في إدارة نسيج InfiniBand من خلال الجمع بين القياس عن بُعد للشبكة في الوقت الفعلي والتحليلات المدعومة بالذكاء الاصطناعي.³⁹ يوفر الحل القائم على المضيف رؤية كاملة لإدارة النسيج والتوجيه والتوفير واستكشاف الأخطاء وإصلاحها.
تمتد بنية UFM عبر مكونات متعددة. يحافظ خادم UFM على رؤية كاملة للنسيج ويدير التوجيه عبر جميع الأجهزة. تشمل أجهزة التبديل المُدارة محولات النسيج والبوابات والموجهات تحت سيطرة UFM. يوفر وكلاء UFM Host الاختياريون على عقد الحوسبة بيانات المضيف المحلية ووظائف إدارة الأجهزة.⁴⁰
تعالج ثلاثة مستويات للمنصة متطلبات تشغيلية مختلفة:
UFM Telemetry يجمع أكثر من 120 عدادًا فريدًا لكل منفذ بما في ذلك معدل خطأ البت ودرجة الحرارة والرسوم البيانية وإعادة الإرسال.⁴¹ تمكّن البيانات من التنبؤ بالكابلات الهامشية قبل أن تؤثر الأعطال على أحمال العمل الإنتاجية.
UFM Enterprise يضيف مراقبة الشبكة والإدارة وتحسينات حمل العمل والتحقق الدوري من التكوين.⁴² يمكّن التكامل مع جدولة المهام مثل Slurm وPlatform LSF من التوفير التلقائي للشبكة المتوافق مع جدولة حمل العمل. تدعم تكاملات OpenStack وAzure نماذج النشر السحابية.⁴³
UFM Cyber-AI يوفر قدرات الصيانة الوقائية والأمن السيبراني لخفض تكاليف تشغيل الحوسبة الفائقة.⁴⁴ يمكّن نشر الجهاز المخصص من تحليل النسيج المدعوم بالذكاء الاصطناعي في الموقع.
تقدم UFM SDK تكاملات واسعة مع جهات خارجية بما في ذلك Grafana وFluentD وZabbix وإضافات Slurm من خلال الوصول إلى REST API.⁴⁵ تمكّن المشاريع مفتوحة المصدر من تكامل SLURM لمراقبة عرض النطاق الترددي للشبكة والازدحام والأخطاء واستخدام الموارد عبر عقد حوسبة المهام.
عمليات نشر الحواسيب الفائقة الكبرى تُثبت صحة المنصة
تعتمد أكبر أنظمة الذكاء الاصطناعي في العالم على شبكات NVIDIA InfiniBand كمعيار. تُظهر عمليات النشر الحالية والمخططة قدرات منصة Quantum على نطاق واسع.
مركز بيانات Stargate للذكاء الاصطناعي بدأ بتركيب 64,000 نظام GB200 في مارس 2025، مترابطة بشبكة InfiniBand بسرعة 800Gbps لخدمات الذكاء الاصطناعي متعددة الإكسافلوبس.⁴⁶ يمثل النشر أحد أولى تطبيقات XDR واسعة النطاق.
xAI Colossus يشغل 100,000 وحدة H100 GPU باستخدام محولات Quantum-2، محافظًا على زمن انتقال أقصى يبلغ 850 نانوثانية عبر ثلاث طبقات شبكية.⁴⁷ تدرب مجموعة Memphis عائلة Grok من نماذج اللغة الكبيرة لـ xAI.
مجموعة Oracle الفائقة بقدرة زيتا-سكيل تخطط لـ 131,000 وحدة GB200 GPU متصلة عبر نسيج Quantum InfiniBand، مما يُظهر التزام مزود السحابة بـ InfiniBand للبنية التحتية للذكاء الاصطناعي بأقصى أداء.⁴⁸
El Capitan في مختبر لورانس ليفرمور الوطني سيتجاوز 2 إكسافلوبس باستخدام InfiniBand بسرعة 200Gbps، مما يُظهر الأهمية المستمرة لشبكات فئة NDR للحوسبة العلمية.⁴⁹
JUPITER (250 مليون يورو) وBlue Lion (250 مليون يورو) في أوروبا اختارتا أنسجة Quantum-2 التي تلبي متطلبات كفاءة الطاقة الصارمة مع تقديم الأداء الذي تتطلبه أحمال العمل العلمية.⁵⁰
وصلت إيرادات شبكات NVIDIA إلى 10 مليارات دولار سنويًا، مرتبطة بالكامل تقريبًا بأنسجة InfiniBand التي تشغل السحب التجارية للذكاء الاصطناعي.⁵¹ تمثل Microsoft Azure وOracle Cloud Infrastructure أوائل المتبنين لـ Quantum InfiniBand بين مزودي الخدمات السحابية الفائقة.⁵²
مقارنة InfiniBand مقابل Ethernet
تعكس ديناميكيات السوق مواقع متميزة لكل تقنية. عندما بدأت مجموعة Dell'Oro بتغطية الشبكات الخلفية للذكاء الاصطناعي في أواخر 2023، كانت InfiniBand تمتلك أكثر من 80% من حصة السوق.⁵³ اكتسبت Ethernet منذ ذلك الحين أرضًا من خلال تبني مزودي الخدمات السحابية الفائقة ومزايا التكلفة، محافظةً على الريادة الإجمالية في السوق في 2025.⁵⁴
تميز خصائص الأداء بين التقنيتين. توفر InfiniBand زمن انتقال أقل من الميكروثانية من خلال RDMA المعجّل بالأجهزة والحوسبة الشبكية الداخلية. تحقق Ethernet إنتاجية تنافسية عند تكوينها بشكل صحيح مع RoCE، لكنها تتطلب تكوينًا دقيقًا لشبكة خالية من الفقد وتفتقر إلى قدرات حوسبة شبكية داخلية مكافئة.
تفضل هياكل التكلفة Ethernet للعديد من عمليات النشر. عادةً ما تجد شركات المستوى الثاني والثالث التي تنشر مجموعات من 256 إلى 1,024 وحدة GPU أن Ethernet مع RoCE توفر أداءً مقبولاً بحوالي نصف تكلفة الشبكات.⁵⁵ تتعزز قيمة InfiniBand على النطاقات الأكبر حيث تترجم الحوسبة الشبكية الداخلية لـ SHARP وحدود زمن الانتقال الأكثر إحكامًا
[تم اقتطاع المحتوى للترجمة]