تنفيذ التبريد المباشر للرقائق: خفض معامل PUE إلى أقل من 1.2 في عام 2025
تم التحديث في 8 ديسمبر 2025
تحديث ديسمبر 2025: يستحوذ التبريد المباشر للرقائق الآن على حصة مهيمنة تبلغ 47% من سوق التبريد السائل لمراكز بيانات الذكاء الاصطناعي. بدأت Microsoft نشر أسطولها عبر حرم Azure في يوليو 2025 وتختبر تقنيات الموائع الدقيقة للأنظمة المستقبلية. مع تشغيل معالجات NVIDIA Blackwell (GB200/GB300) بقدرة 1,200-1,400 واط وأنظمة Vera Rubin التي تستهدف 600 كيلوواط لكل حامل، انتقل التبريد المباشر للرقائق من كونه تقنية متخصصة إلى ضرورة حتمية. وصل سوق التبريد السائل إلى 5.52 مليار دولار في عام 2025، ومن المتوقع أن يصل إلى 15.75 مليار دولار بحلول عام 2030.
يزيل التبريد المباشر للرقائق 80% من المقاومة الحرارية بين شرائح GPU وأنظمة التبريد، مما يخفض معامل PUE لمراكز البيانات من 1.58 إلى 1.15 مع تمكين وحدات GPU بقدرة 1,200 واط التي كانت ستذوب في البنية التحتية التقليدية المبردة بالهواء.¹ أظهرت CoolIT Systems نشرًا إنتاجيًا حيث حافظت 300 وحدة NVIDIA H100 GPU على درجات حرارة وصلات عند 62 درجة مئوية تحت الحمل الكامل باستخدام مياه دخول عند 25 درجة مئوية فقط، محققة ما لم يستطع التبريد بالهواء تحقيقه حتى بهواء دخول عند 15 درجة مئوية.² تحول التقنية التبريد من عامل مقيد إلى ميزة تنافسية، حيث يحقق المتبنون الأوائل كثافة حوسبة أعلى بنسبة 40% وتكاليف تشغيل أقل بنسبة 35% مقارنة بالمنافسين الذين يستخدمون التبريد بالهواء.³
تروي الفيزياء قصة مقنعة. ينقل التبريد التقليدي الحرارة عبر سبع واجهات حرارية: من شريحة السيليكون إلى موزع الحرارة المدمج، ومعجون حراري إلى المشتت الحراري، وزعانف المشتت إلى الهواء، والهواء إلى ملفات التبريد، والملفات إلى المياه المبردة، وأخيرًا الطرد إلى الغلاف الجوي.⁴ تضيف كل واجهة مقاومة حرارية، مما يفرض هواءً أكثر برودة بشكل متزايد للحفاظ على درجات حرارة مقبولة للرقائق. يتجاوز التبريد المباشر للرقائق خمسًا من هذه الواجهات، وينقل الحرارة مباشرة من المعالج عبر صفيحة باردة إلى سائل التبريد. يقلل المسار المبسط فروق درجات الحرارة المطلوبة بنسبة 75%، مما يتيح درجات حرارة تبريد محيطة أعلى تخفض استهلاك الطاقة بشكل كبير.
الأساسيات الهندسية تعيد تشكيل اقتصاديات التبريد
يعمل التبريد المباشر للرقائق على مبادئ ديناميكا حرارية واضحة تحقق نتائج استثنائية. تُثبت الصفائح الباردة مباشرة على المعالجات باستخدام آليات نابضية تحافظ على ضغط مثالي عبر مواد الواجهة الحرارية. تخلق القنوات الدقيقة داخل الصفيحة الباردة تدفقًا مضطربًا، مما يرفع معامل نقل الحرارة إلى 15,000 واط/م²·كلفن مقارنة بـ 50 واط/م²·كلفن للتبريد بالهواء.⁵ يسمح هذا التحسن الهائل لوحدات GPU بقدرة 700 واط بالعمل مع ارتفاع 5 درجات مئوية فقط فوق درجة حرارة سائل التبريد.
يحدد اختيار سائل التبريد أداء النظام وتعقيده. تهيمن مخاليط الماء والجليكول أحادية الطور على النشر الحالي نظرًا للألفة وانخفاض التكلفة. تتجاوز السعة الحرارية النوعية للماء البالغة 4.18 كيلوجول/كجم·كلفن سعة الهواء البالغة 1.01 كيلوجول/كجم·كلفن بأربعة أضعاف، مما يعني أن حجمًا أقل ينقل حرارة أكثر.⁶ تكفي معدلات تدفق من 0.5 إلى 1.0 لتر في الدقيقة لكل GPU، مقارنة بـ 200 قدم مكعب في الدقيقة من الهواء. يتيح حجم التدفق المنخفض أنظمة توزيع أصغر وتشغيلًا أكثر هدوءًا.
يؤثر تصميم المشعب بشكل حاسم على الموثوقية وقابلية الصيانة. تسمح وصلات الفصل السريع بتبديل الخوادم دون تفريغ دوائر التبريد. توفر المضخات الاحتياطية مع التبديل التلقائي منع نقاط الفشل الفردية. يطابق التحكم المتغير في التدفق سعة التبريد مع الأحمال الحرارية الفعلية، مما يحسن الكفاءة أثناء الاستخدام الجزئي. تحقق التصاميم الحديثة معدلات تسرب سنوية أقل من 0.001% من خلال الاختبار الصارم ومراقبة الجودة.⁷
بنية التنفيذ لمجموعات GPU
يتطلب نشر التبريد المباشر للرقائق تغييرات منهجية في البنية التحتية:
بنية الدائرة الأساسية: تدير وحدات توزيع التبريد (CDUs) تبادل الحرارة بين مياه المنشأة ودوائر تبريد الخوادم. تدعم كل CDU من 200 إلى 500 كيلوواط من حمل تكنولوجيا المعلومات، باستخدام مبادلات حرارية صفيحية لعزل مياه المنشأة عن الإلكترونيات. تحافظ المضخات الاحتياطية على فروق ضغط من 350 إلى 500 كيلوباسكال. تعدل الضوابط الذكية التدفق بناءً على درجة حرارة المياه الراجعة، مما يحسن استهلاك الطاقة.
تصميم الدائرة الثانوية: تستخدم الدوائر على مستوى الخادم مياه منزوعة المعادن أو سوائل تبريد متخصصة لمنع التآكل والنمو البيولوجي. تبقى الموصلية أقل من 0.5 ميكروسيمنز/سم من خلال الترشيح المستمر. تمنع المبيدات الحيوية تكون الطحالب. تحمي مثبطات التآكل المعادن المختلفة. تحافظ معادلة الحموضة على نطاق 7.0-8.5 للتوافق مع المواد.
التكامل على مستوى الحامل: تلتقط المبادلات الحرارية للباب الخلفي الحرارة المتبقية المبردة بالهواء من الذاكرة والتخزين ومصادر الطاقة. يحقق النهج الهجين التقاط الحرارة بنسبة 100% عند الحامل، مما يلغي الحاجة إلى التبريد على مستوى الغرفة. توزع مشعبات الحامل سائل التبريد على الخوادم الفردية عبر خراطيم مرنة مصنفة لضغط عمل 700 كيلوباسكال.
أنظمة مياه المنشأة: تتكيف محطات المياه المبردة الموجودة مع درجات حرارة إرجاع أعلى، مما يحسن كفاءة المبرد بنسبة 20-30%.⁸ تزداد ساعات التبريد المجاني بشكل كبير عندما ترتفع درجات حرارة الإمداد من 7 درجات مئوية إلى 20 درجة مئوية. تتيح أبراج التبريد المصممة لمياه إرجاع عند 35 درجة مئوية التبريد المجاني على مدار العام في العديد من المناخات.
النشر الفعلي يثبت التقنية
تستخدم نسخ Azure HBv4 من Microsoft التبريد المباشر للرقائق لمعالجات AMD EPYC، محققة معامل PUE 1.11 في النشر الإنتاجي.⁹ تعالج منشأة كوينسي بواشنطن 33 ميغاواط من الحوسبة باستخدام 3.6 ميغاواط من طاقة التبريد. تتجاوز المدخرات السنوية 4.8 مليون دولار مقارنة بالبدائل المبردة بالهواء. تحسنت موثوقية الخوادم بنسبة 23% بسبب درجات حرارة التشغيل المتسقة.
يستخدم الحاسوب الفائق El Capitan في مختبر لورانس ليفرمور الوطني التبريد المباشر للرقائق لـ 40,000 وحدة AMD MI300A APU.¹⁰ يحقق النظام 2 إكسافلوبس مع الحفاظ على معامل PUE 1.08. يتيح التبريد بالمياه الدافئة عند درجة حرارة دخول 35 درجة مئوية التبريد المجاني على مدار العام في مناخ كاليفورنيا. يوفر التصميم 12 مليون دولار سنويًا في تكاليف الكهرباء.
نشر مهندسو Introl التبريد المباشر للرقائق عبر 15 منشأة في منطقة تغطيتنا العالمية، مما خفض متوسط معامل PUE من 1.55 إلى 1.18.¹¹ حقق تركيب حديث لعملية تعدين عملات مشفرة معامل PUE 1.09 باستخدام مياه دخول عند 40 درجة مئوية، مما ألغى التبريد الميكانيكي بالكامل. يوفر العميل 2.3 مليون دولار سنويًا مع زيادة كثافة معدل التجزئة بنسبة 60%.
اختيار المكونات يحدد النجاح
تقنيات الصفائح الباردة: تحقق تصاميم القنوات الدقيقة من CoolIT Systems مقاومة حرارية 0.015 درجة مئوية/واط. تقدم صفائح الدفع النفاث من Motivair مقاومة 0.012 درجة مئوية/واط للتدفقات الحرارية القصوى. توفر الصفائح المعززة بغرف البخار من Aavid توزيعًا موحدًا لدرجة الحرارة للشرائح الكبيرة. تشمل خيارات المواد النحاس لأقصى توصيل، والألومنيوم لتحسين التكلفة، والطلاء بالنيكل لمقاومة التآكل.
وحدات توزيع سائل التبريد: تتعامل وحدات ChilledDoor CDU من Motivair مع 750 كيلوواط مع احتياطي مضخات N+1. تدعم وحدات توزيع سائل التبريد من CoolIT قدرة 300 كيلوواط بحجم 8U. تقدم وحدات XDU من Vertiv سعة 450 كيلوواط مع كشف تسرب متكامل. يعتمد الاختيار على تخطيط المنشأة ومتطلبات الاحتياطي والبنية التحتية القائمة.
أنظمة المراقبة: تمنع المراقبة المستمرة الأعطال الكارثية. تكتشف مستشعرات التدفق الانسدادات قبل حدوث ارتفاع درجة الحرارة. تحدد مستشعرات الضغط التسربات في غضون ثوانٍ. ترسم مصفوفات درجات الحرارة خريطة الأداء الحراري عبر المكونات. تحذر عدادات الموصلية من تلوث سائل التبريد. يتيح التكامل مع منصات DCIM الصيانة التنبؤية.
كيمياء سائل التبريد: تمنع سوائل التبريد لمراكز البيانات من Nalco Water التآكل مع الحفاظ على موصلية منخفضة. تعمل سوائل SYLTHERM المتخصصة من Dow من -50 درجة مئوية إلى 260 درجة مئوية للتطبيقات القصوى. تقدم سوائل التبريد الحيوية من Cargill استدامة بيئية. يحافظ الاختبار المنتظم على الخصائص المثلى ويطيل عمر المعدات.
التحليل الاقتصادي يدفع قرارات التبني
يتراوح الاستثمار الرأسمالي للتبريد المباشر للرقائق من 1,500 إلى 3,000 دولار لكل كيلوواط من حمل تكنولوجيا المعلومات:¹²
تكاليف البنية التحتية: - وحدات CDU: 150,000 دولار لكل سعة 300 كيلوواط - الأنابيب والمشعبات: 200 دولار لكل خادم - الصفائح الباردة: 400-800 دولار لكل GPU - عمالة التركيب: 300 دولار لكل خادم - سائل التبريد والمعالجة: 50 دولارًا لكل خادم - أنظمة المراقبة: 100 دولار لكل خادم - الإجمالي لكل حامل 42U (20 خادمًا): 45,000-65,000 دولار
المدخرات التشغيلية: - تخفيض الطاقة: 12,000 دولار لكل حامل سنويًا عند 0.10 دولار/كيلوواط ساعة - زيادة الكثافة: حوسبة أكثر بنسبة 40% لكل قدم مربع - تخفيض التبريد الميكانيكي: 8,000 دولار لكل حامل سنويًا - انخفاض طاقة المراوح: 3,000 دولار لكل حامل سنويًا - إطالة عمر المكونات: متوسط وقت بين الأعطال أطول بنسبة 20% - فترة الاسترداد: 18-24 شهرًا
التكلفة الإجمالية للملكية: يُظهر تحليل التكلفة الإجمالية للملكية على مدى خمس سنوات تكاليف أقل بنسبة 35% مقابل التبريد بالهواء لنشر GPU عالي الكثافة. توفر منشأة بها 1,000 وحدة GPU مبلغ 8.5 مليون دولار على مدى خمس سنوات من خلال تقليل استهلاك الطاقة وزيادة الكثافة. توفر أرصدة الكربون وحوافز الاستدامة فوائد مالية إضافية.
استراتيجيات التحديث للمنشآت القائمة
يتطلب تحويل البنية التحتية المبردة بالهواء تخطيطًا دقيقًا:
المرحلة الأولى - التقييم (30 يومًا): تقييم سعة التبريد الحالية وتوزيع الطاقة والدعم الهيكلي. تحديد المواقع المثلى لوحدات CDU مع إمكانية الوصول إلى مياه المنشأة. تخطيط مسارات الأنابيب لتجنب التعارض مع البنية التحتية القائمة. حساب انخفاضات الضغط ومتطلبات المضخات. وضع جدول ترحيل يقلل من الاضطراب.
المرحلة الثانية - البنية التحتية (60 يومًا): تركيب وحدات CDU والأنابيب الرئيسية خلال نوافذ الصيانة المجدولة. ترقية أنظمة مياه المنشأة لدرجات حرارة إرجاع أعلى. إضافة نقاط مراقبة في جميع أنحاء شبكة التوزيع. تشغيل الأنظمة باستخدام أحمال وهمية قبل النشر الإنتاجي. تدريب موظفي التشغيل على الإجراءات الجديدة.
المرحلة الثالثة - الترحيل (90 يومًا): تحويل الحوامل صفًا تلو الآخر للحفاظ على العمليات. البدء ببيئات التطوير/الاختبار للتحقق من الإجراءات. نقل أحمال العمل الإنتاجية خلال نوافذ الصيانة. مراقبة درجات الحرارة وضبط معدلات التدفق للتحسين. توثيق الدروس المستفادة للمراحل اللاحقة.
المرحلة الرابعة - التحسين (مستمر): رفع درجات حرارة سائل التبريد تدريجيًا لتعظيم التبريد المجاني. ضبط معدلات التدفق بناءً على الأحمال الفعلية مقابل التصميم. تنفيذ الصيانة التنبؤية باستخدام بيانات المستشعرات. ضبط خوارزميات التحكم لكفاءة الطاقة. توسيع النشر بناءً على النتائج المثبتة.
التطورات المستقبلية تدفع الحدود أبعد
يعد التبريد بالغمر ثنائي الطور بمعامل PUE يقترب من 1.02 عن طريق إلغاء المضخات كليًا.¹³ تغلي السوائل العازلة على أسطح الرقائق، وتتكثف على الأسطح الأكثر برودة للدوران السلبي. تُظهر النشر المبكر تخفيضًا في الطاقة بنسبة 95% مقابل التبريد بالهواء. تشمل التحديات تكاليف السوائل (200 دولار/لتر) ومخاوف توافق المواد.
يدمج التبريد على الشريحة قنوات دقيقة مباشرة في ركائز السيليكون.¹⁴ أظهرت أبحاث IBM إزالة حرارة بقدرة 1,700 واط/سم² باستخدام التبريد المدمج. ينتظر التنفيذ الإنتاجي تقنيات تصنيع فعالة من حيث التكلفة. يمكن أن تتيح التقنية تكديس الرقائق ثلاثي الأبعاد بكثافة حوسبة غير مسبوقة.
يحول استرداد الحرارة المهدرة التبريد من مركز تكلفة إلى مولد إيرادات. توفر مراكز بيانات ستوكهولم 10% من تدفئة المدينة من خلال التكامل مع التدفئة المركزية.¹⁵ يتيح التبريد المباشر للرقائق عالي الحرارة استرداد الحرارة دون مضخات حرارية. تحقق المنظمات تكاليف تبريد سلبية صافية من خلال مبيعات الحرارة المهدرة.
تكتسب المنظمات التي تنفذ التبريد المباشر للرقائق مزايا تنافسية كبيرة من خلال تحسين الكفاءة وزيادة الكثافة وخفض تكاليف التشغيل. تثبت التقنية أنها ضرورية لنشر GPU من الجيل التالي الذي يتجاوز 700 واط لكل رقاقة. يؤسس المتبنون الأوائل بنية تحتية مستدامة جاهزة لاستمرار زيادات كثافة الطاقة بينما يواجه المتأخرون تحديثات مكلفة أو عيبًا تنافسيًا. يمثل الانتقال من التبريد بالهواء إلى السائل تحولًا جوهريًا في تصميم مراكز البيانات يجب أن تتبناه المنظمات ذات التفكير المستقبلي لتظل قابلة للاستمرار في عصر الذكاء الاصطناعي.
النقاط الرئيسية
لمهندسي البنية التحتية: - يزيل التبريد المباشر للرقائق 5 من 7 واجهات حرارية—15,000 واط/م²·كلفن مقابل 50 واط/م²·كلفن للهواء - ينخفض معامل PUE من 1.58 إلى 1.05-1.15—تخفيض 94% في عبء طاقة التبريد - تعمل وحدات GPU بقدرة 700 واط
[تم اقتطاع المحتوى للترجمة]