AI के लिए लिक्विड कूलिंग: एक विशेष तकनीक से अनिवार्य इंफ्रास्ट्रक्चर तक
अपडेटेड 11 दिसंबर, 2025
दिसंबर 2025 अपडेट: लिक्विड कूलिंग मार्केट $2.8 बिलियन (2025) से बढ़कर 2032 तक $21 बिलियन+ होगा (30%+ CAGR)। वर्तमान NVIDIA रैक 132kW पर; अगली पीढ़ी को 240kW की आवश्यकता होगी। GB200 NVL72 से 25 गुना लागत बचत संभव (50MW सुविधा के लिए सालाना $4M+ से अधिक)। Direct-to-chip अब प्रति कंपोनेंट 1,600W तक संभालता है। Accelsius NeuCool 40°C गर्म फैसिलिटी वॉटर के साथ प्रति GPU सॉकेट 4,500W को ठंडा करता है।
वैश्विक लिक्विड कूलिंग मार्केट 2025 में $2.8 बिलियन से बढ़कर 2032 तक $21 बिलियन से अधिक हो जाएगा, जिसमें सालाना चक्रवृद्धि वृद्धि 30% से अधिक होगी।¹ 2025 के मध्य में, एयर से लिक्विड कूलिंग में परिवर्तन प्रयोगात्मक से परिचालनात्मक हो गया।² पूर्ण लोड पर, नवीनतम NVIDIA-आधारित GPU सर्वरों को प्रति रैक 132 किलोवाट की आवश्यकता होती है। अगली पीढ़ी, जो एक वर्ष के भीतर अपेक्षित है, को 240 किलोवाट की आवश्यकता होगी।³ पारंपरिक एयर कूलिंग इन घनत्वों पर गर्मी को नष्ट नहीं कर सकता। लिक्विड कूलिंग हाइपरस्केलर विलासिता से बदलकर वर्तमान-पीढ़ी के AI इंफ्रास्ट्रक्चर को तैनात करने वाले किसी भी संगठन के लिए आवश्यकता बन गई।
अर्थशास्त्र इस बदलाव को मजबूत करता है। डेटा सेंटर कूलिंग पर प्रति मेगावाट सालाना अनुमानित $1.9 से $2.8 मिलियन खर्च करते हैं।⁴ लिक्विड-कूल्ड GB200 NVL72 सिस्टम तैनात करने से हाइपरस्केल डेटा सेंटर 25 गुना तक लागत बचत प्राप्त कर सकते हैं, जो 50-मेगावाट सुविधा के लिए सालाना $4 मिलियन से अधिक की बचत में तब्दील होता है।⁵ जो संगठन इस परिवर्तन का विरोध करते हैं, वे खुद को उन GPU पीढ़ियों को तैनात करने में असमर्थ पाएंगे जो AI क्षमता को परिभाषित करते हैं।
परिवर्तन को प्रेरित करने वाला भौतिकी
AI-अनुकूलित सर्वर और GPU-सघन क्लस्टर पावर घनत्व को प्रति रैक 50 किलोवाट से आगे धकेलते हैं, उस स्तर तक पहुंचते हैं जहां पारंपरिक एयर कूलिंग स्थिर या कुशल गर्मी अपव्यय सुनिश्चित नहीं कर सकती।⁶ Uptime Institute के अनुसार, औसत डेटा सेंटर रैक पावर घनत्व 2022 से 2024 तक 38% बढ़ा, जिसमें AI और हाइपरस्केल तैनाती में सबसे तेज वृद्धि हुई।⁷ पावर घनत्व जो कभी 15 किलोवाट पर अधिकतम था, अब AI क्लस्टरों में 80 से 120 किलोवाट तक पहुंचता है।⁸
लिक्विड कूलिंग का मौलिक लाभ थर्मोडायनामिक्स में निहित है। हवा की तुलना में लगभग 1,000 गुना घनत्व के साथ, तरल बेहतर गर्मी धारिता और तापीय चालकता के कारण गर्मी को दूर ले जाने में उत्कृष्ट है।⁹ उच्च-प्रदर्शन GPUs से गर्मी को कुशलता से स्थानांतरित करके, लिक्विड कूलिंग ऊर्जा-गहन कूलिंग पंखों पर निर्भरता कम करता है। परिणाम: सर्वर ऊर्जा खपत में औसतन 11% की कमी जबकि पारंपरिक कूलिंग इंफ्रास्ट्रक्चर स्पेस आवश्यकताओं का 80% समाप्त।¹⁰
एयर कूलिंग सिस्टम प्रति रैक 10 से 15 किलोवाट से ऊपर पावर घनत्व संभालने में संघर्ष करते हैं।¹¹ कई AI वर्कलोड को 30 से 60 किलोवाट या उससे अधिक पर चलने वाले रैक की आवश्यकता होती है।¹² एयर कूलिंग जो प्रदान करता है और AI इंफ्रास्ट्रक्चर जो मांगता है, उसके बीच का अंतर प्रत्येक GPU पीढ़ी के साथ बढ़ता है।
Direct-to-chip कूलिंग प्रोडक्शन में प्रभावी
Direct-to-chip कूलिंग तेजी से प्रोडक्शन वातावरण में तैनात सबसे आम लिक्विड कूलिंग फॉर्म बन गई।¹³ कोल्ड प्लेट्स सीधे CPUs, GPUs, मेमोरी मॉड्यूल और वोल्टेज रेगुलेटर पर माउंट होती हैं। एक क्लोज्ड-लूप सिस्टम इन प्लेट्स के माध्यम से कूलेंट को सर्कुलेट करता है, स्रोत पर गर्मी को हटाता है।¹⁴
NVIDIA के GB200 NVL72 और GB300 NVL72 सिस्टम मानक कॉन्फ़िगरेशन के रूप में direct-to-chip लिक्विड कूलिंग का उपयोग करते हैं।¹⁵ एवेपोरेटिव या इमर्शन कूलिंग के विपरीत, NVL72 की लिक्विड कूलिंग एक क्लोज्ड-लूप सिस्टम के रूप में संचालित होती है जहां कूलेंट वाष्पित नहीं होता या प्रतिस्थापन की आवश्यकता नहीं होती, जिससे पानी की बचत होती है।¹⁶ यह आर्किटेक्चर पारंपरिक एयर-कूल्ड सिस्टम की तुलना में 40 गुना अधिक राजस्व क्षमता, 30 गुना अधिक थ्रूपुट, 25 गुना अधिक ऊर्जा दक्षता और 300 गुना अधिक जल दक्षता प्रदान करता है।¹⁷
Direct-to-chip समाधान अब प्रति कंपोनेंट 1,600 वाट तक संभालते हैं, एयर कूलिंग की तुलना में 58% अधिक सर्वर घनत्व सक्षम करते हैं जबकि इंफ्रास्ट्रक्चर ऊर्जा खपत 40% कम करते हैं।¹⁸ Supermicro का DLC-2 सक्षम NVIDIA HGX B200 सिस्टम CPUs, GPUs, DIMMs, PCIe स्विच, वोल्टेज रेगुलेटर और पावर सप्लाई को लिक्विड-कूलिंग द्वारा सिस्टम की 98% तक गर्मी कैप्चर करता है, जिससे 50 डेसिबल जितने कम शोर स्तर पर शांत डेटा सेंटर संचालन संभव होता है।¹⁹
Accelsius ने अपनी NeuCool तकनीक के साथ दो थर्मल मील के पत्थर हासिल किए: प्रति GPU सॉकेट 4,500 वाट को सफलतापूर्वक ठंडा करना और 40°C गर्म फैसिलिटी वॉटर का उपयोग करके पूरी तरह से लोडेड 250-किलोवाट AI रैक में सुरक्षित GPU तापमान बनाए रखना।²⁰ चिल्ड वॉटर के बजाय गर्म पानी का उपयोग करने की क्षमता कूलिंग इंफ्रास्ट्रक्चर आवश्यकताओं और संचालन लागत को कम करती है।
इमर्शन कूलिंग अत्यधिक घनत्व के लिए स्केल होती है
इमर्शन कूलिंग सर्वरों को डाइइलेक्ट्रिक फ्लूइड में डुबो देती है, प्रति रैक 100 किलोवाट से अधिक प्राप्त करती है और कुछ डिज़ाइनों में 250 किलोवाट तक स्केल होती है।²¹ GRC के ICEraQ जैसे सिस्टम पावर उपयोग प्रभावशीलता 1.03 से नीचे बनाए रखते हुए प्रति सिस्टम 368 किलोवाट तक कूलिंग क्षमता प्राप्त करते हैं।²² यह दृष्टिकोण पंखों को पूरी तरह से समाप्त करता है और ऑपरेटरों को समान फुटप्रिंट में 10 से 15 गुना अधिक कंप्यूट पैक करने में सक्षम बनाता है।²³
डेटा सेंटर इमर्शन कूलिंग मार्केट 2025 में $4.87 बिलियन तक पहुंच गया और 17.91% चक्रवृद्धि वार्षिक वृद्धि दर पर 2030 तक $11.10 बिलियन तक बढ़ेगा।²⁴ इंस्टॉलेशन परिचितता के कारण सिंगल-फेज सिस्टम सबसे बड़ी बाजार हिस्सेदारी बनाए रखते हैं, फिर भी टू-फेज डिज़ाइन उन पायलटों में जीतते हैं जहां अत्यधिक घनत्व और पंप-मुक्त आर्किटेक्चर आवश्यक साबित होते हैं।²⁵
पारंपरिक एयर कूलिंग की तुलना में, सिंगल-फेज इमर्शन कूलिंग बिजली की मांग को लगभग आधा तक कम करती है, CO2 उत्सर्जन में 30% तक की कमी में योगदान देती है, और 99% तक कम पानी की खपत का समर्थन करती है।²⁶ दक्षता लाभ सीधे AI सेवाओं के लिए तेज़ समय-से-राजस्व में तब्दील होते हैं। प्रत्येक वर्ग फुट से अधिक उपयोग प्राप्त करने की क्षमता हाइपरस्केल अपनाने को प्रेरित करने वाला सबसे मजबूत आर्थिक लीवर बना हुआ है।²⁷
मई 2025 में, Intel ने Shell Global Solutions के साथ साझेदारी कर 4th और 5th जेनरेशन Xeon प्रोसेसर के लिए पहला Intel-प्रमाणित इमर्शन कूलिंग समाधान लॉन्च किया, जो प्रोडक्शन स्केल पर उच्च-प्रदर्शन थर्मल प्रबंधन सक्षम करता है।²⁸ यह साझेदारी संकेत देती है कि इमर्शन कूलिंग एंटरप्राइज तैनाती के लिए आवश्यक प्रमाणन और समर्थन स्तरों तक पहुंच गई है।
हाइपरस्केलर तैनाती मानक निर्धारित करती है
Microsoft के Azure AI क्लस्टर, Google की TPU तैनाती और Meta के LLaMA मॉडल ट्रेनिंग नोड्स सभी लिक्विड कूलिंग में स्थानांतरित हो गए।²⁹ 2025 में अनावरण किया गया Microsoft का उन्नत AI सुपरकंप्यूटर, GPT-Next ट्रेनिंग वर्कलोड का समर्थन करने वाले विशेष रूप से लिक्विड-कूल्ड रैक पेश करता है।³⁰ हाइपरस्केलर प्रतिबद्धताएं लिक्विड कूलिंग को प्रयोगात्मक तकनीक के बजाय प्रोडक्शन-रेडी इंफ्रास्ट्रक्चर के रूप में मान्य करती हैं।
HPE ने फरवरी 2025 में अपना पहला NVIDIA Blackwell फैमिली समाधान, GB200 NVL72 शिप किया।³¹ HPE ने दुनिया के शीर्ष दस सबसे तेज सुपरकंप्यूटरों में से सात बनाए, डायरेक्ट लिक्विड कूलिंग में गहरी विशेषज्ञता स्थापित की।³² कंपनी के रेफरेंस आर्किटेक्चर एंटरप्राइज तैनाती के लिए ब्लूप्रिंट प्रदान करते हैं।
NVIDIA GB200 NVL72 सर्वरों के लिए Vertiv का रेफरेंस आर्किटेक्चर वार्षिक ऊर्जा खपत 25% कम करता है, रैक स्पेस आवश्यकताओं को 75% कम करता है, और पावर फुटप्रिंट को 30% कम करता है।³³ Schneider Electric का लिक्विड कूलिंग इंफ्रास्ट्रक्चर GB200 NVL72 AI डेटा सेंटरों के लिए प्रति रैक 132 किलोवाट तक का समर्थन करता है।³⁴ वेंडर इकोसिस्टम अब कस्टम इंजीनियरिंग की आवश्यकता के बजाय टर्नकी समाधान प्रदान करता है।
Meta ने Microsoft के साथ Air-Assisted Liquid Cooling को एक हाइब्रिड, रेट्रोफिटेबल समाधान के रूप में विकसित किया।³⁵ इस दृष्टिकोण ने Meta को अपने पूरे एयर-कूल्ड इंफ्रास्ट्रक्चर को ओवरहॉल किए बिना लिक्विड कूलिंग को एकीकृत करना शुरू करने में सक्षम बनाया, मौजूदा सुविधाओं वाले संगठनों के लिए व्यावहारिक संक्रमण पथों का प्रदर्शन किया।
रेट्रोफिटिंग चुनौतियां बनी हुई हैं
अधिक शक्तिशाली प्रोसेसर को समायोजित करने के लिए एक संचालित डेटा सेंटर को रेट्रोफिटिंग करना महत्वपूर्ण तकनीकी और लॉजिस्टिक चुनौतियां प्रस्तुत करता है।³⁶ कुछ ऑपरेटर निष्कर्ष निकालते हैं कि मौजूदा को अपग्रेड करने की तुलना में नई सुविधाएं बनाना आसान साबित होता है।³⁷ निर्णय सुविधा की आयु, शेष उपयोगी जीवन और नियोजित AI तैनाती के पैमाने पर निर्भर करता है।
लिक्विड कूलिंग के लिए लिक्विड डिस्ट्रीब्यूशन यूनिट, कोल्ड प्लेट्स, इमर्शन टैंक और कूलेंट पंप सहित विशेष इंफ्रास्ट्रक्चर की आवश्यकता होती है।³⁸ रेट्रोफिटिंग में सर्वर रैक को संशोधित करना, लीक प्रिवेंशन सिस्टम जोड़ना और नियामक अनुपालन सुनिश्चित करना शामिल है।³⁹ ब्राउनफील्ड साइट्स उन वास्तुशिल्प और इंफ्रास्ट्रक्चर सीमाओं का सामना करती हैं जिनसे ग्रीनफील्ड प्रोजेक्ट बचते हैं।
ब्राउनफील्ड साइट्स के बीच इमर्शन कूलिंग जैसे इंफ्रास्ट्रक्चर-गहन समाधानों के लिए कम अपनाने की दरें, 20.4% पर, व्यावहारिक बाधाओं को दर्शाती हैं।⁴⁰ इन बाधाओं में टैंकों को समायोजित करने के लिए व्यापक रेट्रोफिटिंग, सीमित फ्लोर स्पेस, और मौजूदा पावर और कूलिंग इंफ्रास्ट्रक्चर के साथ एकीकरण की चुनौतियां शामिल हैं।⁴¹ ब्राउनफील्ड साइट्स पूर्ण इंफ्रास्ट्रक्चर ओवरहॉल से बचने वाले लिक्विड-टू-एयर कूलिंग जैसे वृद्धिशील समाधान अपनाने की अधिक संभावना रखती हैं।⁴²
Schneider Electric ने NVIDIA के साथ तीन रेट्रोफिट रेफरेंस डिज़ाइन पर साझेदारी की उन डेटा सेंटर ऑपरेटरों के लिए जो सुविधाओं को स्क्रैच से फिर से डिज़ाइन किए बिना प्रदर्शन सुधार चाहते हैं।⁴³ डिज़ाइन स्वीकार करते हैं कि अधिकांश संगठन ग्रीनफील्ड AI डेटा सेंटर नहीं बना सकते और मौजूदा बाधाओं के भीतर काम करना होगा।
परिचालन जटिलता बढ़ती है
क्योंकि लिक्विड सिस्टम केवल चिप्स को ठंडा करते हैं, पूरक एयर कूलिंग अभी भी कुल थर्मल लोड का 20% से 30% संभालती है।⁴⁴ हाइब्रिड कूलिंग आर्किटेक्चर के लिए विशेषज्ञता की आवश्यकता होती है जो कई संगठनों के पास आंतरिक रूप से नहीं है।⁴⁵ परिचालन बदलाव मैकेनिकल अपग्रेड जितना ही महत्वपूर्ण साबित होता है।
लिक्विड कूलिंग नई परिचालन आवश्यकताएं पेश करती है: लीक डिटेक्शन, हाइड्रोलिक रिडंडेंसी, कूलेंट गुणवत्ता नियंत्रण, और तकनीशियन अपस्किलिंग।⁴⁶ पारंपरिक डेटा सेंटर ऑपरेशन टीमों के पास AI इंफ्रास्ट्रक्चर द्वारा मांगे गए पैमाने पर प्लंबिंग, पंप और हीट एक्सचेंजर के साथ अनुभव नहीं हो सकता। स्किल गैप तैनाती समयसीमा और चल रहे संचालन को प्रभावित करता है।
ZutaCore ने GB200 सुपरचिप का समर्थन करने वाले direct-to-chip लिक्विड कूलिंग सिस्टम विकसित किए, जो NVIDIA Grace ARM प्रोसेसर को Blackwell GPUs के साथ जोड़ता है।⁴⁷ थर्ड-पार्टी समाधान विकल्पों का विस्तार करते हैं लेकिन वेंडर प्रबंधन और समर्थन व्यवस्थाओं को भी जटिल बनाते हैं।
सप्लाई चेन मुद्दे हाइब्रिड कूलिंग योजनाओं को जटिल बना सकते हैं, संभावित रूप से व्यापार नीति परिवर्तनों से बदतर।⁴⁸ कंप्यूटिंग पावर में तेजी से वृद्धि का मतलब है कि आज ब्लीडिंग एज पर डेटा सेंटर तेजी से पीछे रह सकते हैं।⁴⁹ भविष्य के पावर घनत्व के लिए क्षमता के साथ सुविधाओं को डिज़ाइन करना चुनौतीपूर्ण साबित होता है जब लक्ष्य लगातार बदलता रहता है।
क्षेत्रीय अपनाने के पैटर्न
उत्तरी अमेरिका हाइपरस्केल क्लाउड प्रदाताओं द्वारा प्रोडक्शन-स्केल रोलआउट के माध्यम से मार्केट अपनाने में अग्रणी है।⁵⁰ US मार्केट 2024 में $1.09 बिलियन से 2034 तक $6.39 बिलियन तक बढ़ेगा।⁵¹ AWS, Google और Microsoft से हाइपरस्केलर निवेश अपनाने को प्रेरित करते हैं क्योंकि एंटरप्राइज उनके नेतृत्व का अनुसरण करते हैं।
एशिया-प्रशांत सबसे तेज वृद्धि प्रदर्शित करता है क्योंकि जापान, चीन और दक्षिण कोरिया लिक्विड-कूल्ड AI क्लस्टरों का समर्थन करते हैं।⁵² गर्म, नम जलवायु में पारंपरिक एयर कूलिंग लागत-निषेधात्मक साबित होती है।⁵³ इमर्शन कूलिंग क्षेत्रीय परिस्थितियों के लिए विशेष रूप से उपयुक्त स्थायी, स्पेस-कुशल समाधान प्रदान करती है। एशिया-प्रशांत पूर्वानुमान अवधि के दौरान वैश्विक इमर्शन कूलिंग मार्केट में अग्रणी है।⁵⁴
भौगोलिक वितरण जलवायु विचारों और AI इंफ्रास्ट्रक्चर निवेश की एकाग्रता दोनों को दर्शाता है। आक्रामक AI विकास कार्यक्रमों वाले क्षेत्र आवश्यकता से कूलिंग नवाचार को प्रेरित करते हैं।
रणनीतिक योजना विचार
AI इंफ्रास्ट्रक्चर की योजना बनाने वाले संगठनों को सुविधा और बजट निर्णयों में लिक्विड कूलिंग को शामिल करना चाहिए। Direct-to-chip और इमर्शन कूलिंग के बीच चुनाव तैनाती पैमाने, रेट्रोफिट बाधाओं और परिचालन क्षमताओं पर निर्भर करता है।
नई तैनाती के लिए, 30 किलोवाट से अधिक किसी भी रैक के लिए लिक्विड कूलिंग डिफ़ॉल्ट विनिर्देश होना चाहिए। 100-किलोवाट-प्लस घनत्व की योजना 2027 तक GPU रोडमैप की अपेक्षा करती है। आज लिक्विड कूलिंग इंफ्रास्ट्रक्चर के बिना डिज़ाइन की गई सुविधाओं को वर्षों के भीतर महंगी रेट्रोफिट या प्रतिस्थापन का सामना करना पड़ेगा।
मौजूदा सुविधाओं के लिए, रेट्रोफिट व्यवहार्यता का ईमानदारी से मूल्यांकन करें। Schneider Electric के रेफरेंस डिज़ाइन शुरुआती बिंदु प्रदान करते हैं, लेकिन महत्वपूर्ण इंजीनियरिंग कार्य आवश्यक रहता है। हाइब्रिड दृष्टिकोण जो एयर-कूल्ड इंफ्रास्ट्रक्चर पर लिक्विड कूलिंग की परत चढ़ाते हैं, वृद्धिशील पथ आगे प्रदान करते हैं।