การระบายความร้อนด้วยของเหลวเทียบกับการระบายความร้อนด้วยอากาศสำหรับศูนย์ข้อมูล AI: การวิเคราะห์ต้นทุน-ประโยชน์ปี 2025
อัปเดตเมื่อวันที่ 8 ธันวาคม 2025
การระบายความร้อนด้วยอากาศถึงขีดจำกัดทางฟิสิกส์ที่ 41.3kW ต่อตู้แร็คพอดี เกินเกณฑ์นี้ ปริมาณอากาศที่ต้องใช้ในการระบายความร้อนจะเกินกว่าที่การออกแบบใดๆ จะรองรับได้ในทางปฏิบัติ สร้างปัญหาเสียงรบกวนและความโกลาหลทางความร้อนที่ไม่มีวิศวกรรมใดจะแก้ไขได้¹ การระบายความร้อนด้วยของเหลวสัญญาว่าจะเป็นทางรอดด้วยเทอร์โมไดนามิกส์ที่เหนือกว่า แต่ต้นทุนนั้นทำให้ CFO ต้องตั้งคำถาม: 2-3 ล้านดอลลาร์ต่อเมกะวัตต์สำหรับการติดตั้งปรับปรุง² การเลือกระหว่างการระบายความร้อนด้วยอากาศและของเหลวไม่เพียงกำหนดงบประมาณโครงสร้างพื้นฐาน แต่ยังกำหนดความสามารถในการแข่งขันในตลาด AI ที่มิลลิวินาทีแยกผู้ชนะออกจากผู้ที่ตามหลัง
อัปเดตธันวาคม 2025: ปี 2025 ถือเป็นปีที่การระบายความร้อนด้วยของเหลว "เปลี่ยนจากเทคโนโลยีล้ำสมัยสุดขอบเป็นมาตรฐานพื้นฐาน" ตลาดการระบายความร้อนด้วยของเหลวสำหรับศูนย์ข้อมูลมีมูลค่า 5.52 พันล้านดอลลาร์ในปี 2025 และคาดว่าจะถึง 15.75 พันล้านดอลลาร์ภายในปี 2030 (CAGR 23.31%) ด้วย 22% ของศูนย์ข้อมูลที่นำระบบระบายความร้อนด้วยของเหลวมาใช้ เทคโนโลยีนี้ได้เปลี่ยนสถานะจากเทคโนโลยีเฉพาะทางมาเป็นโครงสร้างพื้นฐานหลัก การระบายความร้อนแบบ Direct-to-chip ครองส่วนแบ่งตลาด 47% โดย Microsoft เริ่มติดตั้งทั่ววิทยาเขต Azure ในเดือนกรกฎาคม 2025 และทดสอบ microfluidics สำหรับรุ่นอนาคต Colovore ได้รับสิ่งอำนวยความสะดวกมูลค่า 925 ล้านดอลลาร์ที่รองรับได้สูงถึง 200kW ต่อตู้แร็ค ชิป AI สมัยใหม่อย่าง NVIDIA H100/H200 และ AMD MI300X ผลิตความร้อนมากกว่า 700W ต่อ GPU—ความหนาแน่นทางความร้อนที่การระบายความร้อนด้วยอากาศไม่สามารถจัดการได้ สถาปัตยกรรมการระบายความร้อนแบบไฮบริดที่ผสมผสานอากาศและของเหลวกำลังกลายเป็นมาตรฐานการติดตั้งในทางปฏิบัติ
ศูนย์ข้อมูลทั่วโลกใช้พลังงาน 460 เทราวัตต์-ชั่วโมงต่อปี โดยการระบายความร้อนคิดเป็น 40% ของการใช้พลังงานทั้งหมดในสิ่งอำนวยความสะดวกแบบดั้งเดิม³ แผนงาน GPU ล่าสุดของ NVIDIA แสดงให้เห็นว่าการใช้พลังงานเพิ่มขึ้นสองเท่าทุกสองปี โดยจะถึง 1,500 วัตต์ต่อชิปภายในปี 2026⁴ องค์กรต่างๆ เผชิญจุดพลิกผันที่การปรับปรุงเล็กน้อยของการระบายความร้อนด้วยอากาศไม่สามารถตามทันการเติบโตแบบเอ็กซ์โพเนนเชียลของความหนาแน่นความร้อน การตัดสินใจที่ทำในวันนี้จะกำหนดต้นทุนการดำเนินงานสำหรับทศวรรษหน้า
Microsoft ใช้เงิน 1 พันล้านดอลลาร์ปรับปรุงสิ่งอำนวยความสะดวกสำหรับการระบายความร้อนด้วยของเหลว หลังจากพบว่าโครงสร้างพื้นฐานที่ระบายความร้อนด้วยอากาศไม่สามารถรองรับการฝึก GPT ได้⁵ Amazon Web Services ใช้เทคโนโลยีทั้งสองอย่างเชิงกลยุทธ์ โดยใช้การระบายความร้อนด้วยอากาศสำหรับงาน storage และ CPU ในขณะที่สงวนการระบายความร้อนด้วยของเหลวสำหรับ GPU cluster⁶ แนวทางที่แตกต่างกันสะท้อนความจริงพื้นฐาน: ไม่มีเทคโนโลยีการระบายความร้อนใดแก้ปัญหาได้ทุกอย่าง และการเลือกผิดจะเสียเงินหลายล้านดอลลาร์ในสินทรัพย์ที่ไร้ประโยชน์
ฟิสิกส์ที่กำหนดทุกสิ่ง
อากาศนำพาความร้อนได้น้อยกว่าน้ำ 3,300 เท่าต่อหน่วยปริมาตรที่สภาวะมาตรฐาน⁷ ข้อเท็จจริงเดียวนี้ขับเคลื่อนทุกการตัดสินใจด้านการระบายความร้อนในศูนย์ข้อมูลสมัยใหม่ การเคลื่อนย้ายความร้อนหนึ่งกิโลวัตต์ด้วยอากาศต้องการอัตราการไหล 100 ลูกบาศก์ฟุตต่อนาที (CFM) โดยมีอุณหภูมิเพิ่มขึ้น 10°F ขยายไปสู่ตู้แร็ค 40kW คุณต้องการ 4,000 CFM—เทียบเท่ากับความเร็วลมพายุเฮอริเคนระดับ 2 ในทางเดินอากาศเย็น⁸
ความจุความร้อนจำเพาะของน้ำที่ 4.186 kJ/kg·K หมายความว่าน้ำหนึ่งแกลลอนสามารถดูดซับความร้อนได้เท่ากับอากาศ 3,000 ลูกบาศก์ฟุต⁹ อัตราการไหลเพียงเล็กน้อยที่ 10 แกลลอนต่อนาทีจัดการกับความร้อน 100kW โดยมีอุณหภูมิเพิ่มขึ้น 20°F การระบายความร้อนแบบเดียวกันด้วยอากาศจะต้องการ 10,000 CFM สร้างเสียงรบกวน 95 เดซิเบล และใช้พลังงาน 25kW เฉพาะสำหรับพลังงานพัดลม¹⁰ ข้อได้เปรียบทางฟิสิกส์กลายเป็นสิ่งที่เอาชนะไม่ได้เมื่อความหนาแน่นเพิ่มขึ้น
สัมประสิทธิ์การถ่ายเทความร้อนบอกเรื่องราวทั้งหมด การพาความร้อนจากอากาศสู่พื้นผิวบรรลุ 25-250 W/m²·K ขึ้นอยู่กับความเร็ว¹¹ การพาความร้อนจากน้ำสู่พื้นผิวบรรลุ 3,000-15,000 W/m²·K ซึ่งดีขึ้น 60 เท่าที่ช่วยให้ใช้ heat exchanger ขนาดเล็กลงอย่างมาก¹² การสัมผัสโดยตรงระหว่างของเหลวและแพ็คเกจชิปผ่าน cold plate บรรลุ 50,000+ W/m²·K ใกล้เคียงขีดจำกัดทางทฤษฎีของการถ่ายเทความร้อนแบบนำความร้อน¹³
ความแตกต่างของอุณหภูมิทวีคูณข้อได้เปรียบเหล่านี้ การระบายความร้อนด้วยอากาศต้องการความแตกต่าง 30-40°F ระหว่างอุณหภูมิขาเข้าและอุณหภูมิชิ้นส่วนเพื่อขับเคลื่อนฟลักซ์ความร้อนที่เพียงพอ การระบายความร้อนด้วยของเหลวทำงานด้วยความแตกต่าง 10-15°F รักษาอุณหภูมิจุดต่อที่ต่ำกว่าซึ่งลดกระแสรั่วไหลและปรับปรุงความน่าเชื่อถือ¹⁴ การลดอุณหภูมิการทำงานทุก 10°C จะเพิ่มอายุการใช้งานชิ้นส่วนเป็นสองเท่าตามการสร้างแบบจำลองสมการ Arrhenius¹⁵
ระดับความสูงและความชื้นจำกัดประสิทธิภาพการระบายความร้อนด้วยอากาศเพิ่มเติม ระดับความสูงหนึ่งไมล์ของเดนเวอร์ลดความหนาแน่นอากาศลง 17% ต้องการอัตราการไหลที่มากขึ้นตามสัดส่วนสำหรับการระบายความร้อนที่เทียบเท่า¹⁶ สภาพแวดล้อมที่มีความชื้นสูงเสี่ยงต่อการควบแน่นเมื่ออากาศเย็นพบกับพื้นผิวอุ่น อาจทำให้อุปกรณ์เสียหายอย่างรุนแรง ระบบระบายความร้อนด้วยของเหลวทำงานโดยไม่ขึ้นกับสภาวะแวดล้อม ให้ประสิทธิภาพที่สม่ำเสมอตั้งแต่ Death Valley ไปจนถึงเทือกเขาหิมาลัย
เทคโนโลยีการระบายความร้อนด้วยอากาศและข้อจำกัด
การระบายความร้อนด้วยอากาศแบบพื้นยกแบบดั้งเดิมครองศูนย์ข้อมูลมาสี่สิบปีด้วยความเรียบง่ายและความน่าเชื่อถือ หน่วย Computer Room Air Conditioning (CRAC) เป่าอากาศเย็นใต้พื้นยก สร้างแรงดันบวกที่บังคับให้อากาศไหลผ่านกระเบื้องเจาะรูเข้าสู่ทางเดินอากาศเย็น เซิร์ฟเวอร์ดึงอากาศผ่านตัวเครื่องและปล่อยอากาศร้อนออกสู่ทางเดินอากาศร้อน ระบบทำงานได้ดีสำหรับ 3-5kW ต่อตู้แร็ค แต่ล้มเหลวอย่างรุนแรงเกิน 15kW เมื่อการหมุนเวียนอากาศร้อนเอาชนะความสามารถในการระบายความร้อน¹⁷
การแยกทางเดินอากาศร้อน/อากาศเย็นปรับปรุงประสิทธิภาพโดยป้องกันการผสมของอากาศ ม่านพลาสติกหรือแผงแข็งแยกโซนร้อนและเย็น รักษาความแตกต่างของอุณหภูมิที่ปรับปรุงประสิทธิภาพการระบายความร้อน การแยกที่ดำเนินการอย่างเหมาะสมลดพลังงานการระบายความร้อน 20-30% และเพิ่มความสามารถในการระบายความร้อน 40%¹⁸ ศูนย์ข้อมูลของ Google บรรลุ PUE 1.10 โดยใช้การระบายความร้อนด้วยอากาศขั้นสูงพร้อมการแยกเต็มรูปแบบ พิสูจน์ศักยภาพของเทคโนโลยีเมื่อดำเนินการอย่างสมบูรณ์แบบ¹⁹
การระบายความร้อนแบบ In-row นำการทำความเย็นมาใกล้แหล่งความร้อนมากขึ้น ลดเส้นทางอากาศและลดพลังงานพัดลม ซีรีส์ CRV ของ Vertiv วางหน่วยระบายความร้อนระหว่างตู้แร็คเซิร์ฟเวอร์ จัดการได้ถึง 55kW ต่อหน่วย²⁰ InRow cooler ของ Schneider Electric บรรลุความสามารถใกล้เคียงกันด้วยพัดลมความเร็วแปรผันที่ปรับตัวตามภาระความร้อน²¹ แนวทางนี้ใช้ได้กับการติดตั้งความหนาแน่นปานกลาง แต่ต้องการหนึ่งหน่วยระบายความร้อนสำหรับทุก 2-3 ตู้แร็คเซิร์ฟเวอร์ ใช้พื้นที่อันมีค่า
Rear-door heat exchanger เป็นป้อมปราการสุดท้ายของการระบายความร้อนด้วยอากาศต่อความหนาแน่นที่เพิ่มขึ้น หน่วยแบบ passive หรือ active เหล่านี้ติดตั้งบนประตูหลังตู้แร็ค ทำให้อากาศที่ปล่อยออกเย็นลงก่อนเข้าสู่ห้อง ChilledDoor ของ Motivair จัดการได้ถึง 75kW ต่อตู้แร็คโดยใช้การหมุนเวียนน้ำเย็น²² เทคโนโลยีนี้รักษารูปแบบการไหลของอากาศที่มีอยู่ในขณะที่ระบายความร้อนที่แหล่ง แต่การติดตั้งต้องการการจัดตำแหน่งที่แม่นยำและน้ำหนักประตูสร้างข้อกังวลด้านโครงสร้างสำหรับตู้แร็คเก่า
การระบายความร้อนแบบ Direct expansion (DX) ขจัดโครงสร้างพื้นฐานน้ำเย็นโดยนำสารทำความเย็นโดยตรงไปยังหน่วยระบายความร้อน แนวทางนี้ลดความซับซ้อนและปรับปรุงประสิทธิภาพสำหรับสิ่งอำนวยความสะดวกขนาดเล็ก แต่ความเสี่ยงจากการรั่วไหลของสารทำความเย็นและความสามารถในการขยายที่จำกัดจำกัดการนำมาใช้ Facebook ละทิ้งการระบายความร้อน DX หลังจากการรั่วไหลของสารทำความเย็นทำให้ต้องอพยพสิ่งอำนวยความสะดวกหลายครั้ง เปลี่ยนไปใช้ระบบน้ำทั้งหมด²³
อนุกรมวิธานที่ขยายตัวของการระบายความร้อนด้วยของเหลว
การระบายความร้อนแบบ Single-phase direct-to-chip ครองการติดตั้งของเหลวในปัจจุบันด้วยความน่าเชื่อถือที่พิสูจน์แล้วและความซับซ้อนที่จัดการได้ Cold plate ที่ติดตั้งบน CPU และ GPU หมุนเวียนสารหล่อเย็นที่ 15-30°C ระบายความร้อนของเซิร์ฟเวอร์ 70-80% ในขณะที่พัดลมจัดการส่วนที่เหลือ²⁴ ระบบ InRackCDU ของ Asetek รองรับ 120kW ต่อตู้แร็คพร้อมปั๊มสำรองและการตรวจจับการรั่วไหล²⁵ เทคโนโลยีนี้ต้องการการปรับเปลี่ยนเซิร์ฟเวอร์เพียงเล็กน้อย ช่วยให้สามารถติดตั้งแบบ retrofit โดยไม่ต้องเปลี่ยนฮาร์ดแวร์ที่มีอยู่
การระบายความร้อนแบบ Two-phase direct-to-chip ใช้ประโยชน์จากการเปลี่ยนเฟสของสารทำความเย็นสำหรับการระบายความร้อนที่เหนือกว่า สารหล่อเย็นเดือดที่อุณหภูมิพื้นผิวชิปประมาณ 50°C โดยไอนำพาความร้อนแฝงของการกลายเป็นไอ Waterless DLC ของ ZutaCore บรรลุการระบายความร้อน 900W ต่อ GPU โดยใช้สารทำความเย็น R-1234ze ที่ความดันต่ำ²⁶ ลักษณะการควบคุมตัวเองของการเดือดรักษาอุณหภูมิสม่ำเสมอโดยไม่คำนึงถึงการเปลี่ยนแปลงของภาระความร้อน แต่ความซับซ้อนของระบบและต้นทุนสารทำความเย็นจำกัดการนำมาใช้
การจุ่มแบบ Single-phase จุ่มเซิร์ฟเวอร์ทั้งหมดในของเหลวไดอิเล็กตริก ขจัดข้อกำหนดการระบายความร้อนด้วยอากาศทั้งหมด ระบบ ICEraQ ของ GRC ใช้น้ำมันสังเคราะห์รักษาเซิร์ฟเวอร์ที่อุณหภูมิขาเข้า 45-50°C²⁷ SmartPod ของ Submer ใช้เทคโนโลยีที่คล้ายกันกับของเหลวที่ย่อยสลายได้ทางชีวภาพ จัดการ 100kW ใน 60 ตารางฟุต²⁸ การจุ่มขจัดพัดลม ลดอัตราความล้มเหลว และเปิดใช้งานความหนาแน่นสูงสุด แต่ต้นทุนของเหลว 50-100 ดอลลาร์ต่อแกลลอนและความท้าทายด้านการบำรุงรักษาทำให้การนำมาใช้ช้าลง²⁹
การจุ่มแบบ Two-phase เป็นจุดสูงสุดทางเทคโนโลยีของการระบายความร้อน ของเหลว Novec ของ 3M เดือดที่อุณหภูมิที่ควบคุมอย่างแม่นยำระหว่าง 34-56°C ให้การระบายความร้อนแบบ isothermal ที่รักษาอุณหภูมิชิ้นส่วนที่เหมาะสม³⁰ Project Natick ของ Microsoft แสดงให้เห็นการจุ่มแบบ two-phase จัดการฟลักซ์ความร้อน 250W/cm² สูงกว่าขีดจำกัดการระบายความร้อนด้วยอากาศ 10 เท่า³¹ BitFury ติดตั้งการระบายความร้อนแบบจุ่ม two-phase 160 เมกะวัตต์สำหรับการขุดสกุลเงินดิจิทัล พิสูจน์ความสามารถในการขยายแม้ว่าต้นทุนของเหลว 200 ดอลลาร์ต่อแกลลอน³²
แนวทางแบบไฮบริดรวมเทคโนโลยีเพื่อการระบายความร้อนที่เหมาะสม การระบายความร้อนด้วยของเหลวจัดการชิ้นส่วนกำลังสูงในขณะที่การระบายความร้อนด้วยอากาศจัดการหน่วยความจำ storage และอุปกรณ์เครือข่าย ระบบ Apollo ของ HPE ใช้แนวทางนี้ โดยใช้การระบายความร้อน direct-to-chip สำหรับโปรเซสเซอร์และการระบายความร้อนด้วยอากาศแบบดั้งเดิมสำหรับทุกอย่างอื่น³³ กลยุทธ์นี้สมดุลระหว่างประสิทธิภาพและต้นทุน แต่ต้องการการจัดการโครงสร้างพื้นฐานการระบายความร้อนแบบขนานสองระบบ
การเปรียบเทียบค่าใช้จ่ายเงินทุนเผยให้เห็นสิ่งที่น่าประหลาดใจ
โครงสร้างพื้นฐานการระบายความร้อนด้วยอากาศดูเหมือนถูกอย่างหลอกลวงในตอนแรก หน่วย CRAC มีราคา 30,000-50,000 ดอลลาร์ต่อความสามารถ 30 ตัน เพียงพอสำหรับภาระ IT 100kW³⁴ การติดตั้งพื้นยกมีราคา 15-25 ดอลลาร์ต่อตารางฟุต³⁵ การแยกทางเดินอากาศร้อนเพิ่ม 5,000-10,000 ดอลลาร์ต่อตู้แร็ค³⁶ ระบบระบายความร้อนด้วยอากาศทั้งหมดสำหรับสิ่งอำนวยความสะดวก 1MW มีราคา 1.5-2 ล้านดอลลาร์ ซึ่งดูสมเหตุสมผลจนกว่าข้อกำหนดความหนาแน่นจะปรากฏ
โครงสร้างพื้นฐานการระบายความร้อนด้วยของเหลวต้องการการลงทุนล่วงหน้าจำนวนมาก Cooling Distribution Units (CDUs) มีราคา 75,000-150,000 ดอลลาร์ต่อความสามารถ 500kW³⁷ การติดตั้งท่อมีราคา 50-100 ดอลลาร์ต่อฟุตเชิงเส้นรวมฉนวนและการตรวจจับการรั่วไหล³⁸ Cold plate และ manifold เพิ่ม 5,000-10,000 ดอลลาร์ต่อเซิร์ฟเวอร์³⁹ โครงสร้างพื้นฐานการระบายความร้อนด้วยของเหลวทั้งหมดสำหรับ 1MW มีราคา 3-4 ล้านดอลลาร์ เป็นสองเท่าของราคาการระบายความร้อนด้วยอากาศ
ต้นทุนแฝงเปลี่ยนการคำนวณอย่างมาก การระบายความร้อนด้วยอากาศที่ 40kW ต่อตู้แร็คต้องการ 25 ตู้แร็คต่อเมกะวัตต์ ใช้พื้นที่ 2,500 ตารางฟุต การระบายความร้อนด้วยของเหลวที่ 100kW ต่อตู้แร็คต้องการเพียง 10 ตู้แร็คใน 1,000 ตารางฟุต ที่อัตราค่าเช่า 200 ดอลลาร์ต่อตารางฟุตต่อปี การประหยัดพื้นที่สร้างผลประโยชน์ 300,000 ดอลลาร์ต่อปี⁴⁰ ต้นทุนการก่อสร้างสำหรับสิ่งอำนวยความสะดวกใหม่เฉลี่ย 10-15 ล้านดอลลาร์ต่อเมกะวัตต์สำหรับการระบายความร้อนด้วยอากาศเทียบกับ 8-12 ล้านดอลลาร์สำหรับการระบายความร้อนด้วยของเหลวเนื่องจากข้อกำหนดพื้นที่ที่ลดลง⁴¹
สถานการณ์การ retrofit เอื้อต่อการระบายความร้อนด้วยของเหลวอย่างตรงข้ามกับสัญชาตญาณ สิ่งอำนวยความสะดวกที่มีอยู่มักรองรับ 100-150 วัตต์ต่อตารางฟุต การอัพเกรดการระบายความร้อนด้วยอากาศเพื่อจัดการกับความหนาแน่นสมัยใหม่ต้องการหน่วย CRAC ใหม่ ท่อที่ใหญ่ขึ้น พัดลมที่แรงขึ้น และมักจะต้องมีการกระจายพลังงานใหม่—โดยพื้นฐานแล้วคือการรื้อสิ่งอำนวยความสะดวก การ retrofit การระบายความร้อนด้วยของเหลวเพิ่ม CDU และท่อในขณะที่รักษาโครงสร้างพื้นฐานที่มีอยู่สำหรับอุปกรณ์เก่า โครงการ retrofit ของ Introl แสดงให้เห็นต้นทุนที่ต่ำกว่า 20-30% สำหรับการแปลงการระบายความร้อนด้วยของเหลวเมื่อเทียบกับการอัพเกรดการระบายความร้อนด้วยอากาศอย่างสม่ำเสมอ
วงจรการรีเฟรชอุปกรณ์ส่งผลต่อการคำนวณ TCO อย่างมีนัยสำคัญ เซิร์ฟเวอร์ที่ระบายความร้อนด้วยอากาศต้องการการเปลี่ยนทุก 3-4 ปีเมื่อตลับลูกปืนพัดลมสึกหรอและการสะสมของฝุ่นลดประสิทธิภาพการระบายความร้อน ระบบที่ระบายความร้อนด้วยของเหลวที่ไม่มีชิ้นส่วนเคลื่อนไหวขยายวงจรการรีเฟรชเป็น 5-7 ปี⁴² อายุการใช้งานที่ยาวนานขึ้นเลื่อนค่าใช้จ่ายเงินทุนมูลค่า 2-3 ล้านดอลลาร์ต่อเมกะวัตต์ตลอดหนึ่งทศวรรษ
ค่าใช้จ่ายในการดำเนินงานพลิกสถานการณ์
ต้นทุนพลังงานครองงบประมาณการดำเนินงาน และข้อได้เปรียบด้านประสิทธิภาพของการระบายความร้อนด้วยของเหลวทบต้นทุกปี การระบายความร้อนด้วยอากาศใช้ 0.5-1.2 kW ต่อ kW ของภาระ IT ในการใช้งานทั่วไป⁴³ การระบายความร้อนด้วยของเหลวลดค่าใช้จ่ายการระบายความร้อนเหลือ 0.1-0.3 kW ต่อ kW ของภาระ IT⁴⁴ สำหรับสิ่งอำนวยความสะดวก 10MW ที่ทำงานต่อเนื่องที่ 0.10 ดอลลาร์ต่อ kWh การ
[เนื้อหาถูกตัดสำหรับการแปล]