ระบบระบายความร้อนด้วยของเหลวสำหรับ AI: จากเทคโนโลยีเฉพาะทางสู่โครงสร้างพื้นฐานที่จำเป็น
อัปเดตเมื่อวันที่ 11 ธันวาคม 2025
อัปเดตเดือนธันวาคม 2025: ตลาดระบบระบายความร้อนด้วยของเหลวพุ่งสูงจาก 2.8 พันล้านดอลลาร์ในปี 2025 สู่กว่า 21 พันล้านดอลลาร์ภายในปี 2032 โดยมีอัตราการเติบโตต่อปีแบบทบต้นเกิน 30%¹ แร็ค NVIDIA ปัจจุบันอยู่ที่ 132kW ขณะที่รุ่นถัดไปต้องการ 240kW GB200 NVL72 ช่วยประหยัดต้นทุนได้ถึง 25 เท่า (มากกว่า 4 ล้านดอลลาร์ต่อปีสำหรับศูนย์ข้อมูลขนาด 50 เมกะวัตต์) ระบบระบายความร้อนแบบ Direct-to-chip รองรับได้ถึง 1,600 วัตต์ต่อชิ้นส่วน Accelsius NeuCool ระบายความร้อนได้ 4,500 วัตต์ต่อช่อง GPU ด้วยน้ำอุ่น 40°C
ตลาดระบบระบายความร้อนด้วยของเหลวทั่วโลกจะพุ่งสูงจาก 2.8 พันล้านดอลลาร์ในปี 2025 สู่กว่า 21 พันล้านดอลลาร์ภายในปี 2032 โดยมีอัตราการเติบโตต่อปีแบบทบต้นเกิน 30%¹ ณ ช่วงกลางปี 2025 การเปลี่ยนผ่านจากระบบระบายความร้อนด้วยอากาศไปสู่ของเหลวได้เปลี่ยนจากขั้นทดลองไปสู่การใช้งานจริง² เมื่อทำงานเต็มกำลัง เซิร์ฟเวอร์ GPU ที่ใช้ NVIDIA รุ่นล่าสุดต้องการพลังงาน 132 กิโลวัตต์ต่อแร็ค รุ่นถัดไปที่คาดว่าจะออกภายในหนึ่งปีจะต้องการ 240 กิโลวัตต์³ ระบบระบายความร้อนด้วยอากาศแบบดั้งเดิมไม่สามารถกระจายความร้อนได้ในระดับความหนาแน่นเหล่านี้ ระบบระบายความร้อนด้วยของเหลวจึงเปลี่ยนจากสิ่งฟุ่มเฟือยของผู้ให้บริการ Hyperscale ไปสู่ความจำเป็นสำหรับทุกองค์กรที่ต้องการติดตั้งโครงสร้างพื้นฐาน AI รุ่นปัจจุบัน
เหตุผลทางเศรษฐกิจยิ่งสนับสนุนการเปลี่ยนผ่านนี้ ศูนย์ข้อมูลใช้จ่ายประมาณ 1.9 ถึง 2.8 ล้านดอลลาร์ต่อเมกะวัตต์ต่อปีสำหรับการระบายความร้อน⁴ การติดตั้งระบบ GB200 NVL72 ที่ระบายความร้อนด้วยของเหลวช่วยให้ศูนย์ข้อมูลระดับ Hyperscale ประหยัดต้นทุนได้ถึง 25 เท่า แปลงเป็นการประหยัดมากกว่า 4 ล้านดอลลาร์ต่อปีสำหรับศูนย์ข้อมูลขนาด 50 เมกะวัตต์⁵ องค์กรที่ต่อต้านการเปลี่ยนผ่านนี้จะพบว่าตนเองไม่สามารถติดตั้ง GPU รุ่นที่กำหนดขีดความสามารถของ AI ได้
หลักฟิสิกส์ที่ขับเคลื่อนการเปลี่ยนผ่าน
เซิร์ฟเวอร์ที่ปรับแต่งสำหรับ AI และคลัสเตอร์ที่มี GPU หนาแน่นดันความหนาแน่นพลังงานเกิน 50 กิโลวัตต์ต่อแร็ค ถึงระดับที่ระบบระบายความร้อนด้วยอากาศแบบดั้งเดิมไม่สามารถรับประกันการกระจายความร้อนที่เสถียรหรือมีประสิทธิภาพได้⁶ ตามข้อมูลของ Uptime Institute ความหนาแน่นพลังงานเฉลี่ยต่อแร็คในศูนย์ข้อมูลเพิ่มขึ้น 38% ตั้งแต่ปี 2022 ถึง 2024 โดยการเติบโตสูงสุดอยู่ใน AI และการติดตั้งระดับ Hyperscale⁷ ความหนาแน่นพลังงานที่เคยสูงสุดที่ 15 กิโลวัตต์ ตอนนี้ดันถึง 80 ถึง 120 กิโลวัตต์ในคลัสเตอร์ AI⁸
ข้อได้เปรียบพื้นฐานของการระบายความร้อนด้วยของเหลวอยู่ที่หลักเทอร์โมไดนามิกส์ ด้วยความหนาแน่นเกือบ 1,000 เท่าของอากาศ ของเหลวมีความสามารถในการพาความร้อนออกไปได้ยอดเยี่ยมด้วยความจุความร้อนและการนำความร้อนที่เหนือกว่า⁹ การถ่ายเทความร้อนจาก GPU ประสิทธิภาพสูงอย่างมีประสิทธิภาพ ทำให้ระบบระบายความร้อนด้วยของเหลวลดการพึ่งพาพัดลมระบายความร้อนที่กินพลังงาน ผลลัพธ์คือ: ลดการใช้พลังงานเซิร์ฟเวอร์โดยเฉลี่ย 11% พร้อมกับลดความต้องการพื้นที่โครงสร้างพื้นฐานระบายความร้อนแบบดั้งเดิมลง 80%¹⁰
ระบบระบายความร้อนด้วยอากาศรับมือกับความหนาแน่นพลังงานเกิน 10 ถึง 15 กิโลวัตต์ต่อแร็คได้ลำบาก¹¹ งาน AI หลายอย่างต้องการแร็คที่ทำงานที่ 30 ถึง 60 กิโลวัตต์หรือมากกว่า¹² ช่องว่างระหว่างสิ่งที่ระบบระบายความร้อนด้วยอากาศให้ได้กับสิ่งที่โครงสร้างพื้นฐาน AI ต้องการนั้นเพิ่มขึ้นในทุก GPU รุ่นใหม่
ระบบระบายความร้อนแบบ Direct-to-chip ครองตลาดการผลิต
ระบบระบายความร้อนแบบ Direct-to-chip กลายเป็นรูปแบบการระบายความร้อนด้วยของเหลวที่พบมากที่สุดในสภาพแวดล้อมการผลิตอย่างรวดเร็ว¹³ แผ่นระบายความร้อนติดตั้งโดยตรงบน CPU, GPU, โมดูลหน่วยความจำ และตัวควบคุมแรงดัน ระบบวงจรปิดหมุนเวียนสารหล่อเย็นผ่านแผ่นเหล่านี้ ระบายความร้อนที่แหล่งกำเนิด¹⁴
ระบบ GB200 NVL72 และ GB300 NVL72 ของ NVIDIA ใช้ระบบระบายความร้อนด้วยของเหลวแบบ Direct-to-chip เป็นการกำหนดค่ามาตรฐาน¹⁵ ต่างจากระบบระบายความร้อนแบบระเหยหรือแบบจุ่ม ระบบระบายความร้อนด้วยของเหลวของ NVL72 ทำงานเป็นระบบวงจรปิดที่สารหล่อเย็นไม่ระเหยหรือต้องเปลี่ยน ประหยัดน้ำ¹⁶ สถาปัตยกรรมนี้ให้ศักยภาพรายได้สูงกว่า 40 เท่า ปริมาณงานสูงกว่า 30 เท่า ประสิทธิภาพพลังงานดีกว่า 25 เท่า และประสิทธิภาพการใช้น้ำดีกว่า 300 เท่า เมื่อเทียบกับระบบระบายความร้อนด้วยอากาศแบบดั้งเดิม¹⁷
โซลูชัน Direct-to-chip รองรับได้ถึง 1,600 วัตต์ต่อชิ้นส่วน ช่วยให้มีความหนาแน่นเซิร์ฟเวอร์สูงกว่า 58% เมื่อเทียบกับระบบระบายความร้อนด้วยอากาศ พร้อมลดการใช้พลังงานโครงสร้างพื้นฐานลง 40%¹⁸ ระบบ DLC-2 enabled NVIDIA HGX B200 ของ Supermicro ดักจับความร้อนของระบบได้ถึง 98% โดยระบายความร้อน CPU, GPU, DIMM, สวิตช์ PCIe, ตัวควบคุมแรงดัน และแหล่งจ่ายไฟด้วยของเหลว ทำให้ศูนย์ข้อมูลทำงานเงียบที่ระดับเสียงต่ำเพียง 50 เดซิเบล¹⁹
Accelsius บรรลุเป้าหมายทางความร้อนสองประการด้วยเทคโนโลยี NeuCool: ระบายความร้อนได้สำเร็จ 4,500 วัตต์ต่อช่อง GPU และรักษาอุณหภูมิ GPU ที่ปลอดภัยในแร็ค AI ขนาด 250 กิโลวัตต์ที่โหลดเต็มโดยใช้น้ำอุ่น 40°C ในศูนย์ข้อมูล²⁰ ความสามารถในการใช้น้ำอุ่นแทนน้ำเย็นช่วยลดความต้องการโครงสร้างพื้นฐานระบายความร้อนและต้นทุนการดำเนินงาน
ระบบระบายความร้อนแบบจุ่มขยายตัวสำหรับความหนาแน่นสูงสุด
ระบบระบายความร้อนแบบจุ่มจุ่มเซิร์ฟเวอร์ในของเหลวที่ไม่นำไฟฟ้า บรรลุได้มากกว่า 100 กิโลวัตต์ต่อแร็ค และในบางการออกแบบขยายได้ถึง 250 กิโลวัตต์²¹ ระบบอย่าง ICEraQ ของ GRC มีความสามารถในการระบายความร้อนถึง 368 กิโลวัตต์ต่อระบบ ในขณะที่รักษาประสิทธิภาพการใช้พลังงานต่ำกว่า 1.03²² วิธีการนี้ขจัดพัดลมทั้งหมดและช่วยให้ผู้ดำเนินการบรรจุพลังการประมวลผลได้มากกว่า 10 ถึง 15 เท่าในพื้นที่เดียวกัน²³
ตลาดระบบระบายความร้อนแบบจุ่มสำหรับศูนย์ข้อมูลมีมูลค่า 4.87 พันล้านดอลลาร์ในปี 2025 และจะเติบโตเป็น 11.10 พันล้านดอลลาร์ภายในปี 2030 ด้วยอัตราการเติบโตต่อปีแบบทบต้น 17.91%²⁴ ระบบเฟสเดียวยังคงครองส่วนแบ่งตลาดมากที่สุดเนื่องจากความคุ้นเคยในการติดตั้ง แต่การออกแบบแบบสองเฟสชนะการทดลองในที่ที่ความหนาแน่นสูงสุดและสถาปัตยกรรมไม่ใช้ปั๊มมีความจำเป็น²⁵
เมื่อเทียบกับระบบระบายความร้อนด้วยอากาศแบบดั้งเดิม ระบบระบายความร้อนแบบจุ่มเฟสเดียวลดความต้องการไฟฟ้าได้เกือบครึ่ง มีส่วนช่วยลดการปล่อย CO2 ได้ถึง 30% และสนับสนุนการใช้น้ำน้อยลงถึง 99%²⁶ การประหยัดประสิทธิภาพแปลงโดยตรงเป็นเวลาสู่รายได้ที่เร็วขึ้นสำหรับบริการ AI ความสามารถในการขับเคลื่อนการใช้งานที่สูงขึ้นจากทุกตารางฟุตยังคงเป็นคานงัดทางเศรษฐกิจที่แข็งแกร่งที่สุดที่กระตุ้นการนำไปใช้ในระดับ Hyperscale²⁷
ในเดือนพฤษภาคม 2025 Intel ร่วมมือกับ Shell Global Solutions เปิดตัวโซลูชันระบบระบายความร้อนแบบจุ่มที่ได้รับการรับรองจาก Intel เป็นครั้งแรกสำหรับโปรเซสเซอร์ Xeon รุ่นที่ 4 และ 5 ช่วยให้การจัดการความร้อนประสิทธิภาพสูงในระดับการผลิต²⁸ ความร่วมมือนี้ส่งสัญญาณว่าระบบระบายความร้อนแบบจุ่มบรรลุระดับการรับรองและการสนับสนุนที่การติดตั้งระดับองค์กรต้องการ
การติดตั้งของ Hyperscaler กำหนดมาตรฐาน
คลัสเตอร์ Azure AI ของ Microsoft, การติดตั้ง TPU ของ Google และโหนดฝึกโมเดล LLaMA ของ Meta ทั้งหมดเปลี่ยนมาใช้ระบบระบายความร้อนด้วยของเหลว²⁹ ซูเปอร์คอมพิวเตอร์ AI ขั้นสูงของ Microsoft ที่เปิดตัวในปี 2025 มีแร็คที่ระบายความร้อนด้วยของเหลวเท่านั้นสนับสนุนงานฝึก GPT-Next³⁰ ความมุ่งมั่นของ Hyperscaler ยืนยันว่าระบบระบายความร้อนด้วยของเหลวเป็นโครงสร้างพื้นฐานที่พร้อมใช้งานจริง ไม่ใช่เทคโนโลยีทดลอง
HPE ส่งมอบโซลูชันตระกูล NVIDIA Blackwell รุ่นแรก GB200 NVL72 ในเดือนกุมภาพันธ์ 2025³¹ HPE สร้างเจ็ดในสิบซูเปอร์คอมพิวเตอร์ที่เร็วที่สุดในโลก สร้างความเชี่ยวชาญลึกซึ้งในระบบระบายความร้อนด้วยของเหลวโดยตรง³² สถาปัตยกรรมอ้างอิงของบริษัทให้พิมพ์เขียวสำหรับการติดตั้งระดับองค์กร
สถาปัตยกรรมอ้างอิงของ Vertiv สำหรับเซิร์ฟเวอร์ NVIDIA GB200 NVL72 ลดการใช้พลังงานประจำปีลง 25% ลดความต้องการพื้นที่แร็คลง 75% และลดขนาดพลังงานลง 30%³³ โครงสร้างพื้นฐานระบายความร้อนด้วยของเหลวของ Schneider Electric รองรับได้ถึง 132 กิโลวัตต์ต่อแร็คสำหรับศูนย์ข้อมูล AI GB200 NVL72³⁴ ระบบนิเวศผู้จำหน่ายตอนนี้เสนอโซลูชันแบบครบวงจรแทนที่จะต้องการวิศวกรรมเฉพาะทาง
Meta พัฒนา Air-Assisted Liquid Cooling ร่วมกับ Microsoft เป็นโซลูชันไฮบริดที่ปรับปรุงเพิ่มเติมได้³⁵ วิธีการนี้ช่วยให้ Meta เริ่มรวมระบบระบายความร้อนด้วยของเหลวโดยไม่ต้องยกเครื่องโครงสร้างพื้นฐานระบายความร้อนด้วยอากาศทั้งหมด แสดงให้เห็นเส้นทางการเปลี่ยนผ่านที่เป็นจริงสำหรับองค์กรที่มีสิ่งอำนวยความสะดวกอยู่แล้ว
ความท้าทายในการปรับปรุงยังคงมีอยู่
การปรับปรุงศูนย์ข้อมูลที่ดำเนินการอยู่เพื่อรองรับโปรเซสเซอร์ที่ทรงพลังมากขึ้นนำเสนอความท้าทายทางเทคนิคและโลจิสติกส์ที่สำคัญ³⁶ ผู้ดำเนินการบางรายสรุปว่าการสร้างสิ่งอำนวยความสะดวกใหม่ง่ายกว่าการอัปเกรดที่มีอยู่³⁷ การตัดสินใจขึ้นอยู่กับอายุสิ่งอำนวยความสะดวก อายุการใช้งานที่เหลือ และขนาดของการติดตั้ง AI ที่วางแผนไว้
ระบบระบายความร้อนด้วยของเหลวต้องการโครงสร้างพื้นฐานเฉพาะทาง รวมถึงหน่วยกระจายของเหลว แผ่นระบายความร้อน ถังจุ่ม และปั๊มสารหล่อเย็น³⁸ การปรับปรุงเกี่ยวข้องกับการแก้ไขแร็คเซิร์ฟเวอร์ การเพิ่มระบบป้องกันการรั่ว และการรับประกันการปฏิบัติตามข้อกำหนด³⁹ สถานที่ Brownfield เผชิญข้อจำกัดทางสถาปัตยกรรมและโครงสร้างพื้นฐานที่โครงการ Greenfield หลีกเลี่ยงได้
อัตราการนำไปใช้ที่ต่ำกว่าสำหรับโซลูชันที่ต้องใช้โครงสร้างพื้นฐานมากเช่นระบบระบายความร้อนแบบจุ่ม ที่ 20.4% ในสถานที่ Brownfield สะท้อนข้อจำกัดที่เป็นจริง⁴⁰ ข้อจำกัดเหล่านี้รวมถึงการปรับปรุงอย่างกว้างขวางเพื่อรองรับถัง พื้นที่จำกัด และความท้าทายในการรวมเข้ากับโครงสร้างพื้นฐานไฟฟ้าและระบายความร้อนที่มีอยู่⁴¹ สถานที่ Brownfield ดูเหมือนจะมีแนวโน้มที่จะนำโซลูชันแบบค่อยเป็นค่อยไปเช่นระบบระบายความร้อนแบบของเหลวสู่อากาศที่หลีกเลี่ยงการยกเครื่องโครงสร้างพื้นฐานทั้งหมด⁴²
Schneider Electric ร่วมมือกับ NVIDIA ในการออกแบบอ้างอิงการปรับปรุงสามแบบสำหรับผู้ดำเนินการศูนย์ข้อมูลที่ต้องการปรับปรุงประสิทธิภาพโดยไม่ต้องออกแบบสิ่งอำนวยความสะดวกใหม่ตั้งแต่ต้น⁴³ การออกแบบเหล่านี้ยอมรับว่าองค์กรส่วนใหญ่ไม่สามารถสร้างศูนย์ข้อมูล AI แบบ Greenfield และต้องทำงานภายในข้อจำกัดที่มีอยู่
ความซับซ้อนในการดำเนินงานเพิ่มขึ้น
เนื่องจากระบบของเหลวระบายความร้อนเฉพาะชิป การระบายความร้อนด้วยอากาศเสริมยังคงรับมือกับ 20% ถึง 30% ของภาระความร้อนทั้งหมด⁴⁴ สถาปัตยกรรมระบายความร้อนแบบไฮบริดต้องการความเชี่ยวชาญที่หลายองค์กรขาดภายใน⁴⁵ การเปลี่ยนแปลงการดำเนินงานมีความสำคัญเท่ากับการอัปเกรดเชิงกลเอง
ระบบระบายความร้อนด้วยของเหลวนำเสนอข้อกำหนดการดำเนินงานใหม่: การตรวจจับการรั่ว ความซ้ำซ้อนทางไฮดรอลิก การควบคุมคุณภาพสารหล่อเย็น และการเพิ่มทักษะช่างเทคนิค⁴⁶ ทีมปฏิบัติการศูนย์ข้อมูลแบบดั้งเดิมอาจไม่มีประสบการณ์กับระบบท่อ ปั๊ม และเครื่องแลกเปลี่ยนความร้อนในระดับที่โครงสร้างพื้นฐาน AI ต้องการ ช่องว่างทักษะส่งผลกระทบต่อระยะเวลาการติดตั้งและการดำเนินงานต่อเนื่อง
ZutaCore พัฒนาระบบระบายความร้อนด้วยของเหลวแบบ Direct-to-chip ที่รองรับ GB200 superchip ซึ่งรวมโปรเซสเซอร์ NVIDIA Grace ARM กับ GPU Blackwell⁴⁷ โซลูชันจากบุคคลที่สามขยายตัวเลือกแต่ยังทำให้การจัดการผู้จำหน่ายและการสนับสนุนซับซ้อนขึ้น
ปัญหาห่วงโซ่อุปทานอาจทำให้แผนระบายความร้อนแบบไฮบริดซับซ้อนขึ้น อาจแย่ลงจากการเปลี่ยนแปลงนโยบายการค้า⁴⁸ การเพิ่มขึ้นอย่างรวดเร็วของพลังการประมวลผลหมายความว่าศูนย์ข้อมูลที่อยู่แนวหน้าวันนี้อาจล้าหลังอย่างรวดเร็ว⁴⁹ การออกแบบสิ่งอำนวยความสะดวกที่มีความจุสำหรับความหนาแน่นพลังงานในอนาคตเป็นเรื่องท้าทายเมื่อเป้าหมายยังคงเคลื่อนที่อยู่
รูปแบบการนำไปใช้ตามภูมิภาค
อเมริกาเหนือเป็นผู้นำการนำไปใช้ในตลาดผ่านการเปิดตัวระดับการผลิตโดยผู้ให้บริการคลาวด์ระดับ Hyperscale⁵⁰ ตลาดสหรัฐอเมริกาจะเติบโตจาก 1.09 พันล้านดอลลาร์ในปี 2024 เป็น 6.39 พันล้านดอลลาร์ภายในปี 2034⁵¹ การลงทุนจาก Hyperscaler จาก AWS, Google และ Microsoft ขับเคลื่อนการนำไปใช้ขณะที่องค์กรต่างๆ ทำตาม
เอเชียแปซิฟิกแสดงการเติบโตที่ชันที่สุดขณะที่ญี่ปุ่น จีน และเกาหลีใต้เป็นผู้นำคลัสเตอร์ AI ที่ระบายความร้อนด้วยของเหลว⁵² ระบบระบายความร้อนด้วยอากาศแบบธรรมดาพิสูจน์แล้วว่าต้นทุนสูงเกินไปในสภาพอากาศร้อนชื้น⁵³ ระบบระบายความร้อนแบบจุ่มเสนอโซลูชันที่ยั่งยืนและประหยัดพื้นที่ที่เหมาะกับสภาพภูมิภาคเป็นพิเศษ เอเชียแปซิฟิกเป็นผู้นำตลาดระบบระบายความร้อนแบบจุ่มทั่วโลกตลอดช่วงการคาดการณ์⁵⁴
การกระจายทางภูมิศาสตร์สะท้อนทั้งการพิจารณาสภาพอากาศและความเข้มข้นของการลงทุนโครงสร้างพื้นฐาน AI ภูมิภาคที่มีโปรแกรมพัฒนา AI เชิงรุกขับเคลื่อนนวัตกรรมการระบายความร้อนจากความจำเป็น
ข้อพิจารณาในการวางแผนเชิงกลยุทธ์
องค์กรที่วางแผนโครงสร้างพื้นฐาน AI ต้องรวมระบบระบายความร้อนด้วยของเหลวเข้าในการตัดสินใจด้านสิ่งอำนวยความสะดวกและงบประมาณ การเลือกระหว่าง Direct-to-chip และระบบระบายความร้อนแบบจุ่มขึ้นอยู่กับขนาดการติดตั้ง ข้อจำกัดการปรับปรุง และความสามารถในการดำเนินงาน
สำหรับการติดตั้งใหม่ ระบบระบายความร้อนด้วยของเหลวควรเป็นข้อกำหนดเริ่มต้นสำหรับแร็คที่เกิน 30 กิโลวัตต์ การวางแผนสำหรับความหนาแน่น 100 กิโลวัตต์ขึ้นไปคาดการณ์แผนงาน GPU ถึงปี 2027 สิ่งอำนวยความสะดวกที่ออกแบบวันนี้โดยไม่มีโครงสร้างพื้นฐานระบายความร้อนด้วยของเหลวจะเผชิญการปรับปรุงที่มีราคาแพงหรือการเปลี่ยนทดแทนภายในไม่กี่ปี
สำหรับสิ่งอำนวยความสะดวกที่มีอยู่ ประเมินความเป็นไปได้ในการปรับปรุงอย่างตรงไปตรงมา การออกแบบอ้างอิงของ Schneider Electric เป็นจุดเริ่มต้น แต่ยังคงต้องการงานวิศวกรรมที่สำคัญ วิธีการแบบไฮบริดที่วางชั้นระบบระบายความร้อนด้วยของเหลวบนโครงสร้างพื้นฐานระบายความร้อนด้วยอากาศเสนอเส้นทางก้าวหน้าแบบค่อยเป็นค่อยไป
[เนื้อหาถูกตัดทอนสำหรับการแปล]