Làm mát bằng chất lỏng cho AI: từ giải pháp biên đến hạ tầng thiết yếu
Cập nhật ngày 11 tháng 12 năm 2025
Cập nhật tháng 12/2025: Thị trường làm mát bằng chất lỏng tăng vọt từ 2,8 tỷ USD (2025) lên hơn 21 tỷ USD vào năm 2032 (CAGR trên 30%). Các rack NVIDIA hiện tại đạt 132kW; thế hệ tiếp theo yêu cầu 240kW. GB200 NVL72 giúp tiết kiệm chi phí gấp 25 lần (hơn 4 triệu USD mỗi năm cho cơ sở 50MW). Làm mát trực tiếp đến chip hiện xử lý được công suất lên đến 1.600W mỗi linh kiện. Accelsius NeuCool làm mát 4.500W mỗi socket GPU với nước cơ sở ấm 40°C.
Thị trường làm mát bằng chất lỏng toàn cầu sẽ tăng vọt từ 2,8 tỷ USD năm 2025 lên hơn 21 tỷ USD vào năm 2032, với tốc độ tăng trưởng kép hàng năm vượt 30%.¹ Tính đến giữa năm 2025, sự chuyển đổi từ làm mát bằng không khí sang chất lỏng đã chuyển từ giai đoạn thử nghiệm sang vận hành thực tế.² Khi hoạt động hết công suất, các máy chủ GPU mới nhất dựa trên NVIDIA yêu cầu 132 kilowatt mỗi rack. Thế hệ tiếp theo, dự kiến ra mắt trong vòng một năm, sẽ yêu cầu 240 kilowatt.³ Làm mát bằng không khí truyền thống không thể tản nhiệt ở mật độ này. Làm mát bằng chất lỏng đã chuyển từ một thứ xa xỉ của các hyperscaler thành yêu cầu bắt buộc cho bất kỳ tổ chức nào triển khai hạ tầng AI thế hệ hiện tại.
Yếu tố kinh tế củng cố thêm cho sự chuyển đổi này. Các trung tâm dữ liệu chi khoảng 1,9 đến 2,8 triệu USD mỗi megawatt hàng năm cho việc làm mát.⁴ Việc triển khai hệ thống GB200 NVL72 làm mát bằng chất lỏng cho phép các trung tâm dữ liệu hyperscale đạt mức tiết kiệm chi phí lên đến 25 lần, tương đương hơn 4 triệu USD tiết kiệm hàng năm cho một cơ sở 50 megawatt.⁵ Các tổ chức kháng cự sự chuyển đổi này sẽ thấy mình không thể triển khai các thế hệ GPU định hình năng lực AI.
Vật lý thúc đẩy sự chuyển đổi
Các máy chủ tối ưu hóa cho AI và cụm GPU mật độ cao đẩy mật độ công suất vượt 50 kilowatt mỗi rack, đạt đến mức mà làm mát bằng không khí truyền thống không thể đảm bảo tản nhiệt ổn định hoặc hiệu quả.⁶ Theo Uptime Institute, mật độ công suất rack trung bình của trung tâm dữ liệu tăng 38% từ năm 2022 đến 2024, với mức tăng mạnh nhất ở các triển khai AI và hyperscale.⁷ Mật độ công suất từng tối đa ở 15 kilowatt giờ đây đã đạt 80 đến 120 kilowatt trong các cụm AI.⁸
Lợi thế cơ bản của làm mát bằng chất lỏng nằm ở nhiệt động lực học. Với mật độ gần gấp 1.000 lần không khí, chất lỏng vượt trội trong việc dẫn nhiệt nhờ nhiệt dung và độ dẫn nhiệt cao hơn.⁹ Bằng cách truyền nhiệt hiệu quả từ các GPU hiệu năng cao, làm mát bằng chất lỏng giảm sự phụ thuộc vào quạt làm mát tiêu thụ nhiều năng lượng. Kết quả: giảm trung bình 11% mức tiêu thụ năng lượng máy chủ đồng thời loại bỏ 80% yêu cầu không gian cho hạ tầng làm mát truyền thống.¹⁰
Hệ thống làm mát bằng không khí gặp khó khăn khi xử lý mật độ công suất trên 10 đến 15 kilowatt mỗi rack.¹¹ Nhiều khối lượng công việc AI yêu cầu rack chạy ở 30 đến 60 kilowatt hoặc hơn.¹² Khoảng cách giữa khả năng cung cấp của làm mát bằng không khí và nhu cầu của hạ tầng AI ngày càng lớn với mỗi thế hệ GPU.
Làm mát trực tiếp đến chip thống trị môi trường sản xuất
Làm mát trực tiếp đến chip nhanh chóng trở thành hình thức làm mát bằng chất lỏng phổ biến nhất được triển khai trong môi trường sản xuất.¹³ Các tấm làm mát được gắn trực tiếp lên CPU, GPU, mô-đun bộ nhớ và bộ điều chỉnh điện áp. Hệ thống vòng kín tuần hoàn chất làm mát qua các tấm này, loại bỏ nhiệt ngay tại nguồn.¹⁴
Hệ thống GB200 NVL72 và GB300 NVL72 của NVIDIA sử dụng làm mát trực tiếp đến chip bằng chất lỏng như cấu hình tiêu chuẩn.¹⁵ Không giống như làm mát bay hơi hoặc ngâm chìm, làm mát bằng chất lỏng của NVL72 hoạt động như hệ thống vòng kín, nơi chất làm mát không bay hơi hoặc cần thay thế, tiết kiệm nước.¹⁶ Kiến trúc này mang lại tiềm năng doanh thu cao hơn 40 lần, thông lượng cao hơn 30 lần, hiệu quả năng lượng cao hơn 25 lần và hiệu quả sử dụng nước cao hơn 300 lần so với hệ thống làm mát bằng không khí truyền thống.¹⁷
Các giải pháp làm mát trực tiếp đến chip hiện xử lý được công suất lên đến 1.600 watt mỗi linh kiện, cho phép mật độ máy chủ cao hơn 58% so với làm mát bằng không khí đồng thời giảm 40% mức tiêu thụ năng lượng hạ tầng.¹⁸ Hệ thống DLC-2 của Supermicro hỗ trợ NVIDIA HGX B200 thu giữ đến 98% nhiệt hệ thống bằng cách làm mát bằng chất lỏng cho CPU, GPU, DIMM, switch PCIe, bộ điều chỉnh điện áp và nguồn điện, cho phép vận hành trung tâm dữ liệu yên tĩnh với mức ồn thấp đến 50 decibel.¹⁹
Accelsius đạt được hai cột mốc nhiệt với công nghệ NeuCool: làm mát thành công 4.500 watt mỗi socket GPU và duy trì nhiệt độ GPU an toàn trong rack AI 250 kilowatt đầy tải sử dụng nước cơ sở ấm 40°C.²⁰ Khả năng sử dụng nước ấm thay vì nước lạnh giúp giảm yêu cầu hạ tầng làm mát và chi phí vận hành.
Làm mát ngâm chìm mở rộng cho mật độ cực cao
Làm mát ngâm chìm nhúng máy chủ trong chất lỏng điện môi, đạt công suất trên 100 kilowatt mỗi rack và trong một số thiết kế, mở rộng đến 250 kilowatt.²¹ Các hệ thống như ICEraQ của GRC đạt công suất làm mát lên đến 368 kilowatt mỗi hệ thống trong khi duy trì hiệu quả sử dụng năng lượng dưới 1,03.²² Phương pháp này loại bỏ hoàn toàn quạt và cho phép nhà vận hành gói gọn gấp 10 đến 15 lần năng lực tính toán trong cùng diện tích.²³
Thị trường làm mát ngâm chìm trung tâm dữ liệu đạt 4,87 tỷ USD năm 2025 và sẽ tăng lên 11,10 tỷ USD vào năm 2030 với tốc độ tăng trưởng kép hàng năm 17,91%.²⁴ Hệ thống một pha giữ thị phần lớn nhất nhờ sự quen thuộc trong lắp đặt, tuy nhiên thiết kế hai pha thắng trong các dự án thí điểm nơi mật độ cực cao và kiến trúc không bơm tỏ ra thiết yếu.²⁵
So với làm mát bằng không khí truyền thống, làm mát ngâm chìm một pha giảm nhu cầu điện năng đến gần một nửa, góp phần giảm phát thải CO2 đến 30% và hỗ trợ giảm đến 99% mức tiêu thụ nước.²⁶ Các lợi ích về hiệu quả chuyển trực tiếp thành thời gian đến doanh thu nhanh hơn cho các dịch vụ AI. Khả năng tăng mức sử dụng từ mỗi mét vuông vẫn là đòn bẩy kinh tế mạnh nhất thúc đẩy việc áp dụng hyperscale.²⁷
Vào tháng 5 năm 2025, Intel hợp tác với Shell Global Solutions ra mắt giải pháp làm mát ngâm chìm đầu tiên được Intel chứng nhận cho bộ xử lý Xeon thế hệ 4 và 5, cho phép quản lý nhiệt hiệu năng cao ở quy mô sản xuất.²⁸ Quan hệ đối tác này báo hiệu rằng làm mát ngâm chìm đã đạt đến mức chứng nhận và hỗ trợ mà các triển khai doanh nghiệp yêu cầu.
Các triển khai hyperscaler đặt ra tiêu chuẩn
Các cụm Azure AI của Microsoft, triển khai TPU của Google và các nút huấn luyện mô hình LLaMA của Meta đều đã chuyển sang làm mát bằng chất lỏng.²⁹ Siêu máy tính AI tiên tiến của Microsoft, công bố năm 2025, có các rack được làm mát hoàn toàn bằng chất lỏng hỗ trợ khối lượng công việc huấn luyện GPT-Next.³⁰ Các cam kết của hyperscaler xác nhận làm mát bằng chất lỏng là hạ tầng sẵn sàng sản xuất thay vì công nghệ thử nghiệm.
HPE giao hàng giải pháp dòng NVIDIA Blackwell đầu tiên, GB200 NVL72, vào tháng 2 năm 2025.³¹ HPE đã xây dựng bảy trong mười siêu máy tính nhanh nhất thế giới, thiết lập chuyên môn sâu về làm mát trực tiếp bằng chất lỏng.³² Các kiến trúc tham chiếu của công ty cung cấp bản thiết kế cho các triển khai doanh nghiệp.
Kiến trúc tham chiếu của Vertiv cho máy chủ NVIDIA GB200 NVL72 giảm 25% mức tiêu thụ năng lượng hàng năm, cắt giảm 75% yêu cầu không gian rack và thu nhỏ 30% diện tích năng lượng.³³ Hạ tầng làm mát bằng chất lỏng của Schneider Electric hỗ trợ đến 132 kilowatt mỗi rack cho trung tâm dữ liệu AI GB200 NVL72.³⁴ Hệ sinh thái nhà cung cấp hiện cung cấp các giải pháp trọn gói thay vì yêu cầu kỹ thuật tùy chỉnh.
Meta phát triển Air-Assisted Liquid Cooling với Microsoft như một giải pháp lai, có thể lắp đặt bổ sung.³⁵ Phương pháp này cho phép Meta bắt đầu tích hợp làm mát bằng chất lỏng mà không cần đại tu toàn bộ hạ tầng làm mát bằng không khí hiện có, thể hiện các lộ trình chuyển đổi thực dụng cho các tổ chức có cơ sở hiện hữu.
Thách thức cải tạo vẫn còn
Cải tạo một trung tâm dữ liệu đang hoạt động để phù hợp với bộ xử lý mạnh hơn đặt ra những thách thức kỹ thuật và hậu cần đáng kể.³⁶ Một số nhà vận hành kết luận rằng xây dựng cơ sở mới dễ hơn nâng cấp cơ sở hiện có.³⁷ Quyết định phụ thuộc vào tuổi cơ sở, thời gian sử dụng hữu ích còn lại và quy mô các triển khai AI theo kế hoạch.
Làm mát bằng chất lỏng yêu cầu hạ tầng chuyên dụng bao gồm các đơn vị phân phối chất lỏng, tấm làm mát, bể ngâm chìm và máy bơm chất làm mát.³⁸ Cải tạo bao gồm sửa đổi rack máy chủ, thêm hệ thống chống rò rỉ và đảm bảo tuân thủ quy định.³⁹ Các cơ sở brownfield đối mặt với những hạn chế về kiến trúc và hạ tầng mà các dự án greenfield tránh được.
Tỷ lệ áp dụng thấp hơn cho các giải pháp đòi hỏi nhiều hạ tầng như làm mát ngâm chìm, ở mức 20,4% trong số các cơ sở brownfield, phản ánh những ràng buộc thực tế.⁴⁰ Những ràng buộc này bao gồm cải tạo rộng rãi để phù hợp với các bể, diện tích sàn hạn chế và thách thức tích hợp với hạ tầng điện và làm mát hiện có.⁴¹ Các cơ sở brownfield có vẻ có khả năng áp dụng các giải pháp gia tăng như làm mát lỏng-khí để tránh đại tu hạ tầng hoàn toàn.⁴²
Schneider Electric hợp tác với NVIDIA về ba thiết kế tham chiếu cải tạo cho các nhà vận hành trung tâm dữ liệu tìm kiếm cải thiện hiệu năng mà không cần thiết kế lại cơ sở từ đầu.⁴³ Các thiết kế thừa nhận rằng hầu hết các tổ chức không thể xây dựng trung tâm dữ liệu AI greenfield và phải làm việc trong các ràng buộc hiện có.
Độ phức tạp vận hành tăng lên
Vì hệ thống chất lỏng chỉ làm mát các chip, làm mát bằng không khí bổ sung vẫn xử lý 20% đến 30% tổng tải nhiệt.⁴⁴ Kiến trúc làm mát lai yêu cầu chuyên môn mà nhiều tổ chức thiếu nội bộ.⁴⁵ Sự thay đổi vận hành tỏ ra quan trọng không kém bản thân việc nâng cấp cơ khí.
Làm mát bằng chất lỏng đưa ra các yêu cầu vận hành mới: phát hiện rò rỉ, dự phòng thủy lực, kiểm soát chất lượng chất làm mát và nâng cao kỹ năng kỹ thuật viên.⁴⁶ Các đội vận hành trung tâm dữ liệu truyền thống có thể không có kinh nghiệm với hệ thống ống, bơm và bộ trao đổi nhiệt ở quy mô mà hạ tầng AI đòi hỏi. Khoảng cách kỹ năng ảnh hưởng đến thời gian triển khai và vận hành liên tục.
ZutaCore phát triển hệ thống làm mát trực tiếp đến chip bằng chất lỏng hỗ trợ siêu chip GB200, kết hợp bộ xử lý NVIDIA Grace ARM với GPU Blackwell.⁴⁷ Các giải pháp từ bên thứ ba mở rộng lựa chọn nhưng cũng làm phức tạp việc quản lý nhà cung cấp và các thỏa thuận hỗ trợ.
Các vấn đề chuỗi cung ứng có thể làm phức tạp kế hoạch làm mát lai, có khả năng trầm trọng hơn do thay đổi chính sách thương mại.⁴⁸ Sự gia tăng nhanh chóng về năng lực tính toán có nghĩa là các trung tâm dữ liệu tiên tiến nhất hôm nay có thể nhanh chóng tụt hậu.⁴⁹ Thiết kế cơ sở với công suất cho mật độ năng lượng tương lai tỏ ra thách thức khi mục tiêu tiếp tục di chuyển.
Mô hình áp dụng theo khu vực
Bắc Mỹ dẫn đầu việc áp dụng thị trường thông qua các triển khai quy mô sản xuất bởi các nhà cung cấp đám mây hyperscale.⁵⁰ Thị trường Mỹ sẽ tăng từ 1,09 tỷ USD năm 2024 lên 6,39 tỷ USD vào năm 2034.⁵¹ Các đầu tư hyperscaler từ AWS, Google và Microsoft thúc đẩy việc áp dụng khi các doanh nghiệp theo bước họ.
Châu Á-Thái Bình Dương thể hiện tốc độ tăng trưởng mạnh nhất khi Nhật Bản, Trung Quốc và Hàn Quốc đi tiên phong với các cụm AI làm mát bằng chất lỏng.⁵² Làm mát bằng không khí thông thường tỏ ra không hiệu quả về chi phí trong khí hậu nóng ẩm.⁵³ Làm mát ngâm chìm cung cấp giải pháp bền vững, tiết kiệm không gian đặc biệt phù hợp với điều kiện khu vực. Châu Á-Thái Bình Dương dẫn đầu thị trường làm mát ngâm chìm toàn cầu trong suốt giai đoạn dự báo.⁵⁴
Phân bố địa lý phản ánh cả yếu tố khí hậu và sự tập trung đầu tư hạ tầng AI. Các khu vực có chương trình phát triển AI mạnh mẽ thúc đẩy đổi mới làm mát vì sự cần thiết.
Các cân nhắc hoạch định chiến lược
Các tổ chức hoạch định hạ tầng AI phải tính đến làm mát bằng chất lỏng trong các quyết định về cơ sở và ngân sách. Sự lựa chọn giữa làm mát trực tiếp đến chip và làm mát ngâm chìm phụ thuộc vào quy mô triển khai, ràng buộc cải tạo và năng lực vận hành.
Đối với các triển khai mới, làm mát bằng chất lỏng nên là thông số kỹ thuật mặc định cho bất kỳ rack nào vượt 30 kilowatt. Lập kế hoạch cho mật độ 100 kilowatt trở lên dự đoán lộ trình GPU đến năm 2027. Các cơ sở được thiết kế ngày nay mà không có hạ tầng làm mát bằng chất lỏng sẽ đối mặt với việc cải tạo hoặc thay thế tốn kém trong vài năm.
Đối với các cơ sở hiện có, đánh giá trung thực tính khả thi của việc cải tạo. Các thiết kế tham chiếu của Schneider Electric cung cấp điểm khởi đầu, nhưng công việc kỹ thuật đáng kể vẫn còn cần thiết. Các phương pháp lai kết hợp làm mát bằng chất lỏng vào hạ tầng làm mát bằng không khí cung cấp các lộ trình gia tăng phía trước.
[Nội dung bị cắt bớt để dịch]