Hiệu quả Sử dụng Nước: Làm mát Trung tâm Dữ liệu AI Không Gây Khủng hoảng
Cập nhật ngày 11 tháng 12, 2025
Cập nhật tháng 12/2025: Microsoft triển khai hệ thống làm mát vòng kín, không bay hơi nước—loại bỏ hoàn toàn nước bay hơi và giảm hơn 125 triệu lít mỗi cơ sở hàng năm. Các DC AI tiêu thụ nước làm mát nhiều gấp 10-50 lần so với các trung tâm máy chủ truyền thống. Các cơ sở của Google trung bình sử dụng 550.000 gallon mỗi ngày. Quá trình huấn luyện GPT-3 đã bay hơi 700.000 lít nước ngọt. Thiết kế không sử dụng nước đang trở thành hướng đi của ngành.
Các trung tâm dữ liệu sắp tới của Microsoft sẽ sử dụng hệ thống làm mát vòng kín, không bay hơi nước, loại bỏ hoàn toàn nhu cầu nước bay hơi.¹ Sau khi được nạp đầy khi xây dựng, hệ thống tuần hoàn chất làm mát liên tục, giảm lượng nước sử dụng hàng năm hơn 125 triệu lít mỗi cơ sở. Thiết kế này đại diện cho sự thay đổi căn bản trong cách tiếp cận tiêu thụ nước của cơ sở hạ tầng AI—chuyển từ chấp nhận mức sử dụng nước cao sang thiết kế để loại bỏ hoàn toàn.
Các trung tâm dữ liệu AI tiêu thụ nước làm mát nhiều gấp 10-50 lần so với các trung tâm máy chủ truyền thống.² Quy mô này tạo ra những lo ngại thực sự về tính bền vững: các trung tâm dữ liệu của Google trung bình sử dụng 550.000 gallon mỗi ngày cho mỗi cơ sở, và chỉ riêng việc huấn luyện GPT-3 đã bay hơi 700.000 lít nước ngọt.³ Các tổ chức xây dựng cơ sở hạ tầng AI đang đối mặt với áp lực ngày càng tăng từ các cơ quan quản lý, cộng đồng và các cam kết bền vững của chính họ để giải quyết vấn đề tiêu thụ nước. Hiểu về Hiệu quả Sử dụng Nước (WUE) và các công nghệ thúc đẩy làm mát không dùng nước giúp định hướng trong bối cảnh đang phát triển này.
Hiểu về WUE
The Green Grid đã giới thiệu Hiệu quả Sử dụng Nước vào năm 2011 như là chỉ số tiêu chuẩn cho việc tiêu thụ nước của trung tâm dữ liệu.⁴ Giống như Hiệu quả Sử dụng Năng lượng (PUE) cho năng lượng, WUE cung cấp một tiêu chuẩn để so sánh hiệu quả sử dụng nước giữa các cơ sở.
Tính toán WUE
WUE đo lường số lít nước tiêu thụ trên mỗi kilowatt-giờ năng lượng của thiết bị IT:
WUE = Lượng Nước Sử dụng Hàng năm tại Cơ sở (lít) / Năng lượng Thiết bị IT Hàng năm (kWh)
Công thức này bao gồm tất cả tiêu thụ nước—nước bổ sung cho tháp làm mát, tạo độ ẩm, và bất kỳ việc sử dụng nước vận hành nào khác—so với công suất tính toán thực tế được cung cấp.
Ví dụ tính toán:
Lượng nước sử dụng của cơ sở: 50 triệu lít/năm
Năng lượng IT tiêu thụ: 100 triệu kWh/năm
WUE = 50.000.000 / 100.000.000 = 0,5 L/kWh
Tiêu chuẩn WUE
WUE lý tưởng: 0,0 L/kWh Các cơ sở làm mát bằng không khí không sử dụng làm mát bay hơi có thể đạt được mức sử dụng nước bằng không. Đánh đổi: tiêu thụ năng lượng và PUE cao hơn.
Trung bình ngành: 1,8-1,9 L/kWh Hầu hết các trung tâm dữ liệu nằm trong khoảng này, sử dụng làm mát bay hơi để đánh đổi nước lấy hiệu quả năng lượng.⁵
Hàng đầu trong ngành: 0,3-0,7 L/kWh Trung tâm dữ liệu của NREL đạt 0,7 L/kWh cùng với PUE 1,06, chứng minh rằng WUE thấp không cần phải hy sinh hiệu quả năng lượng.⁶
Biến động theo khu vực: WUE của Microsoft thay đổi đáng kể theo địa điểm—Arizona hoạt động ở mức 1,52 L/kWh trong khi Singapore đạt 0,02 L/kWh.⁷ Khí hậu, nguồn nước sẵn có và công nghệ làm mát đều ảnh hưởng đến WUE có thể đạt được.
Sự đánh đổi WUE-PUE
WUE và PUE thường biến động ngược chiều:
Làm mát bằng không khí: Không sử dụng nước (WUE = 0) nhưng tiêu thụ năng lượng cao hơn (PUE 1,4-1,8)
Làm mát bay hơi: Sử dụng nước cao (WUE 1,5-2,5) nhưng hiệu quả năng lượng tốt hơn (PUE 1,1-1,3)
Làm mát bằng chất lỏng: Sử dụng nước tối thiểu trong các thiết kế vòng kín (WUE gần 0) với hiệu quả năng lượng xuất sắc (PUE 1,05-1,2)
Làm mát bằng chất lỏng phá vỡ sự đánh đổi truyền thống, cho phép cả WUE thấp và PUE thấp—điều này giải thích sự áp dụng nhanh chóng của nó cho cơ sở hạ tầng AI.
Thách thức tiêu thụ nước của AI
Các khối lượng công việc AI tạo ra nhu cầu nước chưa từng có thông qua sự kết hợp của mật độ công suất cao hơn và hoạt động liên tục.
Quy mô tiêu thụ
Lượng nước sử dụng của các hyperscaler tăng đáng kể cùng với sự mở rộng AI:
Google: Tiêu thụ 24.227 megalít vào năm 2023—gấp ba lần lượng sử dụng của Microsoft và tăng 17% hàng năm.⁸
Microsoft: 7.844 megalít vào năm 2023, với 41% tiêu thụ ở các khu vực thiếu nước. Hoạt động toàn cầu sử dụng gần 6,4 triệu mét khối, tăng 34% so với năm trước.⁹
Dự báo ngành: Lượng nước sử dụng dự kiến đạt 1.068 tỷ lít hàng năm vào năm 2028—tăng gấp 11 lần so với mức hiện tại.¹⁰
Các yếu tố đặc thù của AI
Các khối lượng công việc AI thúc đẩy tiêu thụ nước cao hơn thông qua một số cơ chế:
Mật độ công suất: Các rack GPU hoạt động ở mức 50-135 kW, so với 10-20 kW của các máy chủ truyền thống. Nhiệt tỏa ra cao hơn đòi hỏi làm mát mạnh mẽ hơn.
Hoạt động liên tục: Các phiên huấn luyện kéo dài hàng tuần hoặc hàng tháng tạo ra tải nhiệt bền vững mà không có các khoảng thời gian nhàn rỗi gián đoạn của các khối lượng công việc doanh nghiệp thông thường.
Tăng trưởng suy luận: Các triển khai AI sản xuất chạy suy luận liên tục, tạo ra nhu cầu làm mát 24/7 tích lũy tiêu thụ nước.
Tác động mỗi truy vấn: Các nhà nghiên cứu tại UC Riverside ước tính mỗi prompt AI 100 từ sử dụng khoảng 519 mililit nước—xấp xỉ một chai cho mỗi tương tác.¹¹
Tập trung địa lý
Căng thẳng về nước tăng lên ở các khu vực có đầu tư cơ sở hạ tầng AI lớn:
Arizona: Sự hiện diện lớn của hyperscaler trong khí hậu sa mạc với nguồn nước hạn chế. Các cơ sở Arizona của Microsoft hoạt động ở mức WUE 1,52 L/kWh—trong số cao nhất toàn cầu của họ.
Oregon: Sự gia tăng trung tâm dữ liệu gây căng thẳng nguồn nước ở các cộng đồng phụ thuộc vào cùng nguồn nước cho nông nghiệp và sinh hoạt.
Mở rộng toàn cầu: Các hyperscaler đối mặt với chỉ trích vì xây dựng các cơ sở sử dụng nhiều nước ở các khu vực dễ bị hạn hán trong khi theo đuổi các cam kết nước dương.¹²
Công nghệ làm mát và hiệu quả sử dụng nước
Làm mát bay hơi truyền thống
Làm mát bay hơi vẫn là công nghệ chủ đạo trong các trung tâm dữ liệu hiện có:
Cách hoạt động: Nước hấp thụ nhiệt khi bay hơi, truyền năng lượng nhiệt từ cơ sở ra khí quyển. Các tháp làm mát liên tục bay hơi nước để thải nhiệt từ trung tâm dữ liệu.
Tiêu thụ nước: Các hệ thống bay hơi tiêu thụ 1,5-3,0 L/kWh tùy thuộc vào khí hậu và hiệu quả.
Lợi thế năng lượng: Làm mát bay hơi giảm công việc của máy nén, cải thiện PUE 15-30% so với làm mát cơ học trong các khí hậu phù hợp.
Hạn chế: Tiêu thụ nước cao, yêu cầu xử lý nước bổ sung, và rủi ro legionella từ tháp làm mát.
Các giải pháp thay thế làm mát bằng không khí
Các cơ sở làm mát bằng không khí loại bỏ tiêu thụ nước nhưng hy sinh hiệu quả năng lượng:
Làm mát cơ học: Các hệ thống dựa trên máy nén thải nhiệt mà không cần bay hơi nước. Tiêu thụ năng lượng cao hơn (PUE 1,4+) nhưng không sử dụng nước.
Làm mát tự do: Sử dụng không khí môi trường trực tiếp khi nhiệt độ ngoài trời cho phép. Hiệu quả trong khí hậu mát nhưng khả năng áp dụng hạn chế cho cơ sở hạ tầng AI trong các cấu hình mật độ cao.
Tốt nhất cho: Các khu vực thiếu nước nơi bảo tồn nước quan trọng hơn các cân nhắc về hiệu quả năng lượng.
Làm mát bằng chất lỏng trực tiếp đến chip
Làm mát bằng chất lỏng đại diện cho công nghệ đột phá cho phép cả hiệu quả nước và năng lượng:
Cách hoạt động: Các tấm làm mát được gắn trực tiếp lên CPU, GPU, module bộ nhớ và bộ điều chỉnh điện áp. Các hệ thống vòng kín tuần hoàn chất làm mát qua các tấm này, loại bỏ nhiệt tại nguồn trước khi nó tản vào không khí.¹³
Tiêu thụ nước: Các thiết kế vòng kín không sử dụng nước trong hoạt động bình thường. Hệ thống được nạp một lần khi xây dựng và tuần hoàn liên tục.
Hiệu quả năng lượng: Làm mát bằng chất lỏng đạt PUE dưới 1,2 trong khi loại bỏ hoàn toàn tiêu thụ nước.¹⁴
Triển khai của NVIDIA: Hệ thống làm mát bằng chất lỏng quy mô rack GB200 NVL72 mang lại hiệu quả nước tốt hơn 300 lần so với các kiến trúc làm mát bằng không khí truyền thống.¹⁵
Làm mát hai pha
Làm mát bằng chất lỏng tiên tiến sử dụng thay đổi pha để đạt hiệu quả tối đa:
Cách hoạt động: Chất lỏng điện môi được pha chế đặc biệt (từ các nhà cung cấp như Honeywell và Chemours) sôi ở nhiệt độ thấp tới 18°C. Sự thay đổi pha hấp thụ năng lượng nhiệt đáng kể, cung cấp làm mát hiệu quả hơn các hệ thống chất lỏng một pha.¹⁶
Hoạt động không dùng nước: Công nghệ HyperCool của ZutaCore loại bỏ nhiệt trực tiếp tại nguồn, loại bỏ việc sử dụng nước và cắt giảm tiêu thụ năng lượng lên đến 82%.¹⁷
Lợi thế an toàn: Chất lỏng điện môi không làm hỏng thiết bị điện tử nếu rò rỉ, không giống như chất làm mát gốc nước.
Làm mát ngâm chìm
Ngâm chìm hoàn toàn cung cấp giải pháp mật độ nhiệt tối ưu:
Ngâm chìm một pha: Máy chủ được ngâm trong chất lỏng điện môi hấp thụ nhiệt thông qua đối lưu. Không cần nước.
Ngâm chìm hai pha: Máy chủ được ngâm trong chất lỏng có điểm sôi thấp sôi tích cực liền kề với các thành phần sinh nhiệt, cung cấp làm mát cực kỳ hiệu quả.
Áp dụng: Microsoft, Google và Meta đều đã triển khai làm mát ngâm chìm cho cơ sở hạ tầng huấn luyện AI mật độ cao nhất.
Chiến lược nước của các Hyperscaler
Con đường nước dương của Microsoft
Microsoft cam kết trở thành nước dương vào năm 2030—bổ sung nhiều nước hơn lượng tiêu thụ trên toàn bộ hoạt động toàn cầu:¹⁸
Triển khai làm mát không dùng nước: Làm mát bằng chất lỏng cấp chip vòng kín loại bỏ hoàn toàn nước bay hơi. Hiện đang thử nghiệm tại Phoenix, Arizona và Mt. Pleasant, Wisconsin, với hoạt động dự kiến vào năm 2026. Đến cuối năm 2027, không bay hơi nước trở thành tiêu chuẩn cho các trung tâm dữ liệu mới.
Tác động cơ sở: Mỗi cơ sở không dùng nước giảm tiêu thụ hàng năm hơn 125 triệu lít so với các thiết kế bay hơi.
Dự án bổ sung: Các dự án phục hồi nước ở các cộng đồng thiếu nước bù đắp tiêu thụ của cơ sở hiện có.
Hiệu suất năm 2023: Tiêu thụ 7.844 megalít, mặc dù 41% ở các khu vực thiếu nước cho thấy thách thức của cơ sở hạ tầng hiện có.
Cam kết bổ sung của Google
Google cam kết bổ sung 120% lượng nước tiêu thụ vào năm 2030:¹⁹
Hiệu quả vận hành: Cải thiện hiệu quả làm mát trên các cơ sở hiện có để giảm mức tiêu thụ cơ bản.
Quan hệ đối tác lưu vực: Hợp tác với cộng đồng và tổ chức để bổ sung lượng nước sử dụng và cải thiện sức khỏe lưu vực.
Đầu tư công nghệ: Hỗ trợ an ninh nước thông qua công nghệ và đổi mới ngoài hoạt động trực tiếp.
Tiêu thụ năm 2023: 24.227 megalít—cao nhất trong số các hyperscaler lớn, phản ánh quy mô trung tâm dữ liệu của Google.
Tập trung hiệu quả của Meta
Meta cam kết nước dương vào năm 2030 với trọng tâm vào hiệu quả vận hành:²⁰
Thực hành xây dựng: Sử dụng nước tái chế cho xây dựng và triển khai các thực hành tốt nhất để giảm nhu cầu nước xây dựng.
Tái chế cơ sở: Tái chế nước trong các cơ sở nhiều lần trước khi xả.
Hiệu quả vận hành: Các trung tâm dữ liệu chiếm phần lớn lượng nước sử dụng của Meta, khiến cải thiện vận hành trở thành đòn bẩy chính.
Mức cơ bản thấp hơn: 2.938 megalít vào năm 2023—ít hơn đáng kể so với Google hoặc Microsoft, phản ánh quy mô cơ sở hạ tầng khác nhau.
Sự tham gia muộn của AWS
AWS cam kết nước dương vào năm 2030 tại re:Invent 2024:²¹
Áp dụng trực tiếp đến chip: AWS triển khai các tấm làm mát trực tiếp trên chip với tuần hoàn vòng kín, loại bỏ sự gia tăng tiêu thụ nước từ cơ sở hạ tầng AI mới.
Chất lỏng kỹ thuật: Sử dụng chất lỏng làm mát được pha chế đặc biệt thay vì nước, tránh hoàn toàn tổn thất bay hơi.
Bổ sung cộng đồng: Trả lại nhiều nước cho cộng đồng hơn lượng tiêu thụ của hoạt động trực tiếp.
Thực hành vận hành tốt nhất
Đo lường và giám sát
Quản lý nước hiệu quả đòi hỏi đo lường toàn diện:
Cơ sở hạ tầng đo lường: Lắp đặt đồng hồ phụ cho tháp làm mát, hệ thống tạo độ ẩm và bất kỳ thiết bị tiêu thụ nước nào khác. Tổng hợp hàng tháng hoặc hàng năm cung cấp WUE đại diện hơn so với ảnh chụp hàng ngày.²²
Giám sát thời gian thực: Theo dõi tiêu thụ nước cùng với nhiệt độ, độ ẩm và tải IT để xác định cơ hội tối ưu hóa.
Thiết lập mức cơ bản: Ghi lại WUE hiện tại trước khi triển khai cải tiến để đo lường tác động chính xác.
Tối ưu hóa nhiệt độ và độ ẩm
Điều chỉnh các thông số môi trường giảm tiêu thụ nước:
Nâng điểm đặt nhiệt độ: Một
[Nội dung bị cắt ngắn cho bản dịch]