Pendinginan cair untuk AI: dari solusi khusus menjadi infrastruktur esensial
Diperbarui 11 Desember 2025
Pembaruan Desember 2025: Pasar pendinginan cair melonjak dari $2,8 miliar (2025) menjadi lebih dari $21 miliar pada 2032 (CAGR 30%+). Rak NVIDIA saat ini membutuhkan 132kW; generasi berikutnya membutuhkan 240kW. GB200 NVL72 memungkinkan penghematan biaya 25x lipat (>$4 juta per tahun untuk fasilitas 50MW). Direct-to-chip kini mampu menangani hingga 1.600W per komponen. Accelsius NeuCool mendinginkan 4.500W per soket GPU dengan air fasilitas hangat 40°C.
Pasar pendinginan cair global akan melonjak dari $2,8 miliar pada 2025 menjadi lebih dari $21 miliar pada 2032, dengan pertumbuhan tahunan gabungan melebihi 30%.¹ Di pertengahan 2025, peralihan dari pendinginan udara ke pendinginan cair bergerak dari eksperimental menjadi operasional.² Saat terisi penuh, server GPU berbasis NVIDIA terbaru membutuhkan 132 kilowatt per rak. Generasi berikutnya, yang diharapkan dalam setahun, akan membutuhkan 240 kilowatt.³ Pendinginan udara tradisional tidak mampu menghilangkan panas pada kepadatan ini. Pendinginan cair bertransformasi dari kemewahan hyperscaler menjadi kebutuhan bagi setiap organisasi yang menggunakan infrastruktur AI generasi terkini.
Ekonomi memperkuat pergeseran ini. Pusat data menghabiskan estimasi $1,9 hingga $2,8 juta per megawatt setiap tahun untuk pendinginan.⁴ Penggunaan sistem GB200 NVL72 berpendingin cair memungkinkan pusat data hyperscale mencapai penghematan biaya hingga 25x lipat, yang berarti penghematan lebih dari $4 juta per tahun untuk fasilitas 50 megawatt.⁵ Organisasi yang menolak transisi ini akan mendapati diri mereka tidak mampu menggunakan generasi GPU yang menentukan kemampuan AI.
Fisika yang mendorong transisi
Server yang dioptimalkan untuk AI dan klaster padat GPU mendorong kepadatan daya melampaui 50 kilowatt per rak, mencapai level di mana pendinginan udara tradisional tidak dapat memastikan pembuangan panas yang stabil atau efisien.⁶ Menurut Uptime Institute, kepadatan daya rak pusat data rata-rata meningkat 38% dari 2022 hingga 2024, dengan pertumbuhan paling tajam pada deployment AI dan hyperscale.⁷ Kepadatan daya yang dulunya maksimal 15 kilowatt kini mencapai 80 hingga 120 kilowatt di klaster AI.⁸
Keunggulan fundamental pendinginan cair terletak pada termodinamika. Dengan kepadatan hampir 1.000 kali lipat dari udara, cairan unggul dalam membawa panas berkat kapasitansi panas dan konduktivitas termal yang superior.⁹ Dengan memindahkan panas secara efisien dari GPU berperforma tinggi, pendinginan cair mengurangi ketergantungan pada kipas pendingin yang boros energi. Hasilnya: pengurangan rata-rata 11% dalam konsumsi energi server sekaligus menghilangkan 80% kebutuhan ruang infrastruktur pendinginan tradisional.¹⁰
Sistem pendinginan udara kesulitan menangani kepadatan daya di atas 10 hingga 15 kilowatt per rak.¹¹ Banyak beban kerja AI membutuhkan rak yang berjalan pada 30 hingga 60 kilowatt atau lebih.¹² Kesenjangan antara apa yang dapat diberikan pendinginan udara dan apa yang dibutuhkan infrastruktur AI terus melebar dengan setiap generasi GPU.
Pendinginan direct-to-chip mendominasi produksi
Pendinginan direct-to-chip dengan cepat menjadi bentuk pendinginan cair paling umum yang diterapkan di lingkungan produksi.¹³ Cold plate dipasang langsung pada CPU, GPU, modul memori, dan regulator tegangan. Sistem loop tertutup mensirkulasikan pendingin melalui plate ini, menghilangkan panas di sumbernya.¹⁴
Sistem GB200 NVL72 dan GB300 NVL72 NVIDIA menggunakan pendinginan cair direct-to-chip sebagai konfigurasi standar.¹⁵ Berbeda dengan pendinginan evaporatif atau imersi, pendinginan cair NVL72 beroperasi sebagai sistem loop tertutup di mana pendingin tidak menguap atau memerlukan penggantian, menghemat air.¹⁶ Arsitektur ini memberikan potensi pendapatan 40x lebih tinggi, throughput 30x lebih tinggi, efisiensi energi 25x lebih baik, dan efisiensi air 300x lebih baik dibandingkan sistem berpendingin udara tradisional.¹⁷
Solusi direct-to-chip kini menangani hingga 1.600 watt per komponen, memungkinkan kepadatan server 58% lebih tinggi dibandingkan pendinginan udara sekaligus mengurangi konsumsi energi infrastruktur sebesar 40%.¹⁸ Sistem DLC-2 Supermicro yang mendukung NVIDIA HGX B200 menangkap hingga 98% panas sistem dengan mendinginkan CPU, GPU, DIMM, switch PCIe, regulator tegangan, dan catu daya dengan cairan, memungkinkan operasi pusat data yang senyap dengan tingkat kebisingan serendah 50 desibel.¹⁹
Accelsius mencapai dua tonggak termal dengan teknologi NeuCool-nya: berhasil mendinginkan 4.500 watt per soket GPU dan mempertahankan suhu GPU yang aman di rak AI 250 kilowatt yang terisi penuh menggunakan air fasilitas hangat 40°C.²⁰ Kemampuan menggunakan air hangat daripada air dingin mengurangi kebutuhan infrastruktur pendinginan dan biaya operasional.
Pendinginan imersi berkembang untuk kepadatan ekstrem
Pendinginan imersi merendam server dalam cairan dielektrik, mencapai lebih dari 100 kilowatt per rak dan, dalam beberapa desain, mencapai 250 kilowatt.²¹ Sistem seperti ICEraQ dari GRC mencapai kapasitas pendinginan hingga 368 kilowatt per sistem sambil mempertahankan efektivitas penggunaan daya di bawah 1,03.²² Pendekatan ini menghilangkan kipas sepenuhnya dan memungkinkan operator mengemas 10 hingga 15 kali lebih banyak komputasi dalam footprint yang sama.²³
Pasar pendinginan imersi pusat data mencapai $4,87 miliar pada 2025 dan akan tumbuh menjadi $11,10 miliar pada 2030 dengan tingkat pertumbuhan tahunan gabungan 17,91%.²⁴ Sistem fase tunggal mempertahankan pangsa pasar terbesar karena familiaritas instalasi, namun desain dua fase memenangkan pilot di mana kepadatan ekstrem dan arsitektur tanpa pompa terbukti esensial.²⁵
Dibandingkan dengan pendinginan udara tradisional, pendinginan imersi fase tunggal mengurangi kebutuhan listrik hingga hampir setengahnya, berkontribusi pada pengurangan emisi CO2 hingga 30%, dan mendukung konsumsi air hingga 99% lebih sedikit.²⁶ Peningkatan efisiensi ini langsung diterjemahkan menjadi waktu-ke-pendapatan yang lebih cepat untuk layanan AI. Kemampuan mendorong utilisasi lebih tinggi dari setiap meter persegi tetap menjadi pengungkit ekonomi terkuat yang memotivasi adopsi hyperscale.²⁷
Pada Mei 2025, Intel bermitra dengan Shell Global Solutions untuk meluncurkan solusi pendinginan imersi bersertifikasi Intel pertama untuk prosesor Xeon generasi ke-4 dan ke-5, memungkinkan manajemen termal berperforma tinggi pada skala produksi.²⁸ Kemitraan ini menandakan bahwa pendinginan imersi telah mencapai level sertifikasi dan dukungan yang dibutuhkan deployment enterprise.
Deployment hyperscaler menetapkan standar
Klaster Azure AI Microsoft, deployment TPU Google, dan node pelatihan model LLaMA Meta semuanya beralih ke pendinginan cair.²⁹ Superkomputer AI canggih Microsoft, yang diluncurkan pada 2025, menampilkan rak berpendingin cair secara eksklusif yang mendukung beban kerja pelatihan GPT-Next.³⁰ Komitmen hyperscaler memvalidasi pendinginan cair sebagai infrastruktur siap produksi daripada teknologi eksperimental.
HPE mengirimkan solusi keluarga NVIDIA Blackwell pertamanya, GB200 NVL72, pada Februari 2025.³¹ HPE membangun tujuh dari sepuluh superkomputer tercepat di dunia, membangun keahlian mendalam dalam pendinginan cair langsung.³² Arsitektur referensi perusahaan menyediakan cetak biru untuk deployment enterprise.
Arsitektur referensi Vertiv untuk server NVIDIA GB200 NVL72 mengurangi konsumsi energi tahunan sebesar 25%, memangkas kebutuhan ruang rak sebesar 75%, dan memperkecil footprint daya sebesar 30%.³³ Infrastruktur pendinginan cair Schneider Electric mendukung hingga 132 kilowatt per rak untuk pusat data AI GB200 NVL72.³⁴ Ekosistem vendor kini menawarkan solusi siap pakai daripada memerlukan rekayasa khusus.
Meta mengembangkan Air-Assisted Liquid Cooling bersama Microsoft sebagai solusi hibrida yang dapat di-retrofit.³⁵ Pendekatan ini memungkinkan Meta mulai mengintegrasikan pendinginan cair tanpa merombak seluruh infrastruktur berpendingin udaranya, menunjukkan jalur transisi pragmatis bagi organisasi dengan fasilitas yang sudah ada.
Tantangan retrofit tetap ada
Meng-retrofit pusat data yang beroperasi untuk mengakomodasi prosesor yang lebih bertenaga menghadirkan tantangan teknis dan logistik yang signifikan.³⁶ Beberapa operator menyimpulkan bahwa membangun fasilitas baru terbukti lebih mudah daripada meningkatkan yang sudah ada.³⁷ Keputusan ini bergantung pada usia fasilitas, sisa masa pakai, dan skala deployment AI yang direncanakan.
Pendinginan cair memerlukan infrastruktur khusus termasuk unit distribusi cairan, cold plate, tangki imersi, dan pompa pendingin.³⁸ Retrofit melibatkan modifikasi rak server, penambahan sistem pencegahan kebocoran, dan memastikan kepatuhan regulasi.³⁹ Situs brownfield menghadapi keterbatasan arsitektur dan infrastruktur yang dihindari proyek greenfield.
Tingkat adopsi yang lebih rendah untuk solusi intensif infrastruktur seperti pendinginan imersi, sebesar 20,4% di antara situs brownfield, mencerminkan kendala praktis.⁴⁰ Kendala ini termasuk retrofit ekstensif untuk mengakomodasi tangki, ruang lantai terbatas, dan tantangan integrasi dengan infrastruktur daya dan pendinginan yang ada.⁴¹ Situs brownfield tampaknya lebih cenderung mengadopsi solusi inkremental seperti pendinginan liquid-to-air yang menghindari perombakan infrastruktur total.⁴²
Schneider Electric bermitra dengan NVIDIA pada tiga desain referensi retrofit untuk operator pusat data yang mencari peningkatan performa tanpa mendesain ulang fasilitas dari awal.⁴³ Desain ini mengakui bahwa sebagian besar organisasi tidak dapat membangun pusat data AI greenfield dan harus bekerja dalam kendala yang ada.
Kompleksitas operasional meningkat
Karena sistem cair hanya mendinginkan chip, pendinginan udara tambahan masih menangani 20% hingga 30% dari total beban termal.⁴⁴ Arsitektur pendinginan hibrida memerlukan keahlian yang tidak dimiliki banyak organisasi secara internal.⁴⁵ Pergeseran operasional terbukti sama signifikannya dengan peningkatan mekanis itu sendiri.
Pendinginan cair memperkenalkan persyaratan operasional baru: deteksi kebocoran, redundansi hidrolik, kontrol kualitas pendingin, dan peningkatan keterampilan teknisi.⁴⁶ Tim operasi pusat data tradisional mungkin tidak memiliki pengalaman dengan perpipaan, pompa, dan heat exchanger pada skala yang dibutuhkan infrastruktur AI. Kesenjangan keterampilan memengaruhi timeline deployment dan operasi berkelanjutan.
ZutaCore mengembangkan sistem pendinginan cair direct-to-chip yang mendukung superchip GB200, yang menggabungkan prosesor NVIDIA Grace ARM dengan GPU Blackwell.⁴⁷ Solusi pihak ketiga memperluas opsi tetapi juga mempersulit manajemen vendor dan pengaturan dukungan.
Masalah rantai pasokan dapat mempersulit rencana pendinginan hibrida, yang berpotensi diperburuk oleh perubahan kebijakan perdagangan.⁴⁸ Peningkatan pesat dalam daya komputasi berarti pusat data yang berada di garis depan hari ini dapat dengan cepat tertinggal.⁴⁹ Mendesain fasilitas dengan kapasitas untuk kepadatan daya masa depan terbukti menantang ketika targetnya terus bergerak.
Pola adopsi regional
Amerika Utara memimpin adopsi pasar melalui peluncuran skala produksi oleh penyedia cloud hyperscale.⁵⁰ Pasar AS akan tumbuh dari $1,09 miliar pada 2024 menjadi $6,39 miliar pada 2034.⁵¹ Investasi hyperscaler dari AWS, Google, dan Microsoft mendorong adopsi saat perusahaan mengikuti jejak mereka.
Asia-Pasifik menunjukkan pertumbuhan paling tajam karena Jepang, Tiongkok, dan Korea Selatan memperjuangkan klaster AI berpendingin cair.⁵² Pendinginan udara konvensional terbukti tidak hemat biaya di iklim panas dan lembap.⁵³ Pendinginan imersi menawarkan solusi berkelanjutan dan hemat ruang yang sangat cocok untuk kondisi regional. Asia-Pasifik memimpin pasar pendinginan imersi global sepanjang periode perkiraan.⁵⁴
Distribusi geografis mencerminkan pertimbangan iklim dan konsentrasi investasi infrastruktur AI. Wilayah dengan program pengembangan AI yang agresif mendorong inovasi pendinginan karena kebutuhan.
Pertimbangan perencanaan strategis
Organisasi yang merencanakan infrastruktur AI harus memasukkan pendinginan cair ke dalam keputusan fasilitas dan anggaran. Pilihan antara pendinginan direct-to-chip dan imersi bergantung pada skala deployment, kendala retrofit, dan kemampuan operasional.
Untuk deployment baru, pendinginan cair harus menjadi spesifikasi default untuk setiap rak yang melebihi 30 kilowatt. Perencanaan untuk kepadatan 100 kilowatt-plus mengantisipasi roadmap GPU hingga 2027. Fasilitas yang dirancang hari ini tanpa infrastruktur pendinginan cair akan menghadapi retrofit mahal atau penggantian dalam beberapa tahun.
Untuk fasilitas yang sudah ada, evaluasi kelayakan retrofit dengan jujur. Desain referensi Schneider Electric menyediakan titik awal, tetapi pekerjaan rekayasa yang signifikan masih diperlukan. Pendekatan hibrida yang melapisi pendinginan cair di atas infrastruktur berpendingin udara menawarkan jalur maju yang inkremental.
[Konten terpotong untuk terjemahan]