Harga GPU Cloud Runtuh: Sewa H100 Turun 64% Seiring Pasokan Menyusul Permintaan
10 Desember 2025 Ditulis Oleh Blake Crosley
Pasar sewa GPU telah mengalami koreksi dramatis, dengan harga H100 turun dari $8 per jam menjadi $2.85-3.50 per jam—penurunan 64% dari puncak level di akhir 2024.1 Silicon Data H100 Rental Index berada di $2.36 pada Juni 2025, turun dari $3.06 pada September 2024, menandai penurunan 23% dalam kurang dari satu tahun.2 Bagi organisasi yang merencanakan infrastruktur AI, runtuhnya harga menciptakan peluang strategis sekaligus menimbulkan pertanyaan tentang dinamika pasar dan tren harga masa depan.
AWS memangkas harga H100 sekitar 44% pada Juni 2025, membawa instance P5 sejalan dengan ekspektasi pasar.3 GCP spot H100 kini berjalan di $2.25 (A3-High), sementara AWS spot sering berada dekat $2.50.4 Komitmen jangka panjang dapat membawa biaya efektif H100 serendah $1.90-$2.10 per jam GPU.5 Beberapa penyedia agresif menawarkan sewa H100 serendah $0.99-$1 per jam.6
Faktor penyebab penurunan harga
Beberapa faktor konvergen menghasilkan koreksi pasar.
Ekspansi pasokan
Kelangkaan pasokan H100 yang mendefinisikan 2023 dan awal 2024 telah mereda substansial. Hyperscaler dan pusat data regional telah membawa kapasitas baru yang signifikan online.7 Apa yang merupakan pasar penjual telah mulai menormalkan seiring produksi mengejar pesanan yang ditempatkan selama periode kelangkaan.
Mitra manufaktur NVIDIA memperluas kapasitas produksi sepanjang 2024 dan 2025. Investasi kapasitas yang dibuat selama kondisi kelangkaan kini mengirimkan GPU ke pasar dengan penawaran dan permintaan yang lebih seimbang. Transisi dari kelangkaan ke ketersediaan secara fundamental mengubah dinamika harga.
Intensitas kompetisi
Lebih dari 300 penyedia baru memasuki pasar cloud H100 pada 2025, mengarah pada kompetisi harga yang agresif.8 Vendor kecil yang terspesialisasi seperti RunPod dan Vast.ai menawarkan tarif serendah $1.80-$1.87 per jam.9 Kompetisi memaksa penyedia yang lebih besar untuk menyesuaikan harga atau kehilangan pelanggan.
Barier masuk yang rendah untuk layanan cloud GPU memungkinkan masuk pasar yang cepat. Organisasi dengan akses pusat data dan modal dapat membeli atau menyewa GPU dan menawarkan layanan cloud. Struktur pasar yang terfragmentasi mengintensifkan kompetisi harga dibandingkan layanan cloud tradisional dengan barrier yang lebih tinggi.
Evolusi permintaan
Startup AI telah mengalihkan fokus dari pelatihan model dasar besar ke fine-tuning model open-source yang ada, mengurangi intensitas permintaan untuk cluster GPU terbesar.10 Beban kerja inferensi, meskipun tumbuh pesat, memiliki karakteristik berbeda dari pelatihan—lebih terdistribusi, kebutuhan per-instance lebih rendah, dan lebih sensitif harga.
Ketersediaan model open-source yang mampu seperti Llama, Mistral, dan DeepSeek mengurangi kebutuhan untuk pelatihan mahal dari awal. Organisasi dapat mencapai kemampuan AI yang kompetitif melalui fine-tuning daripada pelatihan model dasar. Pergeseran mengubah komposisi permintaan GPU.
Implikasi pasar
Runtuhnya harga mempengaruhi peserta pasar yang berbeda dengan cara yang berbeda pula.
Investor infrastruktur
Organisasi yang membeli GPU pada harga puncak menghadapi ekonomi yang menantang. Analisis menunjukkan bahwa setelah harga sewa H100 turun di bawah $1.65 per jam, pendapatan tidak lagi menutup investasi.11 Harga perlu melebihi $2.85 per jam untuk mengalahkan tingkat pengembalian internal yang disediakan alternatif pasar saham.12
Ambang batas profitabilitas menciptakan tekanan dasar pada harga. Penyedia yang tidak dapat mempertahankan operasi pada harga saat ini akan keluar, akhirnya menstabilkan pasokan. Konsolidasi mungkin memakan waktu kuartal untuk diselesaikan saat operator dengan struktur biaya berbeda bersaing.
Pelanggan cloud
Organisasi yang menyewa kapasitas GPU mendapat manfaat langsung dari penurunan harga. Proyek yang sebelumnya tidak ekonomis pada $8 per jam menjadi layak pada $2.50 per jam. Aksesibilitas memungkinkan eksperimen dan deployment AI yang lebih luas.
Namun, volatilitas harga mempersulit perencanaan. Organisasi yang berkomitmen pada kapasitas GPU jangka panjang menghadapi ketidakpastian tentang apakah harga saat ini mewakili nilai wajar atau oversupply sementara. Komitmen jangka pendek memberikan fleksibilitas tetapi mungkin melewatkan harga menguntungkan jika pasokan mengencang.
Posisi hyperscaler
CEO IBM Arvind Krishna secara publik mempertanyakan apakah investasi infrastruktur AI hyperscaler akan menghasilkan pengembalian, menyatakan "tidak mungkin" matematika bekerja pada tingkat pengeluaran saat ini.13 Runtuhnya harga GPU memberikan bukti pendukung bagi skeptis sambil menguntungkan konsumen GPU.
CEO Amazon Andy Jassy menyanggah bahwa kapasitas dikonsumsi "secepat kami memasangnya," menunjukkan permintaan yang berkelanjutan meskipun penurunan harga.14 Pertumbuhan volume mungkin mengkompensasi penurunan harga, tetapi margin menghadapi tekanan di seluruh industri.
Outlook generasi selanjutnya
Trajektori harga H100 menginformasikan ekspektasi untuk generasi GPU yang lebih baru.
Pengenalan Blackwell
GPU NVIDIA Blackwell telah mulai dikirim, dengan sistem GB200 mencapai pelanggan. Arsitektur generasi selanjutnya menawarkan peningkatan kinerja signifikan dibandingkan H100. Ketersediaan awal Blackwell tetap terbatas, dengan harga premium mencerminkan kelangkaan.
Harga H100 mungkin turun lebih lanjut seiring ketersediaan Blackwell meningkat. Organisasi yang puas dengan kinerja H100 dapat mengambil manfaat dari erosi harga yang berkelanjutan. Mereka yang memerlukan kemampuan Blackwell akan membayar premium sampai pasokan menormalkan.
Perkiraan jangka menengah
Perkiraan jangka menengah menunjukkan potensi penurunan 10-20% ketika GPU B200 diluncurkan lebih luas pada 2026.15 Siklus pengenalan mungkin mengulangi pola H100: kelangkaan awal dengan harga premium diikuti oleh ekspansi pasokan dan normalisasi harga.
Organisasi harus mempertimbangkan timing generasi GPU saat merencanakan investasi infrastruktur. Menunggu generasi yang lebih baru memberikan manfaat kinerja tetapi menunda deployment. Hardware generasi saat ini dengan harga yang menurun memungkinkan deployment segera.
Perbandingan harga saat ini
| Penyedia | H100 On-Demand | H100 Spot | Tarif Komitmen |
|---|---|---|---|
| AWS P5 | $3.50/jam | ~$2.50/jam | $1.90-2.10/jam (1 thn) |
| GCP A3-High | $3.25/jam | $2.25/jam | ~$2.00/jam (1 thn) |
| Azure ND H100 | $3.40/jam | ~$2.60/jam | ~$2.15/jam (1 thn) |
| RunPod | $2.39/jam | $1.87/jam | N/A |
| Vast.ai | Bervariasi | $1.80-2.50/jam | N/A |
| Lambda | $2.49/jam | N/A | $1.99/jam (reserved) |
Harga per Desember 2025. Harga spot berfluktuasi berdasarkan ketersediaan.
Framework keputusan: sewa vs beli vs tunggu
| Skenario | Rekomendasi | Alasan |
|---|---|---|
| Beban kerja variabel (<50% utilisasi) | Sewa (spot) | Fleksibilitas mengungguli penghematan kepemilikan |
| Beban kerja stabil (>70% utilisasi) | Evaluasi kepemilikan | Break-even dapat dicapai pada harga saat ini |
| >$100K/bulan pengeluaran GPU | Miliki infrastruktur | ROI jelas pada utilisasi berkelanjutan |
| Outlook 12 bulan tidak pasti | Sewa jangka pendek | Hindari aset terdampar jika permintaan bergeser |
| Melatih model besar | Beli atau reserved | Kapasitas konsisten kritis |
Analisis break-even: - Harga beli H100: ~$25,000-30,000 per GPU - Pada sewa $2.50/jam: 10,000-12,000 jam untuk break-even (~14-16 bulan pada utilisasi 100%) - Pada sewa $1.65/jam: penyedia tidak dapat menutup investasi11 - Ambang batas profitabilitas: $2.85/jam untuk mengalahkan IRR pasar saham12
Langkah actionable: 1. Audit pengeluaran saat ini: Hitung biaya efektif per jam di seluruh penggunaan GPU 2. Nilai utilisasi: Ukur penggunaan kapasitas aktual vs reserved 3. Evaluasi opsi komitmen: Bandingkan harga reserved 1 tahun vs on-demand 4. Pertimbangkan hybrid: Miliki untuk baseline, sewa untuk kapasitas burst
Panduan profesional
Keputusan infrastruktur di pasar volatil mendapat manfaat dari perspektif berpengalaman.
550 insinyur lapangan Introl mendukung organisasi dalam menavigasi ekonomi infrastruktur GPU.16 Perusahaan ini menduduki peringkat #14 pada Inc. 5000 2025 dengan pertumbuhan tiga tahun 9,594%.17
Keahlian di 257 lokasi global memberikan wawasan pasar terlepas dari geografi.18 Panduan profesional membantu organisasi membuat keputusan berdasarkan informasi saat harga berkembang.
Poin utama
Untuk tim pengadaan: - Harga H100 turun 64% dari $8/jam menjadi $2.85-3.50/jam - 300+ penyedia baru mengintensifkan kompetisi - Harga spot (GCP $2.25, AWS $2.50) menawarkan nilai terbaik untuk beban kerja fleksibel
Untuk perencana infrastruktur: - Break-even untuk kepemilikan: 14-16 bulan pada utilisasi 100% - Lantai profitabilitas penyedia: ~$1.65/jam (harga tidak mungkin turun jauh lebih rendah) - Harga komitmen ($1.90-2.10/jam) mengalahkan on-demand lebih dari 40%
Untuk perencanaan strategis: - Pasar menormalkan setelah kelangkaan 2023-2024—bukan penurunan sementara - Pengenalan Blackwell mungkin mendorong harga H100 lebih rendah pada 2026 - Fleksibilitas sewa berharga saat teknologi berkembang pesat
Outlook
Runtuhnya harga cloud GPU mewakili normalisasi pasar setelah kondisi kelangkaan 2023-2024. Organisasi mendapat manfaat dari aksesibilitas GPU yang secara dramatis membaik, memungkinkan deployment AI yang lebih luas. Lingkungan harga mungkin bertahan saat pertumbuhan pasokan terus memenuhi permintaan, dengan pengenalan generasi selanjutnya berpotensi memperpanjang pola.
Organisasi harus mengambil keuntungan dari harga saat ini untuk kebutuhan segera sambil mempertahankan fleksibilitas untuk evolusi pasar. Strategi paling sukses akan menyeimbangkan urgensi deployment terhadap pertimbangan timing pasar, menggunakan fleksibilitas sewa untuk menghindari komitmen modal prematur di pasar yang berkembang pesat.
Referensi
Urgensi: Tinggi — Pergeseran pasar dengan implikasi pengadaan segera Jumlah Kata: ~1,800
-
Thunder Compute. "AI GPU Rental Market Trends December 2025." December 2025. https://www.thundercompute.com/blog/ai-gpu-rental-market-trends ↩
-
Silicon Data. "H100 Rental Market Cools in September." September 2025. https://www.silicondata.com/blog/h100-rental-market-update-september-2025 ↩
-
Thunder Compute. "AI GPU Rental Market Trends December 2025." December 2025. ↩
-
IntuitionLabs. "H100 Rental Prices: A Cloud Cost Comparison." November 2025. https://intuitionlabs.ai/articles/h100-rental-prices-cloud-comparison ↩
-
IntuitionLabs. "H100 Rental Prices: A Cloud Cost Comparison." November 2025. ↩
-
Thunder Compute. "AI GPU Rental Market Trends December 2025." December 2025. ↩
-
Silicon Data. "H100 Rental Market Cools in September." September 2025. ↩
-
Thunder Compute. "AI GPU Rental Market Trends December 2025." December 2025. ↩
-
IntuitionLabs. "H100 Rental Prices: A Cloud Cost Comparison." November 2025. ↩
-
Thunder Compute. "AI GPU Rental Market Trends December 2025." December 2025. ↩
-
Cybernews. "AI boom paradox leads to GPU rental market crash." 2025. https://cybernews.com/tech/gpu-rental-prices-are-crashing/ ↩↩
-
Cybernews. "AI boom paradox leads to GPU rental market crash." 2025. ↩↩
-
Fortune. "IBM CEO warns there's 'no way' hyperscalers will turn a profit." December 2025. https://fortune.com/2025/12/03/ibm-ceo-no-way-hyperscalers-google-amazon-turn-profit-data-center-spending/ ↩
-
CIO Dive. "'We're not dabbling here': AWS backs infrastructure investments." December 2025. https://www.ciodive.com/news/aws-ai-cloud-infrastructure-capacity-microsoft-google/746998/ ↩
-
Thunder Compute. "AI GPU Rental Market Trends December 2025." December 2025. ↩
-
Introl. "Company Overview." Introl. 2025. https://introl.com ↩
-
Inc. "Inc. 5000 2025." Inc. Magazine. 2025. ↩
-
Introl. "Coverage Area." Introl. 2025. https://introl.com/coverage-area ↩