Harga GPU Cloud Anjlok: Sewa H100 Turun 64% Seiring Pasokan Mengejar Permintaan

Pasar penyewaan GPU kembali normal setelah kelangkaan 2023-2024, menciptakan peluang strategis untuk infrastruktur AI.

Harga GPU Cloud Anjlok: Sewa H100 Turun 64% Seiring Pasokan Mengejar Permintaan

Harga GPU Cloud Anjlok: Sewa H100 Turun 64% Seiring Pasokan Mengejar Permintaan

10 Des 2025 Ditulis Oleh Blake Crosley

Pasar penyewaan GPU mengalami koreksi dramatis, dengan harga H100 turun dari $8 per jam menjadi $2,85-3,50 per jam—penurunan 64% dari level puncak di akhir 2024.1 Indeks Penyewaan H100 dari Silicon Data berada di $2,36 pada Juni 2025, turun dari $3,06 pada September 2024, menandai penurunan 23% dalam waktu kurang dari setahun.2 Bagi organisasi yang merencanakan infrastruktur AI, anjloknya harga ini menciptakan peluang strategis sekaligus menimbulkan pertanyaan tentang dinamika pasar dan proyeksi harga di masa depan.

AWS memangkas harga H100 sekitar 44% pada Juni 2025, menyesuaikan instance P5 dengan ekspektasi pasar.3 Spot H100 dari GCP kini berjalan di $2,25 (A3-High), sementara spot AWS sering berada di sekitar $2,50.4 Komitmen jangka panjang dapat menurunkan biaya H100 efektif hingga serendah $1,90-$2,10 per GPU-jam.5 Beberapa penyedia agresif menawarkan sewa H100 semurah $0,99-$1 per jam.6

Faktor pendorong penurunan harga

Beberapa faktor bertemu menghasilkan koreksi pasar ini.

Ekspansi pasokan

Kelangkaan pasokan H100 yang mendefinisikan tahun 2023 dan awal 2024 telah mereda secara substansial. Hyperscaler dan pusat data regional telah menghadirkan kapasitas baru yang signifikan.7 Yang tadinya merupakan pasar penjual mulai dinormalisasi seiring produksi mengejar pesanan yang dilakukan selama periode kelangkaan.

Mitra manufaktur NVIDIA memperluas kapasitas produksi sepanjang 2024 dan 2025. Investasi kapasitas yang dilakukan selama kondisi kelangkaan kini menghasilkan GPU ke pasar dengan pasokan dan permintaan yang lebih seimbang. Transisi dari kelangkaan ke ketersediaan secara fundamental mengubah dinamika harga.

Intensitas persaingan

Lebih dari 300 penyedia baru memasuki pasar cloud H100 pada tahun 2025, memicu persaingan harga yang agresif.8 Vendor khusus yang lebih kecil seperti RunPod dan Vast.ai menawarkan tarif serendah $1,80-$1,87 per jam.9 Persaingan ini memaksa penyedia besar untuk menyesuaikan harga atau kehilangan pelanggan.

Rendahnya hambatan masuk untuk layanan cloud GPU memungkinkan masuknya pemain baru dengan cepat. Organisasi dengan akses pusat data dan modal dapat membeli atau menyewa GPU dan menawarkan layanan cloud. Struktur pasar yang terfragmentasi mengintensifkan persaingan harga dibandingkan layanan cloud tradisional dengan hambatan yang lebih tinggi.

Evolusi permintaan

Startup AI telah mengalihkan fokus dari melatih model dasar besar ke fine-tuning model open-source yang ada, mengurangi intensitas permintaan untuk cluster GPU terbesar.10 Beban kerja inference, meskipun tumbuh pesat, memiliki karakteristik berbeda dari pelatihan—lebih terdistribusi, kebutuhan per-instance lebih rendah, dan lebih sensitif terhadap harga.

Ketersediaan model open-source yang mumpuni seperti Llama, Mistral, dan DeepSeek mengurangi kebutuhan untuk pelatihan mahal dari awal. Organisasi dapat mencapai kemampuan AI yang kompetitif melalui fine-tuning alih-alih pelatihan model dasar. Pergeseran ini mengubah komposisi permintaan GPU.

Implikasi pasar

Anjloknya harga memengaruhi peserta pasar yang berbeda dengan cara yang berbeda pula.

Investor infrastruktur

Organisasi yang membeli GPU pada harga puncak menghadapi ekonomi yang menantang. Analisis menunjukkan bahwa begitu harga sewa H100 turun di bawah $1,65 per jam, pendapatan tidak lagi menutupi investasi.11 Harga perlu melebihi $2,85 per jam untuk mengalahkan internal rate of return yang disediakan oleh alternatif pasar saham.12

Ambang profitabilitas menciptakan tekanan lantai pada harga. Penyedia yang tidak mampu mempertahankan operasi pada harga saat ini akan keluar, yang pada akhirnya menstabilkan pasokan. Proses seleksi mungkin membutuhkan beberapa kuartal untuk selesai seiring operator dengan struktur biaya berbeda bersaing.

Pelanggan cloud

Organisasi yang menyewa kapasitas GPU mendapat manfaat langsung dari penurunan harga. Proyek yang sebelumnya tidak ekonomis pada $8 per jam menjadi layak pada $2,50 per jam. Aksesibilitas ini memungkinkan eksperimentasi dan deployment AI yang lebih luas.

Namun, volatilitas harga mempersulit perencanaan. Organisasi yang berkomitmen pada kapasitas GPU jangka panjang menghadapi ketidakpastian apakah harga saat ini merepresentasikan nilai wajar atau kelebihan pasokan sementara. Komitmen jangka pendek memberikan fleksibilitas tetapi mungkin melewatkan harga yang menguntungkan jika pasokan mengetat.

Posisi hyperscaler

CEO IBM Arvind Krishna secara publik mempertanyakan apakah investasi infrastruktur AI hyperscaler akan menghasilkan return, menyatakan "tidak mungkin" matematikanya berhasil pada tingkat pengeluaran saat ini.13 Anjloknya harga GPU memberikan bukti pendukung bagi skeptis sekaligus menguntungkan konsumen GPU.

CEO Amazon Andy Jassy membantah bahwa kapasitas dikonsumsi "secepat kami menyediakannya," menunjukkan permintaan yang berkelanjutan meskipun harga turun.14 Pertumbuhan volume mungkin mengkompensasi penurunan harga, tetapi margin menghadapi tekanan di seluruh industri.

Prospek generasi berikutnya

Trajektori harga H100 memberikan informasi ekspektasi untuk generasi GPU yang lebih baru.

Pengenalan Blackwell

GPU NVIDIA Blackwell telah mulai dikirim, dengan sistem GB200 mencapai pelanggan. Arsitektur generasi berikutnya menawarkan peningkatan performa signifikan dibanding H100. Ketersediaan awal Blackwell masih terbatas, dengan harga premium yang mencerminkan kelangkaan.

Harga H100 mungkin turun lebih lanjut seiring ketersediaan Blackwell meningkat. Organisasi yang puas dengan performa H100 dapat memanfaatkan erosi harga yang berlanjut. Mereka yang membutuhkan kemampuan Blackwell akan membayar premium hingga pasokan dinormalisasi.

Prakiraan jangka menengah

Prakiraan jangka menengah menunjukkan potensi penurunan 10-20% ketika GPU B200 diluncurkan lebih luas pada tahun 2026.15 Siklus pengenalan mungkin mengulang pola H100: kelangkaan awal dengan harga premium diikuti ekspansi pasokan dan normalisasi harga.

Organisasi harus mempertimbangkan waktu generasi GPU saat merencanakan investasi infrastruktur. Menunggu generasi lebih baru memberikan manfaat performa tetapi menunda deployment. Hardware generasi saat ini dengan harga yang menurun memungkinkan deployment segera.

Perbandingan harga saat ini

Penyedia H100 On-Demand H100 Spot Tarif Komitmen
AWS P5 $3,50/jam ~$2,50/jam $1,90-2,10/jam (1thn)
GCP A3-High $3,25/jam $2,25/jam ~$2,00/jam (1thn)
Azure ND H100 $3,40/jam ~$2,60/jam ~$2,15/jam (1thn)
RunPod $2,39/jam $1,87/jam N/A
Vast.ai Bervariasi $1,80-2,50/jam N/A
Lambda $2,49/jam N/A $1,99/jam (reserved)

Harga per Desember 2025. Harga spot berfluktuasi berdasarkan ketersediaan.

Kerangka keputusan: sewa vs miliki vs tunggu

Skenario Rekomendasi Alasan
Beban kerja variabel (<50% utilisasi) Sewa (spot) Fleksibilitas melebihi penghematan kepemilikan
Beban kerja stabil (>70% utilisasi) Evaluasi kepemilikan Break-even dapat dicapai pada harga saat ini
Pengeluaran GPU >$100K/bulan Miliki infrastruktur ROI jelas pada utilisasi berkelanjutan
Prospek 12 bulan tidak pasti Sewa jangka pendek Hindari aset terlantar jika permintaan bergeser
Melatih model besar Miliki atau reserved Kapasitas konsisten sangat penting

Analisis break-even: - Harga beli H100: ~$25.000-30.000 per GPU - Pada sewa $2,50/jam: 10.000-12.000 jam untuk break even (~14-16 bulan pada utilisasi 100%) - Pada sewa $1,65/jam: penyedia tidak dapat menutupi investasi11 - Ambang profitabilitas: $2,85/jam untuk mengalahkan IRR pasar saham12

Langkah-langkah yang dapat ditindaklanjuti: 1. Audit pengeluaran saat ini: Hitung biaya per jam efektif di seluruh penggunaan GPU 2. Nilai utilisasi: Ukur penggunaan kapasitas aktual vs reserved 3. Evaluasi opsi komitmen: Bandingkan harga reserved 1 tahun vs on-demand 4. Pertimbangkan hybrid: Miliki untuk baseline, sewa untuk kapasitas burst

Panduan profesional

Keputusan infrastruktur di pasar yang volatil mendapat manfaat dari perspektif berpengalaman.

Jaringan 550 field engineer Introl mendukung organisasi dalam menavigasi ekonomi infrastruktur GPU.16 Perusahaan ini menempati peringkat #14 di Inc. 5000 2025 dengan pertumbuhan tiga tahun 9.594%.17

Keahlian di 257 lokasi global memberikan wawasan pasar terlepas dari geografis.18 Panduan profesional membantu organisasi membuat keputusan yang tepat seiring berkembangnya harga.

Poin-poin utama

Untuk tim procurement: - Harga H100 turun 64% dari $8/jam menjadi $2,85-3,50/jam - 300+ penyedia baru mengintensifkan persaingan - Harga spot (GCP $2,25, AWS $2,50) menawarkan nilai terbaik untuk beban kerja fleksibel

Untuk perencana infrastruktur: - Break-even kepemilikan: 14-16 bulan pada utilisasi 100% - Lantai profitabilitas penyedia: ~$1,65/jam (harga tidak mungkin turun jauh lebih rendah) - Harga komitmen ($1,90-2,10/jam) mengalahkan on-demand sebesar 40%+

Untuk perencanaan strategis: - Pasar dinormalisasi setelah kelangkaan 2023-2024—bukan penurunan sementara - Pengenalan Blackwell mungkin mendorong harga H100 lebih rendah di 2026 - Fleksibilitas sewa berharga seiring teknologi berkembang pesat

Prospek

Anjloknya harga cloud GPU merepresentasikan normalisasi pasar setelah kondisi kelangkaan 2023-2024. Organisasi mendapat manfaat dari aksesibilitas GPU yang meningkat drastis, memungkinkan deployment AI yang lebih luas. Lingkungan harga mungkin bertahan seiring pertumbuhan pasokan terus memenuhi permintaan, dengan pengenalan generasi berikutnya berpotensi memperpanjang pola ini.

Organisasi harus memanfaatkan harga saat ini untuk kebutuhan mendesak sambil mempertahankan fleksibilitas untuk evolusi pasar. Strategi paling sukses akan menyeimbangkan urgensi deployment terhadap pertimbangan waktu pasar, menggunakan fleksibilitas sewa untuk menghindari komitmen modal prematur di pasar yang berkembang pesat.

Referensi


Urgensi: Tinggi — Pergeseran pasar dengan implikasi procurement langsung Jumlah Kata: ~1.800


  1. Thunder Compute. "AI GPU Rental Market Trends December 2025." Desember 2025. https://www.thundercompute.com/blog/ai-gpu-rental-market-trends 

  2. Silicon Data. "H100 Rental Market Cools in September." September 2025. https://www.silicondata.com/blog/h100-rental-market-update-september-2025 

  3. Thunder Compute. "AI GPU Rental Market Trends December 2025." Desember 2025. 

  4. IntuitionLabs. "H100 Rental Prices: A Cloud Cost Comparison." November 2025. https://intuitionlabs.ai/articles/h100-rental-prices-cloud-comparison 

  5. IntuitionLabs. "H100 Rental Prices: A Cloud Cost Comparison." November 2025. 

  6. Thunder Compute. "AI GPU Rental Market Trends December 2025." Desember 2025. 

  7. Silicon Data. "H100 Rental Market Cools in September." September 2025. 

  8. Thunder Compute. "AI GPU Rental Market Trends December 2025." Desember 2025. 

  9. IntuitionLabs. "H100 Rental Prices: A Cloud Cost Comparison." November 2025. 

  10. Thunder Compute. "AI GPU Rental Market Trends December 2025." Desember 2025. 

  11. Cybernews. "AI boom paradox leads to GPU rental market crash." 2025. https://cybernews.com/tech/gpu-rental-prices-are-crashing/ 

  12. Cybernews. "AI boom paradox leads to GPU rental market crash." 2025. 

  13. Fortune. "IBM CEO warns there's 'no way' hyperscalers will turn a profit." Desember 2025. https://fortune.com/2025/12/03/ibm-ceo-no-way-hyperscalers-google-amazon-turn-profit-data-center-spending/ 

  14. CIO Dive. "'We're not dabbling here': AWS backs infrastructure investments." Desember 2025. https://www.ciodive.com/news/aws-ai-cloud-infrastructure-capacity-microsoft-google/746998/ 

  15. Thunder Compute. "AI GPU Rental Market Trends December 2025." Desember 2025. 

  16. Introl. "Company Overview." Introl. 2025. https://introl.com 

  17. Inc. "Inc. 5000 2025." Inc. Magazine. 2025. 

  18. Introl. "Coverage Area." Introl. 2025. https://introl.com/coverage-area 

Minta Penawaran_

Ceritakan tentang proyek Anda dan kami akan merespons dalam 72 jam.

> TRANSMISSION_COMPLETE

Permintaan Diterima_

Terima kasih atas pertanyaan Anda. Tim kami akan meninjau permintaan Anda dan merespons dalam 72 jam.

QUEUED FOR PROCESSING