GPU 클라우드 가격 급락: H100 렌탈 가격이 공급이 수요를 따라잡으면서 64% 하락
2025년 12월 10일 작성자: Blake Crosley
GPU 렌탈 시장이 극적인 조정을 경험하며, H100 가격이 시간당 $8에서 $2.85-3.50로 하락했습니다—이는 2024년 말 최고점 대비 64% 감소입니다.1 Silicon Data H100 렌탈 지수는 2025년 6월 $2.36로, 2024년 9월 $3.06에서 하락하여 1년도 안 되는 기간 동안 23% 감소를 기록했습니다.2 AI 인프라를 계획하는 조직들에게 이러한 가격 급락은 시장 역학과 미래 가격 궤적에 대한 의문을 제기하면서 동시에 전략적 기회를 창출하고 있습니다.
AWS는 2025년 6월 H100 가격을 약 44% 인하하여 P5 인스턴스를 시장 기대치에 맞췄습니다.3 GCP의 spot H100은 현재 $2.25(A3-High)로 운영되고 있으며, AWS spot은 종종 $2.50 근처에 있습니다.4 장기 약정을 통해 H100 비용을 GPU 시간당 $1.90-$2.10까지 낮출 수 있습니다.5 일부 공격적인 공급업체들은 시간당 $0.99-$1의 H100 렌탈을 제공합니다.6
가격 하락 동인
여러 요인이 시장 조정을 만들어내기 위해 수렴했습니다.
공급 확장
2023년과 2024년 초를 정의했던 H100 공급 부족이 상당히 완화되었습니다. 하이퍼스케일러와 지역 데이터센터들이 상당한 신규 용량을 온라인으로 가져왔습니다.7 판매자 시장이었던 것이 부족 기간 동안 주문된 생산이 따라잡으면서 정상화되기 시작했습니다.
NVIDIA의 제조 파트너들은 2024년과 2025년 내내 생산 능력을 확장했습니다. 부족 상황 중에 이루어진 용량 투자가 이제 더 균형잡힌 공급과 수요를 가진 시장에 GPU를 공급하고 있습니다. 희소성에서 가용성으로의 전환이 가격 역학을 근본적으로 변화시켰습니다.
경쟁 강도
2025년에 300개 이상의 새로운 공급업체가 H100 클라우드 시장에 진입하여 공격적인 가격 경쟁을 이끌었습니다.8 RunPod와 Vast.ai 같은 소규모 전문 벤더들은 시간당 $1.80-$1.87의 낮은 요금을 제공합니다.9 경쟁은 대형 공급업체들이 가격을 맞추거나 고객을 잃도록 강제합니다.
GPU 클라우드 서비스에 대한 낮은 진입 장벽이 빠른 시장 진입을 가능하게 했습니다. 데이터센터 접근권과 자본을 보유한 조직들이 GPU를 구매하거나 리스하여 클라우드 서비스를 제공할 수 있었습니다. 분산된 시장 구조는 더 높은 장벽을 가진 전통적인 클라우드 서비스와 비교해 가격 경쟁을 강화합니다.
수요 진화
AI 스타트업들이 대규모 기반 모델 훈련에서 기존 오픈소스 모델의 미세조정으로 초점을 이동하여 최대 GPU 클러스터에 대한 수요 강도를 줄였습니다.10 추론 워크로드는 빠르게 성장하고 있지만 훈련과는 다른 특성을 가집니다—더 분산되고, 인스턴스당 요구사항이 낮으며, 가격에 더 민감합니다.
Llama, Mistral, DeepSeek 같은 유능한 오픈소스 모델의 가용성이 처음부터 값비싼 훈련의 필요성을 줄였습니다. 조직들은 기반 모델 훈련보다는 미세조정을 통해 경쟁력 있는 AI 능력을 달성할 수 있습니다. 이러한 변화가 GPU 수요의 구성을 바꿉니다.
시장 시사점
가격 급락은 서로 다른 시장 참여자들에게 별개의 방식으로 영향을 미칩니다.
인프라 투자자
최고가에서 GPU를 구매한 조직들은 도전적인 경제성에 직면합니다. 분석에 따르면 H100 렌탈 가격이 시간당 $1.65 아래로 떨어지면 수익이 더 이상 투자를 회수하지 못합니다.11 주식 시장 대안이 제공하는 내부 수익률을 이기려면 가격이 시간당 $2.85를 초과해야 합니다.12
수익성 임계점이 가격에 바닥 압력을 생성합니다. 현재 가격에서 운영을 지속할 수 없는 공급업체들이 퇴출되어 결국 공급이 안정화될 것입니다. 다른 비용 구조를 가진 운영업체들이 경쟁함에 따라 정리 과정은 완료되는 데 분기가 걸릴 수 있습니다.
클라우드 고객
GPU 용량을 렌탈하는 조직들은 가격 하락으로부터 직접적으로 혜택을 봅니다. 이전에 시간당 $8에서 경제적이지 않았던 프로젝트들이 시간당 $2.50에서 실행 가능해집니다. 접근성은 더 광범위한 AI 실험과 배포를 가능하게 합니다.
그러나 가격 변동성은 계획을 복잡하게 만듭니다. 장기 GPU 용량에 약정하는 조직들은 현재 가격이 공정 가치를 나타내는지 임시 공급 과잉인지에 대한 불확실성에 직면합니다. 단기 약정은 유연성을 제공하지만 공급이 타이트해질 경우 유리한 가격을 놓칠 수 있습니다.
하이퍼스케일러 포지셔닝
IBM CEO Arvind Krishna는 하이퍼스케일러 AI 인프라 투자가 수익을 창출할지 공개적으로 의문을 제기하며, 현재 지출 수준에서 수학적으로 "절대" 작동하지 않는다고 말했습니다.13 GPU 가격 급락은 GPU 소비자들에게 혜택을 주면서 회의론자들에게 뒷받침하는 증거를 제공합니다.
Amazon CEO Andy Jassy는 용량이 "우리가 투입하는 만큼 빠르게 소비된다"고 반박하며, 가격 하락에도 불구하고 지속적인 수요를 시사했습니다.14 볼륨 성장이 가격 하락을 보상할 수 있지만, 마진은 업계 전반에서 압력을 받고 있습니다.
차세대 전망
H100 가격 궤적은 새로운 GPU 세대에 대한 기대치를 알려줍니다.
Blackwell 도입
NVIDIA Blackwell GPU들이 배송을 시작했으며, GB200 시스템들이 고객들에게 도달하고 있습니다. 차세대 아키텍처는 H100보다 상당한 성능 향상을 제공합니다. 초기 Blackwell 가용성은 여전히 제한적이며, 희소성을 반영한 프리미엄 가격을 가지고 있습니다.
Blackwell 가용성이 증가함에 따라 H100 가격은 더 하락할 수 있습니다. H100 성능에 만족하는 조직들은 지속적인 가격 침식으로부터 혜택을 볼 수 있습니다. Blackwell 능력이 필요한 조직들은 공급이 정상화될 때까지 프리미엄을 지불할 것입니다.
중기 전망
중기 전망은 2026년에 B200 GPU가 더 광범위하게 출시될 때 잠재적으로 10-20% 감소를 제안합니다.15 도입 사이클이 H100 패턴을 반복할 수 있습니다: 프리미엄 가격을 가진 초기 희소성 이후 공급 확장과 가격 정상화.
조직들은 인프라 투자를 계획할 때 GPU 세대 타이밍을 고려해야 합니다. 새로운 세대를 기다리는 것은 성능 혜택을 제공하지만 배포를 지연시킵니다. 하락하는 가격의 현재 세대 하드웨어는 즉시 배포를 가능하게 합니다.
현재 가격 비교
| 공급업체 | H100 온디맨드 | H100 Spot | 약정 요금 |
|---|---|---|---|
| AWS P5 | $3.50/hr | ~$2.50/hr | $1.90-2.10/hr (1년) |
| GCP A3-High | $3.25/hr | $2.25/hr | ~$2.00/hr (1년) |
| Azure ND H100 | $3.40/hr | ~$2.60/hr | ~$2.15/hr (1년) |
| RunPod | $2.39/hr | $1.87/hr | N/A |
| Vast.ai | 가변 | $1.80-2.50/hr | N/A |
| Lambda | $2.49/hr | N/A | $1.99/hr (예약) |
2025년 12월 기준 가격. Spot 가격은 가용성에 따라 변동됩니다.
의사결정 프레임워크: 렌탈 vs 소유 vs 대기
| 시나리오 | 권장사항 | 근거 |
|---|---|---|
| 가변 워크로드 (<50% 활용률) | 렌탈 (spot) | 유연성이 소유 절약을 상회 |
| 안정적 워크로드 (>70% 활용률) | 소유권 평가 | 현재 가격에서 손익분기점 달성 가능 |
| >$100K/월 GPU 지출 | 자체 인프라 | 지속적인 활용률에서 명확한 ROI |
| 불확실한 12개월 전망 | 단기 렌탈 | 수요 변화 시 좌초 자산 방지 |
| 대규모 모델 훈련 | 소유 또는 예약 | 일관된 용량이 중요 |
손익분기 분석: - H100 구매 가격: ~GPU당 $25,000-30,000 - $2.50/hr 렌탈에서: 손익분기까지 10,000-12,000시간 (~100% 활용률에서 14-16개월) - $1.65/hr 렌탈에서: 공급업체들이 투자를 회수할 수 없음11 - 수익성 임계점: 주식 시장 IRR을 이기려면 $2.85/hr12
실행 가능한 단계: 1. 현재 지출 감사: 모든 GPU 사용에서 효과적인 시간당 비용 계산 2. 활용률 평가: 실제 vs 예약 용량 사용 측정 3. 약정 옵션 평가: 1년 예약 가격 vs 온디맨드 비교 4. 하이브리드 고려: 기본선 소유, 버스트 용량 렌탈
전문가 지침
변동성 있는 시장에서의 인프라 결정은 경험 있는 관점으로부터 혜택을 봅니다.
Introl의 550명의 필드 엔지니어가 GPU 인프라 경제학을 탐색하는 조직들을 지원합니다.16 이 회사는 9,594%의 3년 성장률로 2025년 Inc. 5000에서 #14위를 기록했습니다.17
전 세계 257개 위치에 걸친 전문성이 지리에 관계없이 시장 인사이트를 제공합니다.18 전문가 지침은 조직들이 가격이 진화함에 따라 정보에 기반한 결정을 내리는 데 도움을 줍니다.
주요 요점
조달팀을 위해: - H100 가격이 $8/hr에서 $2.85-3.50/hr로 64% 하락 - 300개 이상의 새로운 공급업체가 경쟁 강화 - Spot 가격 (GCP $2.25, AWS $2.50)이 유연한 워크로드에 최고 가치 제공
인프라 계획자를 위해: - 소유권 손익분기: 100% 활용률에서 14-16개월 - 공급업체 수익성 바닥: ~$1.65/hr (가격이 훨씬 더 하락할 가능성 낮음) - 약정 가격 ($1.90-2.10/hr)이 온디맨드보다 40%+ 우수
전략 계획을 위해: - 2023-2024 희소성 이후 시장 정상화—일시적 하락이 아님 - Blackwell 도입이 2026년에 H100 가격을 더 낮출 수 있음 - 기술이 빠르게 진화함에 따라 렌탈 유연성 가치
전망
GPU 클라우드 가격 급락은 2023-2024의 희소성 조건 이후 시장 정상화를 나타냅니다. 조직들은 극적으로 개선된 GPU 접근성으로부터 혜택을 보며, 더 광범위한 AI 배포를 가능하게 합니다. 공급 성장이 계속해서 수요를 만족함에 따라 가격 환경이 지속될 수 있으며, 차세대 도입이 잠재적으로 패턴을 연장할 수 있습니다.
조직들은 시장 진화에 대한 유연성을 유지하면서 즉시 요구사항에 대해 현재 가격을 활용해야 합니다. 가장 성공적인 전략은 빠르게 진화하는 시장에서 조기 자본 약정을 피하기 위해 렌탈 유연성을 사용하여 배포 긴급성과 시장 타이밍 고려사항 간의 균형을 맞출 것입니다.
참고문헌
긴급도: 높음 — 즉시 조달 시사점을 가진 시장 변화 단어 수: ~1,800
-
Thunder Compute. "AI GPU Rental Market Trends December 2025." December 2025. https://www.thundercompute.com/blog/ai-gpu-rental-market-trends ↩
-
Silicon Data. "H100 Rental Market Cools in September." September 2025. https://www.silicondata.com/blog/h100-rental-market-update-september-2025 ↩
-
Thunder Compute. "AI GPU Rental Market Trends December 2025." December 2025. ↩
-
IntuitionLabs. "H100 Rental Prices: A Cloud Cost Comparison." November 2025. https://intuitionlabs.ai/articles/h100-rental-prices-cloud-comparison ↩
-
IntuitionLabs. "H100 Rental Prices: A Cloud Cost Comparison." November 2025. ↩
-
Thunder Compute. "AI GPU Rental Market Trends December 2025." December 2025. ↩
-
Silicon Data. "H100 Rental Market Cools in September." September 2025. ↩
-
Thunder Compute. "AI GPU Rental Market Trends December 2025." December 2025. ↩
-
IntuitionLabs. "H100 Rental Prices: A Cloud Cost Comparison." November 2025. ↩
-
Thunder Compute. "AI GPU Rental Market Trends December 2025." December 2025. ↩
-
Cybernews. "AI boom paradox leads to GPU rental market crash." 2025. https://cybernews.com/tech/gpu-rental-prices-are-crashing/ ↩↩
-
Cybernews. "AI boom paradox leads to GPU rental market crash." 2025. ↩↩
-
Fortune. "IBM CEO warns there's 'no way' hyperscalers will turn a profit." December 2025. https://fortune.com/2025/12/03/ibm-ceo-no-way-hyperscalers-google-amazon-turn-profit-data-center-spending/ ↩
-
CIO Dive. "'We're not dabbling here': AWS backs infrastructure investments." December 2025. https://www.ciodive.com/news/aws-ai-cloud-infrastructure-capacity-microsoft-google/746998/ ↩
-
Thunder Compute. "AI GPU Rental Market Trends December 2025." December 2025. ↩
-
Introl. "Company Overview." Introl. 2025. https://introl.com ↩
-
Inc. "Inc. 5000 2025." Inc. Magazine. 2025. ↩
-
Introl. "Coverage Area." Introl. 2025. https://introl.com/coverage-area ↩