GPU 클라우드 가격 폭락: 공급이 수요를 따라잡으며 H100 렌탈 비용 64% 하락

2023-2024년 공급 부족 이후 GPU 렌탈 시장이 정상화되면서 AI 인프라에 전략적 기회가 열리고 있습니다.

GPU 클라우드 가격 폭락: 공급이 수요를 따라잡으며 H100 렌탈 비용 64% 하락

GPU 클라우드 가격 폭락: 공급이 수요를 따라잡으며 H100 렌탈 비용 64% 하락

2025년 12월 10일 작성자: Blake Crosley

GPU 렌탈 시장이 극적인 조정을 겪었습니다. H100 가격이 시간당 8달러에서 2.85~3.50달러로 하락하며, 2024년 말 최고가 대비 64% 감소했습니다.1 Silicon Data H100 렌탈 지수는 2024년 9월 3.06달러에서 2025년 6월 2.36달러로, 1년도 채 되지 않아 23% 하락했습니다.2 AI 인프라를 계획 중인 조직에게 이번 가격 폭락은 전략적 기회를 제공하는 동시에, 시장 역학과 향후 가격 추이에 대한 의문을 제기합니다.

AWS는 2025년 6월 H100 가격을 약 44% 인하하여 P5 인스턴스를 시장 기대 수준에 맞췄습니다.3 GCP의 스팟 H100은 현재 2.25달러(A3-High)에, AWS 스팟은 약 2.50달러 수준입니다.4 장기 약정을 통해 H100의 실효 비용을 GPU 시간당 1.90~2.10달러까지 낮출 수 있습니다.5 일부 공격적인 제공업체는 H100 렌탈을 시간당 0.99~1달러까지 제공하고 있습니다.6

가격 하락 요인

여러 요인이 복합적으로 작용하여 시장 조정이 발생했습니다.

공급 확대

2023년과 2024년 초를 정의했던 H100 공급 부족이 상당히 완화되었습니다. 하이퍼스케일러와 지역 데이터센터들이 상당한 신규 용량을 확보했습니다.7 판매자 우위 시장이었던 것이 부족 기간 동안 주문된 물량의 생산이 따라잡으면서 정상화되기 시작했습니다.

NVIDIA의 제조 파트너들은 2024년과 2025년에 걸쳐 생산 능력을 확대했습니다. 공급 부족 상황에서 이루어진 설비 투자가 이제 수급이 더 균형 잡힌 시장에 GPU를 공급하고 있습니다. 희소성에서 가용성으로의 전환이 가격 역학을 근본적으로 변화시켰습니다.

경쟁 심화

2025년에 300개 이상의 신규 제공업체가 H100 클라우드 시장에 진입하면서 공격적인 가격 경쟁이 벌어지고 있습니다.8 RunPod과 Vast.ai 같은 소규모 전문 업체들은 시간당 1.80~1.87달러의 저렴한 요금을 제공합니다.9 이러한 경쟁으로 대형 제공업체들도 가격을 맞추거나 고객을 잃을 수밖에 없습니다.

GPU 클라우드 서비스의 낮은 진입 장벽이 빠른 시장 진입을 가능하게 했습니다. 데이터센터 접근성과 자본을 갖춘 조직이라면 GPU를 구매하거나 임대하여 클라우드 서비스를 제공할 수 있었습니다. 진입 장벽이 높은 전통적인 클라우드 서비스에 비해 분산된 시장 구조가 가격 경쟁을 더욱 심화시킵니다.

수요 변화

AI 스타트업들이 대규모 기반 모델 훈련에서 기존 오픈소스 모델의 미세 조정으로 초점을 전환하면서, 대규모 GPU 클러스터에 대한 수요 강도가 감소했습니다.10 추론 워크로드는 빠르게 성장하고 있지만 훈련과는 다른 특성을 가집니다—더 분산되어 있고, 인스턴스당 요구 사항이 낮으며, 가격에 더 민감합니다.

Llama, Mistral, DeepSeek 같은 유능한 오픈소스 모델의 등장으로 처음부터 비용을 들여 훈련할 필요성이 줄었습니다. 조직들은 기반 모델 훈련 대신 미세 조정을 통해 경쟁력 있는 AI 역량을 달성할 수 있습니다. 이러한 변화가 GPU 수요의 구성을 바꾸고 있습니다.

시장에 미치는 영향

가격 폭락은 시장 참여자들에게 각기 다른 방식으로 영향을 미칩니다.

인프라 투자자

최고가에 GPU를 구매한 조직들은 어려운 경제 상황에 직면해 있습니다. 분석에 따르면 H100 렌탈 가격이 시간당 1.65달러 이하로 떨어지면 수익으로 투자금을 회수할 수 없습니다.11 주식 시장 대안이 제공하는 내부수익률(IRR)을 상회하려면 가격이 시간당 2.85달러를 초과해야 합니다.12

수익성 임계값이 가격의 하한선 압력을 형성합니다. 현재 가격으로 운영을 유지할 수 없는 제공업체들이 퇴출되면서 결국 공급이 안정화될 것입니다. 비용 구조가 다른 사업자들이 경쟁하면서 구조조정에는 수 분기가 소요될 수 있습니다.

클라우드 고객

GPU 용량을 임대하는 조직들은 가격 하락의 직접적인 혜택을 받습니다. 시간당 8달러에서는 경제성이 없었던 프로젝트가 시간당 2.50달러에서는 실현 가능해집니다. 이러한 접근성 향상은 더 광범위한 AI 실험과 배포를 가능하게 합니다.

그러나 가격 변동성은 계획 수립을 복잡하게 합니다. 장기 GPU 용량에 약정하는 조직들은 현재 가격이 적정 가치인지 일시적인 공급 과잉인지에 대한 불확실성에 직면합니다. 단기 약정은 유연성을 제공하지만 공급이 타이트해질 경우 유리한 가격을 놓칠 수 있습니다.

하이퍼스케일러 포지셔닝

IBM CEO Arvind Krishna는 하이퍼스케일러의 AI 인프라 투자가 수익을 창출할 수 있을지 공개적으로 의문을 제기하며, 현재 지출 수준에서는 수학적으로 "불가능하다"고 밝혔습니다.13 GPU 가격 폭락은 회의론자들에게 근거를 제공하면서 동시에 GPU 소비자들에게는 이익이 됩니다.

Amazon CEO Andy Jassy는 "투입하는 만큼 빠르게 소비된다"며 반박하여, 가격 하락에도 불구하고 수요가 지속됨을 시사했습니다.14 물량 성장이 가격 하락을 보상할 수 있지만, 업계 전반의 마진은 압박을 받고 있습니다.

차세대 전망

H100 가격 추이는 신형 GPU 세대에 대한 기대에 영향을 미칩니다.

Blackwell 출시

NVIDIA Blackwell GPU가 출하를 시작했으며, GB200 시스템이 고객에게 도달하고 있습니다. 차세대 아키텍처는 H100 대비 상당한 성능 향상을 제공합니다. 초기 Blackwell 가용성은 제한적이며, 희소성을 반영한 프리미엄 가격이 책정되어 있습니다.

Blackwell 가용성이 증가하면 H100 가격은 더 하락할 수 있습니다. H100 성능에 만족하는 조직들은 지속적인 가격 하락의 혜택을 받을 수 있습니다. Blackwell 역량이 필요한 조직들은 공급이 정상화될 때까지 프리미엄을 지불해야 합니다.

중기 전망

중기 전망에 따르면 2026년 B200 GPU가 본격 출시되면 10~20%의 추가 하락이 있을 수 있습니다.15 출시 주기가 H100 패턴을 반복할 수 있습니다: 초기 희소성과 프리미엄 가격 이후 공급 확대와 가격 정상화.

조직들은 인프라 투자를 계획할 때 GPU 세대 타이밍을 고려해야 합니다. 신세대를 기다리면 성능상의 이점이 있지만 배포가 지연됩니다. 하락하는 가격의 현세대 하드웨어는 즉각적인 배포를 가능하게 합니다.

현재 가격 비교

제공업체 H100 온디맨드 H100 스팟 약정 요금
AWS P5 $3.50/hr ~$2.50/hr $1.90-2.10/hr (1년)
GCP A3-High $3.25/hr $2.25/hr ~$2.00/hr (1년)
Azure ND H100 $3.40/hr ~$2.60/hr ~$2.15/hr (1년)
RunPod $2.39/hr $1.87/hr N/A
Vast.ai 변동 $1.80-2.50/hr N/A
Lambda $2.49/hr N/A $1.99/hr (예약)

2025년 12월 기준 가격. 스팟 가격은 가용성에 따라 변동.

의사결정 프레임워크: 임대 vs 구매 vs 대기

시나리오 권장 사항 근거
가변 워크로드 (<50% 활용률) 임대 (스팟) 유연성이 소유 절감액보다 유리
안정적 워크로드 (>70% 활용률) 소유 검토 현재 가격에서 손익분기점 달성 가능
월 GPU 비용 $100K 이상 자체 인프라 지속적인 활용률에서 명확한 ROI
12개월 전망 불확실 단기 임대 수요 변화 시 좌초자산 방지
대규모 모델 훈련 자체 또는 예약 일관된 용량 확보 필수

손익분기점 분석: - H100 구매 가격: GPU당 약 $25,000-30,000 - 시간당 $2.50 임대 시: 손익분기점까지 10,000-12,000시간 (~100% 활용률 기준 14-16개월) - 시간당 $1.65 임대 시: 제공업체 투자금 회수 불가11 - 수익성 임계값: 주식 시장 IRR 상회를 위해 시간당 $2.8512

실행 단계: 1. 현재 지출 감사: 전체 GPU 사용에 대한 실효 시간당 비용 계산 2. 활용률 평가: 실제 사용량 대 예약 용량 사용률 측정 3. 약정 옵션 검토: 1년 예약 가격과 온디맨드 비교 4. 하이브리드 고려: 기본 용량은 자체 보유, 급증 용량은 임대

전문 가이던스

변동성이 큰 시장에서의 인프라 결정은 경험 있는 관점의 도움이 필요합니다.

Introl의 550명의 현장 엔지니어 네트워크가 GPU 인프라 경제학을 탐색하는 조직을 지원합니다.16 Introl은 2025 Inc. 5000에서 3년간 9,594% 성장으로 14위를 기록했습니다.17

전 세계 257개 지역에 걸친 전문성이 지역에 관계없이 시장 인사이트를 제공합니다.18 전문 가이던스는 가격이 변화하는 가운데 조직이 정보에 기반한 결정을 내리는 데 도움을 줍니다.

핵심 요점

조달팀을 위한 요점: - H100 가격이 시간당 $8에서 $2.85-3.50으로 64% 하락 - 300개 이상의 신규 제공업체가 경쟁 심화 - 스팟 가격(GCP $2.25, AWS $2.50)이 유연한 워크로드에 최적의 가치 제공

인프라 기획자를 위한 요점: - 소유의 손익분기점: 100% 활용률 기준 14-16개월 - 제공업체 수익성 하한선: 시간당 약 $1.65 (가격이 이보다 크게 떨어질 가능성 낮음) - 약정 가격($1.90-2.10/hr)이 온디맨드 대비 40% 이상 절감

전략 기획을 위한 요점: - 2023-2024년 희소성 이후 시장이 정상화 중—일시적 하락이 아님 - Blackwell 출시로 2026년 H100 가격이 더 하락할 수 있음 - 기술이 빠르게 진화하는 가운데 임대 유연성이 가치 있음

전망

GPU 클라우드 가격 폭락은 2023-2024년 희소성 상황 이후의 시장 정상화를 나타냅니다. 조직들은 극적으로 개선된 GPU 접근성의 혜택을 받아 더 광범위한 AI 배포가 가능해졌습니다. 공급 성장이 수요를 계속 충족하면서 가격 환경이 지속될 수 있으며, 차세대 출시가 이 패턴을 연장할 가능성이 있습니다.

조직들은 즉각적인 요구에 대해 현재 가격을 활용하면서 시장 변화에 대한 유연성을 유지해야 합니다. 가장 성공적인 전략은 배포 긴급성과 시장 타이밍 고려 사항의 균형을 맞추고, 빠르게 진화하는 시장에서 조기 자본 투입을 피하기 위해 임대 유연성을 활용하는 것입니다.

참고문헌


긴급도: 높음 — 즉각적인 조달 영향이 있는 시장 변화 글자 수: 약 1,800



  1. Thunder Compute. "AI GPU Rental Market Trends December 2025." December 2025. https://www.thundercompute.com/blog/ai-gpu-rental-market-trends 

  2. Silicon Data. "H100 Rental Market Cools in September." September 2025. https://www.silicondata.com/blog/h100-rental-market-update-september-2025 

  3. Thunder Compute. "AI GPU Rental Market Trends December 2025." December 2025. 

  4. IntuitionLabs. "H100 Rental Prices: A Cloud Cost Comparison." November 2025. https://intuitionlabs.ai/articles/h100-rental-prices-cloud-comparison 

  5. IntuitionLabs. "H100 Rental Prices: A Cloud Cost Comparison." November 2025. 

  6. Thunder Compute. "AI GPU Rental Market Trends December 2025." December 2025. 

  7. Silicon Data. "H100 Rental Market Cools in September." September 2025. 

  8. Thunder Compute. "AI GPU Rental Market Trends December 2025." December 2025. 

  9. IntuitionLabs. "H100 Rental Prices: A Cloud Cost Comparison." November 2025. 

  10. Thunder Compute. "AI GPU Rental Market Trends December 2025." December 2025. 

  11. Cybernews. "AI boom paradox leads to GPU rental market crash." 2025. https://cybernews.com/tech/gpu-rental-prices-are-crashing/ 

  12. Cybernews. "AI boom paradox leads to GPU rental market crash." 2025. 

  13. Fortune. "IBM CEO warns there's 'no way' hyperscalers will turn a profit." December 2025. https://fortune.com/2025/12/03/ibm-ceo-no-way-hyperscalers-google-amazon-turn-profit-data-center-spending/ 

  14. CIO Dive. "'We're not dabbling here': AWS backs infrastructure investments." December 2025. https://www.ciodive.com/news/aws-ai-cloud-infrastructure-capacity-microsoft-google/746998/ 

  15. Thunder Compute. "AI GPU Rental Market Trends December 2025." December 2025. 

  16. Introl. "Company Overview." Introl. 2025. https://introl.com 

  17. Inc. "Inc. 5000 2025." Inc. Magazine. 2025. 

  18. Introl. "Coverage Area." Introl. 2025. https://introl.com/coverage-area 

견적 요청_

프로젝트에 대해 알려주시면 72시간 내에 답변드리겠습니다.

> 전송_완료

요청이 접수되었습니다_

문의해 주셔서 감사합니다. 저희 팀이 요청사항을 검토한 후 72시간 내에 답변드리겠습니다.

처리_대기_중