GPU-cloudprijzen kelderen: H100-verhuur daalt 64% nu aanbod vraag inhaalt
10 dec 2025 Geschreven door Blake Crosley
De GPU-verhuurmarkt heeft een dramatische correctie doorgemaakt, waarbij H100-prijzen zijn gedaald van $8 per uur naar $2,85-3,50 per uur—een daling van 64% ten opzichte van piekniveaus eind 2024.1 De Silicon Data H100 Rental Index stond in juni 2025 op $2,36, gedaald van $3,06 in september 2024, een daling van 23% in minder dan een jaar.2 Voor organisaties die AI-infrastructuur plannen, creëert de prijsval strategische kansen terwijl er vragen rijzen over marktdynamiek en toekomstige prijsontwikkelingen.
AWS verlaagde de H100-prijzen met ongeveer 44% in juni 2025, waardoor P5-instances in lijn kwamen met marktverwachtingen.3 GCP's spot H100 draait nu op $2,25 (A3-High), terwijl AWS spot vaak rond $2,50 zit.4 Langetermijnverbintenissen kunnen effectieve H100-kosten terugbrengen tot slechts $1,90-$2,10 per GPU-uur.5 Sommige agressieve aanbieders bieden H100-verhuur aan voor slechts $0,99-$1 per uur.6
Oorzaken van de prijsdaling
Meerdere factoren kwamen samen om de marktcorrectie te veroorzaken.
Aanboduitbreiding
De H100-schaarste die 2023 en begin 2024 kenmerkte, is aanzienlijk afgenomen. Hyperscalers en regionale datacenters hebben significante nieuwe capaciteit online gebracht.7 Wat een verkopersmarkt was, begint te normaliseren nu de productie de bestellingen uit de schaarsteperiode heeft ingehaald.
NVIDIA's productiepartners hebben de productiecapaciteit gedurende 2024 en 2025 uitgebreid. De capaciteitsinvesteringen die tijdens schaarsteomstandigheden werden gedaan, leveren nu GPU's af in een markt met evenwichtiger aanbod en vraag. De transitie van schaarste naar beschikbaarheid heeft de prijsdynamiek fundamenteel veranderd.
Intensieve concurrentie
Meer dan 300 nieuwe aanbieders betraden de H100-cloudmarkt in 2025, wat leidde tot agressieve prijsconcurrentie.8 Kleinere, gespecialiseerde leveranciers zoals RunPod en Vast.ai bieden tarieven aan vanaf $1,80-$1,87 per uur.9 De concurrentie dwingt grotere aanbieders om prijzen te matchen of klanten te verliezen.
De lage toetredingsdrempel voor GPU-clouddiensten maakte snelle markttoetreding mogelijk. Organisaties met toegang tot datacenters en kapitaal konden GPU's kopen of leasen en clouddiensten aanbieden. De gefragmenteerde marktstructuur intensiveert de prijsconcurrentie vergeleken met traditionele clouddiensten met hogere drempels.
Vraagontwikkeling
AI-startups hebben hun focus verlegd van het trainen van grote basismodellen naar het fine-tunen van bestaande open-source modellen, waardoor de vraagintensiteit voor de grootste GPU-clusters afneemt.10 Inference-workloads, hoewel snel groeiend, hebben andere kenmerken dan training—meer gedistribueerd, lagere vereisten per instance en prijsgevoeliger.
De beschikbaarheid van capabele open-source modellen zoals Llama, Mistral en DeepSeek verminderde de noodzaak voor dure training vanaf nul. Organisaties kunnen competitieve AI-mogelijkheden bereiken via fine-tuning in plaats van basismodeltraining. De verschuiving verandert de samenstelling van de GPU-vraag.
Marktimplicaties
De prijsval treft verschillende marktdeelnemers op verschillende manieren.
Infrastructuurinvesteerders
Organisaties die GPU's kochten tegen piekprijzen worden geconfronteerd met uitdagende economische realiteiten. Analyses suggereren dat zodra H100-verhuurprijzen onder $1,65 per uur zakken, opbrengsten de investering niet meer terugverdienen.11 Prijzen moeten hoger zijn dan $2,85 per uur om het interne rendement van aandelenmarktalternatieven te overtreffen.12
De winstgevendheidsdrempel creëert bodemdruk op prijzen. Aanbieders die niet kunnen overleven bij huidige prijzen zullen uittreden, waardoor het aanbod uiteindelijk stabiliseert. De shake-out kan kwartalen duren aangezien operators met verschillende kostenstructuren concurreren.
Cloudklanten
Organisaties die GPU-capaciteit huren, profiteren direct van prijsdalingen. Projecten die voorheen oneconomisch waren bij $8 per uur worden haalbaar bij $2,50 per uur. De toegankelijkheid maakt bredere AI-experimenten en -implementatie mogelijk.
Prijsvolatiliteit compliceert echter de planning. Organisaties die zich committeren aan langetermijn GPU-capaciteit worden geconfronteerd met onzekerheid over of huidige prijzen eerlijke waarde vertegenwoordigen of tijdelijk overaanbod. Kortetermijnverbintenissen bieden flexibiliteit maar kunnen gunstige prijzen missen als het aanbod krapper wordt.
Hyperscaler-positionering
IBM-CEO Arvind Krishna twijfelde publiekelijk of hyperscaler AI-infrastructuurinvesteringen rendement zullen genereren, stellend dat de wiskunde "op geen enkele manier" werkt bij huidige bestedingsniveaus.13 De GPU-prijsval levert ondersteunend bewijs voor sceptici terwijl het GPU-consumenten ten goede komt.
Amazon-CEO Andy Jassy counterde dat capaciteit "zo snel wordt verbruikt als we het plaatsen," wat wijst op aanhoudende vraag ondanks prijsdalingen.14 De volumegroei kan de prijsdaling compenseren, maar marges staan onder druk in de hele sector.
Vooruitzichten volgende generatie
De H100-prijsontwikkeling informeert verwachtingen voor nieuwere GPU-generaties.
Blackwell-introductie
NVIDIA Blackwell GPU's zijn begonnen met verzenden, waarbij GB200-systemen klanten bereiken. De next-generation architectuur biedt significante prestatieverbeteringen ten opzichte van H100. Initiële Blackwell-beschikbaarheid blijft beperkt, met premiumprijzen die schaarste weerspiegelen.
H100-prijzen kunnen verder dalen naarmate Blackwell-beschikbaarheid toeneemt. Organisaties tevreden met H100-prestaties kunnen profiteren van voortdurende prijserosie. Degenen die Blackwell-mogelijkheden nodig hebben, zullen premiums betalen totdat het aanbod normaliseert.
Middellangetermijnprognoses
Middellangetermijnprognoses suggereren een potentiële daling van 10-20% wanneer B200 GPU's breder worden gelanceerd in 2026.15 De introductiecyclus kan het H100-patroon herhalen: initiële schaarste met premiumprijzen gevolgd door aanboduitbreiding en prijsnormalisatie.
Organisaties moeten GPU-generatietiming overwegen bij het plannen van infrastructuurinvesteringen. Wachten op nieuwere generaties biedt prestatievoordelen maar vertraagt implementatie. Huidige-generatie hardware tegen dalende prijzen maakt onmiddellijke implementatie mogelijk.
Huidige prijsvergelijking
| Aanbieder | H100 On-Demand | H100 Spot | Verbintenistarief |
|---|---|---|---|
| AWS P5 | $3,50/uur | ~$2,50/uur | $1,90-2,10/uur (1jr) |
| GCP A3-High | $3,25/uur | $2,25/uur | ~$2,00/uur (1jr) |
| Azure ND H100 | $3,40/uur | ~$2,60/uur | ~$2,15/uur (1jr) |
| RunPod | $2,39/uur | $1,87/uur | N.v.t. |
| Vast.ai | Variabel | $1,80-2,50/uur | N.v.t. |
| Lambda | $2,49/uur | N.v.t. | $1,99/uur (gereserveerd) |
Prijzen per december 2025. Spotprijzen fluctueren op basis van beschikbaarheid.
Beslissingskader: huren vs bezitten vs wachten
| Scenario | Aanbeveling | Rationale |
|---|---|---|
| Variabele workload (<50% benutting) | Huren (spot) | Flexibiliteit weegt op tegen eigendomsbesparingen |
| Stabiele workload (>70% benutting) | Eigendom evalueren | Break-even haalbaar bij huidige prijzen |
| >$100K/maand GPU-uitgaven | Eigen infrastructuur | Duidelijke ROI bij duurzame benutting |
| Onzekere 12-maanden vooruitzichten | Kortetermijnverhuur | Vermijd gestrande activa als vraag verschuift |
| Grote modellen trainen | Eigendom of gereserveerd | Consistente capaciteit cruciaal |
Break-even analyse: - H100 aankoopprijs: ~$25.000-30.000 per GPU - Bij $2,50/uur verhuur: 10.000-12.000 uur om break-even te bereiken (~14-16 maanden bij 100% benutting) - Bij $1,65/uur verhuur: aanbieders kunnen investering niet terugverdienen11 - Winstgevendheidsdrempel: $2,85/uur om aandelenmarkt-IRR te verslaan12
Actiepunten: 1. Audit huidige uitgaven: Bereken effectieve uurprijs over al het GPU-gebruik 2. Beoordeel benutting: Meet daadwerkelijk vs gereserveerd capaciteitsgebruik 3. Evalueer verbintenisopties: Vergelijk 1-jarig gereserveerde prijzen vs on-demand 4. Overweeg hybride: Eigendom voor basislijn, huren voor piekbelasting
Professionele begeleiding
Infrastructuurbeslissingen in volatiele markten profiteren van ervaren perspectief.
Introls netwerk van 550 field engineers ondersteunt organisaties bij het navigeren van GPU-infrastructuureconomie.16 Het bedrijf eindigde op #14 in de 2025 Inc. 5000 met 9.594% driejarige groei.17
Expertise over 257 wereldwijde locaties biedt marktinzicht ongeacht geografie.18 Professionele begeleiding helpt organisaties geïnformeerde beslissingen te nemen terwijl prijzen evolueren.
Belangrijkste inzichten
Voor inkoopteams: - H100-prijzen daalden 64% van $8/uur naar $2,85-3,50/uur - 300+ nieuwe aanbieders intensiveren concurrentie - Spotprijzen (GCP $2,25, AWS $2,50) bieden beste waarde voor flexibele workloads
Voor infrastructuurplanners: - Break-even voor eigendom: 14-16 maanden bij 100% benutting - Winstgevendheidsbodem aanbieder: ~$1,65/uur (prijzen zullen waarschijnlijk niet veel verder dalen) - Verbintenisprijzen ($1,90-2,10/uur) verslaan on-demand met 40%+
Voor strategische planning: - Markt normaliseert na schaarste 2023-2024—geen tijdelijke dip - Blackwell-introductie kan H100-prijzen verder drukken in 2026 - Verhuurflexibiliteit waardevol terwijl technologie snel evolueert
Vooruitzichten
De GPU-cloud prijsval vertegenwoordigt marktnormalisatie na de schaarsteomstandigheden van 2023-2024. Organisaties profiteren van dramatisch verbeterde GPU-toegankelijkheid, wat bredere AI-implementatie mogelijk maakt. Het prijsklimaat kan aanhouden naarmate aanbodgroei vraag blijft ontmoeten, waarbij next-generation introducties het patroon mogelijk verlengen.
Organisaties moeten profiteren van huidige prijzen voor directe behoeften terwijl ze flexibiliteit behouden voor marktevolutie. De meest succesvolle strategieën zullen implementatie-urgentie balanceren tegen markttiming-overwegingen, gebruikmakend van verhuurflexibiliteit om voorbarige kapitaalverbintenissen te vermijden in een snel evoluerende markt.
Referenties
Categorie: Marktanalyse Urgentie: Hoog — Marktverschuiving met directe inkoopimplicaties Woordenaantal: ~1.800
-
Thunder Compute. "AI GPU Rental Market Trends December 2025." December 2025. https://www.thundercompute.com/blog/ai-gpu-rental-market-trends ↩
-
Silicon Data. "H100 Rental Market Cools in September." September 2025. https://www.silicondata.com/blog/h100-rental-market-update-september-2025 ↩
-
Thunder Compute. "AI GPU Rental Market Trends December 2025." December 2025. ↩
-
IntuitionLabs. "H100 Rental Prices: A Cloud Cost Comparison." November 2025. https://intuitionlabs.ai/articles/h100-rental-prices-cloud-comparison ↩
-
IntuitionLabs. "H100 Rental Prices: A Cloud Cost Comparison." November 2025. ↩
-
Thunder Compute. "AI GPU Rental Market Trends December 2025." December 2025. ↩
-
Silicon Data. "H100 Rental Market Cools in September." September 2025. ↩
-
Thunder Compute. "AI GPU Rental Market Trends December 2025." December 2025. ↩
-
IntuitionLabs. "H100 Rental Prices: A Cloud Cost Comparison." November 2025. ↩
-
Thunder Compute. "AI GPU Rental Market Trends December 2025." December 2025. ↩
-
Cybernews. "AI boom paradox leads to GPU rental market crash." 2025. https://cybernews.com/tech/gpu-rental-prices-are-crashing/ ↩↩
-
Cybernews. "AI boom paradox leads to GPU rental market crash." 2025. ↩↩
-
Fortune. "IBM CEO warns there's 'no way' hyperscalers will turn a profit." December 2025. https://fortune.com/2025/12/03/ibm-ceo-no-way-hyperscalers-google-amazon-turn-profit-data-center-spending/ ↩
-
CIO Dive. "'We're not dabbling here': AWS backs infrastructure investments." December 2025. https://www.ciodive.com/news/aws-ai-cloud-infrastructure-capacity-microsoft-google/746998/ ↩
-
Thunder Compute. "AI GPU Rental Market Trends December 2025." December 2025. ↩
-
Introl. "Company Overview." Introl. 2025. https://introl.com ↩
-
Inc. "Inc. 5000 2025." Inc. Magazine. 2025. ↩
-
Introl. "Coverage Area." Introl. 2025. https://introl.com/coverage-area ↩