GPU-Cloud-Preise brechen ein: H100-Miete fällt um 64%, da das Angebot die Nachfrage erreicht

Der GPU-Mietmarkt normalisiert sich nach der Knappheit 2023-2024 und schafft strategische Chancen für KI-Infrastruktur.

GPU-Cloud-Preise brechen ein: H100-Miete fällt um 64%, da das Angebot die Nachfrage erreicht

GPU-Cloud-Preise brechen ein: H100-Miete fällt um 64%, da das Angebot die Nachfrage erreicht

  1. Dez. 2025 Geschrieben von Blake Crosley

Der GPU-Mietmarkt hat eine dramatische Korrektur erfahren: Die H100-Preise sind von 8 Dollar pro Stunde auf 2,85-3,50 Dollar pro Stunde gefallen – ein Rückgang von 64% gegenüber den Höchstständen Ende 2024.1 Der Silicon Data H100 Rental Index lag im Juni 2025 bei 2,36 Dollar, gegenüber 3,06 Dollar im September 2024 – ein Rückgang von 23% in weniger als einem Jahr.2 Für Organisationen, die KI-Infrastruktur planen, schafft der Preisverfall strategische Chancen, wirft aber auch Fragen zur Marktdynamik und zukünftigen Preisentwicklung auf.

AWS senkte die H100-Preise im Juni 2025 um etwa 44% und brachte die P5-Instanzen auf das erwartete Marktniveau.3 GCPs Spot-H100 läuft jetzt bei 2,25 Dollar (A3-High), während AWS Spot oft bei etwa 2,50 Dollar liegt.4 Langfristige Verpflichtungen können die effektiven H100-Kosten auf nur 1,90-2,10 Dollar pro GPU-Stunde senken.5 Einige aggressive Anbieter bieten H100-Mieten für nur 0,99-1 Dollar pro Stunde an.6

Preisrückgang – die Treiber

Mehrere Faktoren kamen zusammen und führten zur Marktkorrektur.

Angebotsausweitung

Die H100-Versorgungsengpässe, die 2023 und Anfang 2024 prägend waren, haben sich deutlich entspannt. Hyperscaler und regionale Rechenzentren haben erhebliche neue Kapazitäten online gebracht.7 Was ein Verkäufermarkt war, beginnt sich zu normalisieren, da die Produktion mit den während der Knappheitsperiode platzierten Bestellungen aufgeholt hat.

NVIDIAs Fertigungspartner haben die Produktionskapazität im Laufe der Jahre 2024 und 2025 erweitert. Die während der Knappheit getätigten Kapazitätsinvestitionen liefern nun GPUs in einen Markt mit ausgeglichenerem Angebot und Nachfrage. Der Übergang von Knappheit zu Verfügbarkeit hat die Preisdynamik grundlegend verändert.

Wettbewerbsintensität

Über 300 neue Anbieter sind 2025 in den H100-Cloud-Markt eingetreten, was zu aggressivem Preiswettbewerb geführt hat.8 Kleinere, spezialisierte Anbieter wie RunPod und Vast.ai bieten Tarife von nur 1,80-1,87 Dollar pro Stunde an.9 Der Wettbewerb zwingt größere Anbieter, die Preise anzupassen oder Kunden zu verlieren.

Die niedrige Eintrittsbarriere für GPU-Cloud-Dienste ermöglichte einen schnellen Markteintritt. Organisationen mit Rechenzentrumszugang und Kapital konnten GPUs kaufen oder leasen und Cloud-Dienste anbieten. Die fragmentierte Marktstruktur intensiviert den Preiswettbewerb im Vergleich zu traditionellen Cloud-Diensten mit höheren Barrieren.

Nachfrageentwicklung

KI-Startups haben ihren Fokus vom Training großer Basismodelle auf das Feintuning bestehender Open-Source-Modelle verlagert, was die Nachfrageintensität nach den größten GPU-Clustern reduziert.10 Inferenz-Workloads, obwohl sie schnell wachsen, haben andere Eigenschaften als Training – verteilter, geringere Anforderungen pro Instanz und preissensibler.

Die Verfügbarkeit leistungsfähiger Open-Source-Modelle wie Llama, Mistral und DeepSeek reduzierte die Notwendigkeit für teures Training von Grund auf. Organisationen können wettbewerbsfähige KI-Fähigkeiten durch Feintuning statt durch Basismodell-Training erreichen. Die Verschiebung verändert die Zusammensetzung der GPU-Nachfrage.

Marktauswirkungen

Der Preisverfall betrifft verschiedene Marktteilnehmer auf unterschiedliche Weise.

Infrastruktur-Investoren

Organisationen, die GPUs zu Höchstpreisen gekauft haben, stehen vor schwierigen wirtschaftlichen Bedingungen. Analysen deuten darauf hin, dass bei H100-Mietpreisen unter 1,65 Dollar pro Stunde die Einnahmen die Investition nicht mehr decken.11 Die Preise müssen 2,85 Dollar pro Stunde übersteigen, um die interne Rendite von Börsenalternativen zu schlagen.12

Die Rentabilitätsschwelle erzeugt einen Preisboden. Anbieter, die bei aktuellen Preisen nicht wirtschaftlich arbeiten können, werden ausscheiden und das Angebot schließlich stabilisieren. Die Marktbereinigung kann Quartale dauern, während Betreiber mit unterschiedlichen Kostenstrukturen konkurrieren.

Cloud-Kunden

Organisationen, die GPU-Kapazität mieten, profitieren direkt von Preissenkungen. Projekte, die bei 8 Dollar pro Stunde unwirtschaftlich waren, werden bei 2,50 Dollar pro Stunde rentabel. Die Zugänglichkeit ermöglicht breitere KI-Experimente und -Implementierungen.

Allerdings erschwert Preisvolatilität die Planung. Organisationen, die sich langfristig auf GPU-Kapazität festlegen, sind unsicher, ob aktuelle Preise faire Werte oder vorübergehendes Überangebot darstellen. Kürzere Verpflichtungen bieten Flexibilität, könnten aber günstige Preise verpassen, wenn das Angebot knapper wird.

Positionierung der Hyperscaler

IBM-CEO Arvind Krishna stellte öffentlich in Frage, ob Hyperscaler-KI-Infrastrukturinvestitionen Renditen erzielen werden, und erklärte, dass die Mathematik bei aktuellen Ausgabenniveaus „auf keinen Fall" aufgeht.13 Der GPU-Preisverfall liefert Skeptikern unterstützende Beweise, während er GPU-Verbrauchern zugutekommt.

Amazon-CEO Andy Jassy konterte, dass Kapazität „so schnell verbraucht wird, wie wir sie bereitstellen", was auf anhaltende Nachfrage trotz Preisrückgängen hindeutet.14 Das Volumenwachstum kann den Preisrückgang kompensieren, aber die Margen stehen branchenweit unter Druck.

Ausblick auf die nächste Generation

Die H100-Preisentwicklung informiert die Erwartungen an neuere GPU-Generationen.

Blackwell-Einführung

NVIDIA Blackwell GPUs werden ausgeliefert, wobei GB200-Systeme bei Kunden ankommen. Die Architektur der nächsten Generation bietet erhebliche Leistungsverbesserungen gegenüber H100. Die anfängliche Blackwell-Verfügbarkeit bleibt begrenzt, mit Premium-Preisen, die die Knappheit widerspiegeln.

Die H100-Preise könnten weiter fallen, wenn die Blackwell-Verfügbarkeit steigt. Organisationen, die mit der H100-Leistung zufrieden sind, können von weiteren Preisrückgängen profitieren. Diejenigen, die Blackwell-Fähigkeiten benötigen, werden Aufpreise zahlen, bis sich das Angebot normalisiert.

Mittelfristige Prognosen

Mittelfristige Prognosen deuten auf einen möglichen Rückgang von 10-20% hin, wenn B200-GPUs 2026 breiter auf den Markt kommen.15 Der Einführungszyklus könnte das H100-Muster wiederholen: anfängliche Knappheit mit Premium-Preisen, gefolgt von Angebotsausweitung und Preisnormalisierung.

Organisationen sollten bei der Planung von Infrastrukturinvestitionen das Timing der GPU-Generation berücksichtigen. Das Warten auf neuere Generationen bietet Leistungsvorteile, verzögert aber die Bereitstellung. Hardware der aktuellen Generation zu sinkenden Preisen ermöglicht sofortige Bereitstellung.

Aktueller Preisvergleich

Anbieter H100 On-Demand H100 Spot Commitment-Tarif
AWS P5 3,50 $/Std. ~2,50 $/Std. 1,90-2,10 $/Std. (1 Jahr)
GCP A3-High 3,25 $/Std. 2,25 $/Std. ~2,00 $/Std. (1 Jahr)
Azure ND H100 3,40 $/Std. ~2,60 $/Std. ~2,15 $/Std. (1 Jahr)
RunPod 2,39 $/Std. 1,87 $/Std. N/A
Vast.ai Variabel 1,80-2,50 $/Std. N/A
Lambda 2,49 $/Std. N/A 1,99 $/Std. (reserviert)

Preise Stand Dezember 2025. Spot-Preise schwanken je nach Verfügbarkeit.

Entscheidungsrahmen: Mieten vs. Kaufen vs. Warten

Szenario Empfehlung Begründung
Variable Workload (<50% Auslastung) Mieten (Spot) Flexibilität überwiegt Eigentumsersparnisse
Konstante Workload (>70% Auslastung) Eigentum prüfen Break-even bei aktuellen Preisen erreichbar
>100.000 $/Monat GPU-Ausgaben Eigene Infrastruktur Klarer ROI bei nachhaltiger Auslastung
Unsicherer 12-Monats-Ausblick Kurzfristige Miete Stranded Assets bei Nachfrageverschiebung vermeiden
Training großer Modelle Kaufen oder reservieren Konsistente Kapazität kritisch

Break-even-Analyse: - H100-Kaufpreis: ~25.000-30.000 Dollar pro GPU - Bei 2,50 $/Std. Miete: 10.000-12.000 Stunden bis Break-even (~14-16 Monate bei 100% Auslastung) - Bei 1,65 $/Std. Miete: Anbieter können Investition nicht decken11 - Rentabilitätsschwelle: 2,85 $/Std., um Börsen-IRR zu schlagen12

Handlungsschritte: 1. Aktuelle Ausgaben prüfen: Effektive Stundenkosten über alle GPU-Nutzung berechnen 2. Auslastung bewerten: Tatsächliche vs. reservierte Kapazitätsnutzung messen 3. Commitment-Optionen evaluieren: 1-Jahres-Reservierungspreise vs. On-Demand vergleichen 4. Hybrid erwägen: Kaufen für Grundlast, Mieten für Spitzenkapazität

Professionelle Beratung

Infrastrukturentscheidungen in volatilen Märkten profitieren von erfahrener Perspektive.

Introls Netzwerk von 550 Außendiensttechnikern unterstützt Organisationen bei der Navigation durch GPU-Infrastrukturökonomie.16 Das Unternehmen belegte 2025 Platz 14 in der Inc. 5000 mit 9.594% Dreijahreswachstum.17

Expertise an 257 globalen Standorten bietet Markteinblicke unabhängig von der Geografie.18 Professionelle Beratung hilft Organisationen, fundierte Entscheidungen zu treffen, während sich die Preise entwickeln.

Wichtigste Erkenntnisse

Für Einkaufsteams: - H100-Preise um 64% gefallen, von 8 $/Std. auf 2,85-3,50 $/Std. - Über 300 neue Anbieter intensivieren den Wettbewerb - Spot-Preise (GCP 2,25 $, AWS 2,50 $) bieten besten Wert für flexible Workloads

Für Infrastrukturplaner: - Break-even bei Eigentum: 14-16 Monate bei 100% Auslastung - Anbieter-Rentabilitätsboden: ~1,65 $/Std. (Preise werden kaum weiter fallen) - Commitment-Preise (1,90-2,10 $/Std.) schlagen On-Demand um 40%+

Für strategische Planung: - Markt normalisiert sich nach Knappheit 2023-2024 – kein vorübergehender Rückgang - Blackwell-Einführung könnte H100-Preise 2026 weiter drücken - Mietflexibilität wertvoll, da sich Technologie schnell entwickelt

Ausblick

Der GPU-Cloud-Preisverfall stellt eine Marktnormalisierung nach den Knappheitsbedingungen von 2023-2024 dar. Organisationen profitieren von dramatisch verbesserter GPU-Zugänglichkeit, die breitere KI-Implementierung ermöglicht. Das Preisumfeld kann anhalten, da das Angebotswachstum weiterhin die Nachfrage bedient, wobei Einführungen der nächsten Generation das Muster möglicherweise fortsetzen.

Organisationen sollten die aktuellen Preise für unmittelbare Anforderungen nutzen und gleichzeitig Flexibilität für die Marktentwicklung bewahren. Die erfolgreichsten Strategien werden die Dringlichkeit der Bereitstellung mit Markt-Timing-Überlegungen abwägen und Mietflexibilität nutzen, um vorzeitige Kapitalbindung in einem sich schnell entwickelnden Markt zu vermeiden.

Referenzen


Dringlichkeit: Hoch — Marktverschiebung mit unmittelbaren Beschaffungsimplikationen Wortanzahl: ~1.800


  1. Thunder Compute. "AI GPU Rental Market Trends December 2025." Dezember 2025. https://www.thundercompute.com/blog/ai-gpu-rental-market-trends 

  2. Silicon Data. "H100 Rental Market Cools in September." September 2025. https://www.silicondata.com/blog/h100-rental-market-update-september-2025 

  3. Thunder Compute. "AI GPU Rental Market Trends December 2025." Dezember 2025. 

  4. IntuitionLabs. "H100 Rental Prices: A Cloud Cost Comparison." November 2025. https://intuitionlabs.ai/articles/h100-rental-prices-cloud-comparison 

  5. IntuitionLabs. "H100 Rental Prices: A Cloud Cost Comparison." November 2025. 

  6. Thunder Compute. "AI GPU Rental Market Trends December 2025." Dezember 2025. 

  7. Silicon Data. "H100 Rental Market Cools in September." September 2025. 

  8. Thunder Compute. "AI GPU Rental Market Trends December 2025." Dezember 2025. 

  9. IntuitionLabs. "H100 Rental Prices: A Cloud Cost Comparison." November 2025. 

  10. Thunder Compute. "AI GPU Rental Market Trends December 2025." Dezember 2025. 

  11. Cybernews. "AI boom paradox leads to GPU rental market crash." 2025. https://cybernews.com/tech/gpu-rental-prices-are-crashing/ 

  12. Cybernews. "AI boom paradox leads to GPU rental market crash." 2025. 

  13. Fortune. "IBM CEO warns there's 'no way' hyperscalers will turn a profit." Dezember 2025. https://fortune.com/2025/12/03/ibm-ceo-no-way-hyperscalers-google-amazon-turn-profit-data-center-spending/ 

  14. CIO Dive. "'We're not dabbling here': AWS backs infrastructure investments." Dezember 2025. https://www.ciodive.com/news/aws-ai-cloud-infrastructure-capacity-microsoft-google/746998/ 

  15. Thunder Compute. "AI GPU Rental Market Trends December 2025." Dezember 2025. 

  16. Introl. "Company Overview." Introl. 2025. https://introl.com 

  17. Inc. "Inc. 5000 2025." Inc. Magazine. 2025. 

  18. Introl. "Coverage Area." Introl. 2025. https://introl.com/coverage-area 

Angebot anfordern_

Erzählen Sie uns von Ihrem Projekt und wir antworten innerhalb von 72 Stunden.

> ÜBERTRAGUNG_ABGESCHLOSSEN

Anfrage erhalten_

Vielen Dank für Ihre Anfrage. Unser Team wird Ihre Anfrage prüfen und innerhalb von 72 Stunden antworten.

ZUR BEARBEITUNG EINGEREIHT