Das Platzen der H100-GPU-Blase: Warum die GPU-Preise von 8 $ auf 2 $ gefallen sind

Nach der Veröffentlichung von ChatGPT im November 2023 stieg die Nachfrage nach H100-GPUs sprunghaft an, wodurch die stündlichen Mietpreise von 4,70 $ auf über 8 $ kletterten
Rechenzentrumsanbieter gingen davon aus, dass sich bei einer Vermietung von H100s zu Preisen von über 4,50 $ pro Stunde die Investition in weniger als zwei Jahren amortisieren würde
Bis August 2024 fielen die Mietpreise für H100-GPUs in kleinen Clustern jedoch auf 1–2 $

Renditeschwelle für H100-Investitionen in Rechenzentren

Der Aufstieg von Open-Weight-Modellen erhöhte die Nachfrage nach Inference und Fine-Tuning
Gleichzeitig schrumpfte der Markt für kleine und mittlere Anbieter von Foundation Models
- Viele Unternehmen und Startups erkannten, dass es wirtschaftlicher und effektiver ist, bestehende Open-Weight-Modelle feinzujustieren, statt eigene Modelle zu trainieren
- Startups und Unternehmen ohne Pläne zum Training großer Modelle mit mehr als 70B Parametern zogen ihre Investitionen zurück
Viele Infrastrukturanbieter sichern ihre Gewinne über langfristige Verträge mit Laufzeiten von 3–5 Jahren
- Dies wurde während des AI-Hypes 2023 von verschiedenen Foundation-Model-Unternehmen durchgesetzt
- Nicht genutzte Kapazitäten reservierter Nodes werden inzwischen weiterverkauft
Da große Modellentwickler wie Facebook und Microsoft eigene Cluster aufbauen, sinkt die Nachfrage nach bestehenden Clustern
ChatGPT wurde im November 2022 mit der A100-Serie eingeführt, H100 kam im März 2023 hinzu. H100 war dreimal leistungsfähiger als A100, kostete aber nur doppelt so viel
Das Auftreten alternativer GPUs wie AMD MI300 und Intel Gaudi3 als Ersatz für H100
Durch Ethereums Wechsel zu Proof of Stake und die Dominanz von ASICs beim Bitcoin-Mining ging die Nachfrage nach GPU-Mining zurück

Die durchschnittlichen Kosten einer H100-GPU liegen bei über 50k $, und bei angenommener Lebensdauer von fünf Jahren existieren verschiedene Mietmodelle
- Bei mehr als 2,85 $ pro Stunde kann die IRR den Aktienmarkt schlagen, darunter können jedoch Verluste entstehen
Neue Investitionen in H100-Hardware werden voraussichtlich mit hoher Wahrscheinlichkeit Verluste verursachen
- Ausgenommen sind Sonderfälle wie rabattierte H100s, Strompreise oder spezielle Kundenanforderungen
Gleichzeitig dürften fallende H100-Preise als Katalysator für die Verbreitung von Open-Weight-AI wirken
- Es wird erwartet, dass Entwickler und Engineers verstärkt mit offenen Modellen experimentieren und Anwendungen entwickeln
Featherless.AI bietet sofortige Inference für mehr als 2.000 Open-Source-AI-Modelle zu einem Fixpreis von 10 $ pro Monat
- Zur Sicherung der Hardware-Rentabilität sind Optimierung auf allen Ebenen und die Auswahl maßgeschneiderter GPUs essenziell

Veränderungen im GPU-Markt: Der Preisrückgang bei H100-GPUs zeigt, wie schnell sich der GPU-Markt verändert. Das hat große Auswirkungen auf Investoren und Infrastrukturanbieter
Einfluss von Open-Source-Modellen: Das Auftreten von Open-Source-Modellen wie Llama 3 erhöht die Nachfrage nach Fine-Tuning und Inference. Gleichzeitig sinkt die Nachfrage nach dem Training großskaliger Modelle
Aufstieg alternativer GPUs: Da GPUs von AMD und Intel als Alternativen zur H100 aufkommen, verschärft sich der Wettbewerb im Markt. Das könnte zusätzlichen Druck auf die GPU-Preise ausüben
Chancen für AI-Anwendungen: Sinkende GPU-Kosten senken die Eintrittsbarrieren für die Entwicklung von AI-Anwendungen und könnten mehr Innovation fördern
Investitionsstrategie muss neu gedacht werden: Investitionen in GPU-Infrastruktur erfordern einen vorsichtigen Ansatz und eine genaue Beobachtung der Markttrends