AWS hat am Samstag die GPU-Preise um 15 % erhöht – und hoffte womöglich, dass es niemand bemerkt
(theregister.com)- AWS hat die Preise für EC2 Capacity Blocks for ML um etwa 15 % erhöht; die Stundensätze für die Instanzen p5e.48xlarge und p5en.48xlarge stiegen in den meisten Regionen jeweils von 34,61 $ auf 39,80 $ bzw. 36,18 $ auf 41,61 $
- In der Region US West (Northern California) fiel die Erhöhung mit 43,26 $ auf 49,75 $ noch stärker aus
- AWS erklärte per E-Mail, die Anpassung spiegele Angebots- und Nachfragemuster wider
- Die Erhöhung erfolgte nach der früheren Ankündigung von Preissenkungen um bis zu 45 % für GPU-Instanzen (vor 7 Monaten) und ist ein seltener Fall einer direkten Preiserhöhung durch AWS
- Der Vorgang gilt als Bruch mit der stillschweigenden Regel sinkender Preise in der Cloud-Branche und könnte künftig auch andere Resource-Services betreffen
Überblick über die GPU-Preiserhöhung von AWS
- AWS hat am Wochenende, an einem Samstag, die Preise für EC2 Capacity Blocks for ML um rund 15 % erhöht
- Die Instanz p5e.48xlarge stieg pro Stunde von 34,61 $ auf 39,80 $, p5en.48xlarge von 36,18 $ auf 41,61 $
- In der Region US West (Northern California) stieg der Preis noch stärker, von 43,26 $ auf 49,75 $
- Auf der offiziellen AWS-Preisseite stand zwar, dass die Preise im Januar 2026 aktualisiert würden, die Richtung der Änderung wurde jedoch nicht genannt
- AWS erklärte per E-Mail, die Preise schwankten je nach Angebots- und Nachfragemustern; diese Anpassung spiegele die erwarteten Muster des betreffenden Quartals wider
Charakter von Capacity Blocks und Nutzergruppe
- Capacity Blocks sind ein Modell, bei dem GPU-Ressourcen für einen bestimmten Zeitpunkt reserviert und garantiert werden, um ML-Trainingsjobs stabil auszuführen
- GPU-Instanzen können für einen festgelegten Zeitraum von einem Tag bis einige Wochen im Voraus reserviert werden, bezahlt wird vorab zu einem festen Preis
- Die Kunden dieses Dienstes sind überwiegend Unternehmensteams mit großen ML-Projekten, deren Budgets oft im Millionen-Dollar-Bereich liegen
- AWS hatte vor 7 Monaten die Preise für On-Demand- und Savings-Plan-GPU-Instanzen um bis zu 45 % gesenkt, die aktuelle Erhöhung gilt jedoch nur für Capacity Blocks
Auswirkungen auf Branche und Kunden
- AWS hat zwar auch früher Preise angepasst, doch eine direkte Preiserhöhung (line-item increase) ist selten
- Üblicher war bislang, die Preisstruktur zu ändern oder zu betonen, dass dies für die meisten Kunden effektiv eine Senkung bedeute
- Die aktuelle Erhöhung liefert Azure und GCP einen günstigen Vergleichspunkt
- Beide Wettbewerber werben aktiv um ML-Workloads; die Aussage, dass AWS die GPU-Preise um 15 % erhöht hat, könnte als Vertriebsargument genutzt werden
- Für Unternehmenskunden im Enterprise Discount Program (EDP) steigen die tatsächlichen Kosten trotz gleichbleibender Rabattsätze, weil der Basispreis höher ist
Marktlage und Ausblick
- Da das GPU-Angebot weltweit begrenzt ist, wird die Erhöhung als Signal eines Ungleichgewichts von Angebot und Nachfrage interpretiert
- AWS hat über 20 Jahre die Wahrnehmung geprägt, dass Preise immer sinken – diese Grundannahme wird durch den aktuellen Schritt erschüttert
- Wenn nach einer ersten Erhöhung die Marktreaktion gering bleibt, steigt die Wahrscheinlichkeit weiterer Preiserhöhungen
- Erwähnt wird auch die Möglichkeit ähnlicher Anpassungen bei anderen Diensten, etwa Graviton-Instanzen oder Datenübertragungskosten
- Im Artikel heißt es, der Glaube, dass Cloud-Preise sich nur in eine Richtung bewegen, sei an einem Samstag im Januar 2026 verschwunden
Fazit
- Die aktuelle GPU-Preiserhöhung wird als Wendepunkt in der AWS-Preispolitik bewertet
- Sie erschüttert das Vertrauen in die Kostenstabilität im Cloud-Markt und nährt die Erwartung, dass bei Ressourcen mit Angebotsengpässen weitere Preiserhöhungen folgen könnten
1 Kommentare
Hacker-News-Kommentare
Wenn man sieht, dass die Preise für GPU, RAM und Festplatten alle steigen, stellt man sich am Ende eine Zukunft vor, in der Heimcomputer durch Thin Clients ersetzt werden und sämtliche Rechenarbeit in Abo-Dienste wandert
Parolen wie „Du brauchst keinen Speicherplatz, nutze ein Cloud-Abo“ oder „Du brauchst keine Rechenleistung, streame einfach Spiele“ könnten Realität werden
Spielefirmen prüfen bereits Modelle mit Abrechnung pro Stunde, sodass sich die Struktur von Spielen wie Call of Duty oder GTA komplett verändern könnte
Physische Datenträger könnten verschwinden, auch der iPhone-Speicher könnte schrumpfen und alles könnte zwangsweise in iCloud landen
Das ruft auch das Bild einer Gesellschaft hervor, in der man statt Autos zu besitzen autonome Fahrzeuge teilt und Offline-Supermärkte schließen, während Drohnenlieferungen dominieren
Die Formulierung „hopes you weren't paying attention“ im Artikeltitel wirkt übertrieben reißerisch
Es scheint schlicht das Marktprinzip zu sein, dass die Nachfrage nach GPU und RAM das Angebot übersteigt
Zur Meldung über die AWS-Preiserhöhung wurde angemerkt, dass dort zwar „Update geplant“ stand, aber nicht klar gesagt wurde, in welche Richtung es geht, also ob die Preise steigen oder fallen
Wer bereits Kunde ist, schaut nicht jeden Tag auf die Preisseite, daher ist so eine Mitteilung faktisch intransparente Kommunikation
Es gab Kritik daran, dass der Abschreibungszeitraum für GPUs von 3 auf 5 Jahre verlängert werde, aber diese Preiserhöhung scheint eher zu zeigen, dass die wirtschaftliche Lebensdauer von GPUs länger wird
Cloud-AI ist für die meisten Unternehmen kaum mehr als eine Bequemlichkeitssteuer
Dokumente, Vorhersagen, Monitoring, Support und Steuerungssysteme lassen sich mit lokalen Modellen ausreichend abdecken. Wenn man Datengravitation, Latenz und Datenschutz berücksichtigt, ist eigene Edge-Hardware vernünftiger
Auf die gesamte AI-Branche dürfte bald ein Preisschock zukommen
AI saugt sämtliche Ressourcen auf und erstickt andere Branchen
Jemand fragte, ob es einen Dienst gibt, der GPU-Preisänderungen stündlich verfolgt
Ich habe mich gefreut zu sehen, dass Corey Quinn bei The Register auftauchte
Durch den massiven GPU-Einkauf steigen die Investitionsausgaben und treiben die Nachfrage nach anderen Komponenten wie Speicher mit nach oben
Aber es ist fraglich, wie stark diese GPUs tatsächlich genutzt werden. Man fragt sich, ob wir nicht für ungenutzte Bestände mitbezahlen