1 Punkte von GN⁺ 2026-01-07 | 1 Kommentare | Auf WhatsApp teilen
  • AWS hat die Preise für EC2 Capacity Blocks for ML um etwa 15 % erhöht; die Stundensätze für die Instanzen p5e.48xlarge und p5en.48xlarge stiegen in den meisten Regionen jeweils von 34,61 $ auf 39,80 $ bzw. 36,18 $ auf 41,61 $
  • In der Region US West (Northern California) fiel die Erhöhung mit 43,26 $ auf 49,75 $ noch stärker aus
  • AWS erklärte per E-Mail, die Anpassung spiegele Angebots- und Nachfragemuster wider
  • Die Erhöhung erfolgte nach der früheren Ankündigung von Preissenkungen um bis zu 45 % für GPU-Instanzen (vor 7 Monaten) und ist ein seltener Fall einer direkten Preiserhöhung durch AWS
  • Der Vorgang gilt als Bruch mit der stillschweigenden Regel sinkender Preise in der Cloud-Branche und könnte künftig auch andere Resource-Services betreffen

Überblick über die GPU-Preiserhöhung von AWS

  • AWS hat am Wochenende, an einem Samstag, die Preise für EC2 Capacity Blocks for ML um rund 15 % erhöht
    • Die Instanz p5e.48xlarge stieg pro Stunde von 34,61 $ auf 39,80 $, p5en.48xlarge von 36,18 $ auf 41,61 $
    • In der Region US West (Northern California) stieg der Preis noch stärker, von 43,26 $ auf 49,75 $
  • Auf der offiziellen AWS-Preisseite stand zwar, dass die Preise im Januar 2026 aktualisiert würden, die Richtung der Änderung wurde jedoch nicht genannt
  • AWS erklärte per E-Mail, die Preise schwankten je nach Angebots- und Nachfragemustern; diese Anpassung spiegele die erwarteten Muster des betreffenden Quartals wider
Anzeige

Charakter von Capacity Blocks und Nutzergruppe

  • Capacity Blocks sind ein Modell, bei dem GPU-Ressourcen für einen bestimmten Zeitpunkt reserviert und garantiert werden, um ML-Trainingsjobs stabil auszuführen
    • GPU-Instanzen können für einen festgelegten Zeitraum von einem Tag bis einige Wochen im Voraus reserviert werden, bezahlt wird vorab zu einem festen Preis
  • Die Kunden dieses Dienstes sind überwiegend Unternehmensteams mit großen ML-Projekten, deren Budgets oft im Millionen-Dollar-Bereich liegen
  • AWS hatte vor 7 Monaten die Preise für On-Demand- und Savings-Plan-GPU-Instanzen um bis zu 45 % gesenkt, die aktuelle Erhöhung gilt jedoch nur für Capacity Blocks

Auswirkungen auf Branche und Kunden

  • AWS hat zwar auch früher Preise angepasst, doch eine direkte Preiserhöhung (line-item increase) ist selten
    • Üblicher war bislang, die Preisstruktur zu ändern oder zu betonen, dass dies für die meisten Kunden effektiv eine Senkung bedeute
  • Die aktuelle Erhöhung liefert Azure und GCP einen günstigen Vergleichspunkt
    • Beide Wettbewerber werben aktiv um ML-Workloads; die Aussage, dass AWS die GPU-Preise um 15 % erhöht hat, könnte als Vertriebsargument genutzt werden
    Anzeige
  • Für Unternehmenskunden im Enterprise Discount Program (EDP) steigen die tatsächlichen Kosten trotz gleichbleibender Rabattsätze, weil der Basispreis höher ist

Marktlage und Ausblick

  • Da das GPU-Angebot weltweit begrenzt ist, wird die Erhöhung als Signal eines Ungleichgewichts von Angebot und Nachfrage interpretiert
  • AWS hat über 20 Jahre die Wahrnehmung geprägt, dass Preise immer sinken – diese Grundannahme wird durch den aktuellen Schritt erschüttert
  • Wenn nach einer ersten Erhöhung die Marktreaktion gering bleibt, steigt die Wahrscheinlichkeit weiterer Preiserhöhungen
  • Erwähnt wird auch die Möglichkeit ähnlicher Anpassungen bei anderen Diensten, etwa Graviton-Instanzen oder Datenübertragungskosten
  • Im Artikel heißt es, der Glaube, dass Cloud-Preise sich nur in eine Richtung bewegen, sei an einem Samstag im Januar 2026 verschwunden

Fazit

  • Die aktuelle GPU-Preiserhöhung wird als Wendepunkt in der AWS-Preispolitik bewertet
  • Sie erschüttert das Vertrauen in die Kostenstabilität im Cloud-Markt und nährt die Erwartung, dass bei Ressourcen mit Angebotsengpässen weitere Preiserhöhungen folgen könnten

1 Kommentare

 
GN⁺ 2026-01-07
Hacker-News-Kommentare
  • Wenn man sieht, dass die Preise für GPU, RAM und Festplatten alle steigen, stellt man sich am Ende eine Zukunft vor, in der Heimcomputer durch Thin Clients ersetzt werden und sämtliche Rechenarbeit in Abo-Dienste wandert
    Parolen wie „Du brauchst keinen Speicherplatz, nutze ein Cloud-Abo“ oder „Du brauchst keine Rechenleistung, streame einfach Spiele“ könnten Realität werden
    Spielefirmen prüfen bereits Modelle mit Abrechnung pro Stunde, sodass sich die Struktur von Spielen wie Call of Duty oder GTA komplett verändern könnte
    Physische Datenträger könnten verschwinden, auch der iPhone-Speicher könnte schrumpfen und alles könnte zwangsweise in iCloud landen
    Das ruft auch das Bild einer Gesellschaft hervor, in der man statt Autos zu besitzen autonome Fahrzeuge teilt und Offline-Supermärkte schließen, während Drohnenlieferungen dominieren

    • Auch die Preise für Abo-Dienste steigen mit. Wer bereits einen Computer gekauft hat, kann ein paar Jahre durchhalten, aber Mietnutzer sind sofort betroffen
    • Ein zu Weihnachten geschenkter Wecker von Hatch.co funktioniert ohne ein 50-Dollar-Jahresabo nicht. Verbraucher sollten die Gesamtbetriebskosten (TCO) besser verstehen. Vielleicht sollte der Staat wie bei Haushaltsgeräten Aufkleber mit den jährlichen Kosten vorschreiben
    • Die Lieferkette ist derart fragil, dass bei 60 % Marktanteil von TSMC im Fall einer chinesischen Invasion Taiwans mehr als die Hälfte der weltweiten CPU- und GPU-Produktion ausfallen könnte. Dann würden iPhones womöglich gar nicht mehr verkauft und ein einzelner PC könnte 5.000 Dollar kosten
    • MMORPGs nutzen schon seit Langem Monatsabos. Bei den meisten Spielen würde ein Wechsel zu Abrechnung pro Stunde die Einnahmen aber wohl eher senken. Die Leute kaufen viele Spiele, spielen sie in Wirklichkeit aber kaum
    • Diese Entwicklung wurde bereits unter dem Begriff Technofeudalism theoretisiert (Wikipedia-Link)
  • Die Formulierung „hopes you weren't paying attention“ im Artikeltitel wirkt übertrieben reißerisch
    Es scheint schlicht das Marktprinzip zu sein, dass die Nachfrage nach GPU und RAM das Angebot übersteigt

    • Ein typisch reißerischer The-Register-Headline. Sie soll Klicks erzeugen, und diesmal hat das ganz offensichtlich funktioniert
    • Das Angebot an GPU und RAM ändert sich nicht plötzlich über ein Wochenende. Es gab keinen besonderen Grund, die Preise ausgerechnet am Samstag anzuheben
    • Dass die Preiserhöhung an einem Samstag angekündigt wurde, also an einem Tag, an dem Kunden nicht arbeiten, ist fragwürdig
    • Schon mit Schulökonomie lässt sich darauf hinweisen, dass solche Unternehmen bislang vor allem Schulden und schlechte Produktivität erzeugt haben
  • Zur Meldung über die AWS-Preiserhöhung wurde angemerkt, dass dort zwar „Update geplant“ stand, aber nicht klar gesagt wurde, in welche Richtung es geht, also ob die Preise steigen oder fallen
    Wer bereits Kunde ist, schaut nicht jeden Tag auf die Preisseite, daher ist so eine Mitteilung faktisch intransparente Kommunikation

    • In einem Kommentar wurde die AWS-Ankündigungsweise mit dem Witz aus Per Anhalter durch die Galaxis verspottet, das Schild habe „in einer abgeschlossenen Toilettenschublade“ gelegen
  • Es gab Kritik daran, dass der Abschreibungszeitraum für GPUs von 3 auf 5 Jahre verlängert werde, aber diese Preiserhöhung scheint eher zu zeigen, dass die wirtschaftliche Lebensdauer von GPUs länger wird

    • Ich bin kein Experte, aber steigende Preise könnten auch ein Signal für eine kürzere Lebensdauer sein. Sowohl sinkendes Angebot als auch steigende Nachfrage sind möglich. Vielleicht ist die GPU-Nachfrage inzwischen unelastisch, sodass die Preise noch weiter steigen
    • Es hängt davon ab, wie sehr NVIDIA Leistungssteigerungen übertrieben hat. Wenn Ergänzungen wie RL-Funktionen, die Trennung von prefill/decode oder strukturelle Verbesserungen wie nvfp4 die Effizienz erhöht haben, sind auch ältere Chips weiterhin nützlich
    • High-End-GPUs kann man tatsächlich mehr als 6 Jahre nutzen. Bei guter Kühlung sind auch fast 10 Jahre möglich. Besonders Modelle mit 80 GB VRAM oder mehr haben langfristig hohen Wert
  • Cloud-AI ist für die meisten Unternehmen kaum mehr als eine Bequemlichkeitssteuer
    Dokumente, Vorhersagen, Monitoring, Support und Steuerungssysteme lassen sich mit lokalen Modellen ausreichend abdecken. Wenn man Datengravitation, Latenz und Datenschutz berücksichtigt, ist eigene Edge-Hardware vernünftiger

    • Ich prototypisiere selbst LLMs für verschiedene Zwecke, aber das größere Problem als die Kosten ist Zuverlässigkeit. Der Unterschied zwischen 99,95 % und 99 % kann größere Verluste verursachen als Personalkosten. In Bereichen, in denen man das so berechnen kann, halte ich Menschen weiterhin für besser
  • Auf die gesamte AI-Branche dürfte bald ein Preisschock zukommen

    • Unser Team hat überhaupt keinen Plan für den Fall, dass API- und Infrastrukturkosten explodieren. Im Moment bauen wir AI-Funktionen fast gratis fürs Marketing ein, aber wenn echte Kosten anfallen, müssen wir sie vielleicht wieder entfernen
    • Am Ende wird viel Nutzung wohl zu chinesischen Open-Weight-Modellen abwandern. Abgesehen von Spitzenmodellen sind sie für die meisten Einsatzzwecke bereits mehr als gut genug
    • Dieser Schock wird nicht nur die AI-Branche treffen, sondern jede Branche
    • Auch ich mache mir als Claude-Nutzer Sorgen über solche Preissteigerungen
  • AI saugt sämtliche Ressourcen auf und erstickt andere Branchen

    • Philip K. Dick und Frank Herbert haben diese unveränderliche Struktur des Kapitalismus schon sehr treffend vorausgesehen
  • Jemand fragte, ob es einen Dienst gibt, der GPU-Preisänderungen stündlich verfolgt

    • Ich entwickle dafür seit einem Jahr computeprices.com als Side-Project
    • Dass AWS die Preise für bestimmte Instanzen erhöht hat, ist ungewöhnlich. Das größere Problem ist aber die Intransparenz, weil die Preise ohne Vorankündigung angehoben wurden. Aus Kundensicht zerstört das Vertrauen
  • Ich habe mich gefreut zu sehen, dass Corey Quinn bei The Register auftauchte

  • Durch den massiven GPU-Einkauf steigen die Investitionsausgaben und treiben die Nachfrage nach anderen Komponenten wie Speicher mit nach oben
    Aber es ist fraglich, wie stark diese GPUs tatsächlich genutzt werden. Man fragt sich, ob wir nicht für ungenutzte Bestände mitbezahlen