- HBM stieg im produktionsmengengewichteten Durchschnitt von Nvidia-, AMD-, Google- und Amazon-AI-Chips von 52 % im 1. Quartal 2024 auf 63 % im 4. Quartal 2025
- Im selben Zeitraum blieb der Anteil der Logik-Dies mit rund 13 % nahezu unverändert, während Advanced Packaging von 19 % auf 15 % und unterstützende Komponenten von 15 % auf 9 % zurückgingen
- Die HBM-Ausgaben der vier Chipdesigner stiegen von rund 12 Milliarden US-Dollar im Jahr 2024 auf 32 Milliarden US-Dollar im Jahr 2025 und wuchsen damit im Jahresvergleich schneller als die anderer Komponenten
- Die gesamten Ausgaben für AI-Chip-Komponenten stiegen von rund 22 Milliarden US-Dollar auf 52 Milliarden US-Dollar, wobei HBM allein rund 20 Milliarden US-Dollar des Zuwachses ausmachte
- 2026 könnte der Kostendruck durch Speicherknappheit und steigende Preise weiter zunehmen; auch Microsoft und Meta nannten höhere Komponentenpreise als Grund für steigende Investitionsausgaben
Zentrale Veränderungen
- Der Anteil von High Bandwidth Memory (HBM) an den Ausgaben für AI-Chip-Komponenten stieg von 52 % im 1. Quartal 2024 auf 63 % im 4. Quartal 2025
- Diese Schätzung ist ein produktionsmengengewichteter Durchschnitt über alle von Nvidia, AMD, Google und Amazon entwickelten AI-Chips
- Im selben Zeitraum blieb der Anteil der Logik-Dies mit etwa 13 % nahezu unverändert, während Advanced Packaging von 19 % auf 15 % und unterstützende Komponenten von 15 % auf 9 % zurückgingen
- Die HBM-Ausgaben der vier Chipdesigner stiegen von rund 12 Milliarden US-Dollar im Jahr 2024 auf 32 Milliarden US-Dollar im Jahr 2025 und wuchsen damit im Jahresvergleich schneller als die anderer Komponenten
- Die gesamten Ausgaben für AI-Chip-Komponenten stiegen von rund 22 Milliarden US-Dollar im Jahr 2024 auf etwa 52 Milliarden US-Dollar im Jahr 2025, wobei HBM-Ausgaben allein rund 20 Milliarden US-Dollar des Zuwachses ausmachten
Kostendruck im Jahr 2026
- HBM könnte 2026 einen noch größeren Kostenanteil ausmachen, da Lieferengpässe und steigende Preise bei Speicher anhalten
- Microsofts CapEx-Prognose von 190 Milliarden US-Dollar für das Geschäftsjahr 2026 enthält rund 25 Milliarden US-Dollar an zusätzlichen Kosten durch gestiegene Komponentenpreise
- Meta hat seine CapEx-Spanne für 2026 um 10 Milliarden US-Dollar angehoben und höhere Komponentenpreise als Begründung genannt
Berechnungsmethode und Datenumfang
- Für jeden von Nvidia, AMD, Google und Amazon entwickelten AI-Chip wurden die Kosten pro Chip für Speicher, Logik-Die, Advanced Packaging und unterstützende Komponenten geschätzt
- Die gesamten Komponentenausgaben je Kategorie wurden berechnet, indem die Komponenten kosten jedes Chips mit der geschätzten Produktionsmenge pro Quartal multipliziert wurden; daraus wurde der Anteil an den gesamten Komponentenausgaben von Q1 2024 bis Q4 2025 ermittelt
- Die Kostenschätzungen für die Komponenten stammen aus dem AI Chip Components explorer und basieren auf Finanzberichten, Zuliefererdaten und Analystenberichten, aus denen stückbezogene Komponentenaufstellungen für die Chips erstellt wurden
- Die detaillierte Methodik ist in der explorer’s methodology documentation beschrieben
Komponentenkategorien
-
Speicher
- Enthalten sind HBM-Stacks, konkret HBM3 und HBM3e
-
Logik
- Enthalten sind Logik-Dies in fortschrittlichen 3- bis 5-nm-Prozessen
-
Packaging
- Enthalten ist TSMC CoWoS Advanced Packaging
-
Unterstützende Komponenten
- Enthalten sind Substrate, Stromversorgung und sonstige Eingabeelemente, die weder Logik noch Speicher sind
Umgang mit Unsicherheit
- Für die Stückkosten jeder Komponente, darunter HBM-Stack-Preise, Logik-Die-Preise und CoWoS-Paketpreise, besteht Kostenunsicherheit
- Die Kosten je Komponente für jeden Chip wurden mit einem 90-%-Konfidenzintervall modelliert
- Komponentenanteile sind der jeweilige Komponentenpreis geteilt durch die Gesamtkosten, daher sind sowohl Zähler als auch Nenner unsicher
- Es werden zwei Spannweiten angegeben
- Spannweite, wenn sich nur die Kosten dieser Komponente ändern: der Anteil, wenn diese Komponente beim 5. oder 95. Perzentil liegt und die drei anderen Komponenten beim Median bleiben
- Spannweite, wenn alle Komponenten Extremwerte annehmen: der Anteil, wenn diese Komponente an einem Ende des Konfidenzintervalls liegt und alle übrigen Komponenten gleichzeitig am entgegengesetzten Extrem liegen
Vierteljährliche Komponentenanteile
-
1. Quartal 2024
- Der Speicheranteil lag bei 52 %; die Spannweite betrug 48–56 %, wenn sich nur diese Komponente änderte, und 42–62 %, wenn alle Komponenten Extremwerte annahmen
- Der Logikanteil lag bei 14 %; die Spannweite betrug 12–17 %, wenn sich nur diese Komponente änderte, und 10–20 %, wenn alle Komponenten Extremwerte annahmen
- Der Packaging-Anteil lag bei 19 %; die Spannweite betrug 14–24 %, wenn sich nur diese Komponente änderte, und 12–27 %, wenn alle Komponenten Extremwerte annahmen
- Der Anteil unterstützender Komponenten lag bei 15 %; die Spannweite betrug 13–18 %, wenn sich nur diese Komponente änderte, und 11–21 %, wenn alle Komponenten Extremwerte annahmen
-
4. Quartal 2025
- Der Speicheranteil lag bei 63 %; die Spannweite betrug 60–67 %, wenn sich nur diese Komponente änderte, und 54–73 %, wenn alle Komponenten Extremwerte annahmen
- Der Logikanteil lag bei 13 %; die Spannweite betrug 10–16 %, wenn sich nur diese Komponente änderte, und 9–19 %, wenn alle Komponenten Extremwerte annahmen
- Der Packaging-Anteil lag bei 15 %; die Spannweite betrug 11–19 %, wenn sich nur diese Komponente änderte, und 9–22 %, wenn alle Komponenten Extremwerte annahmen
- Der Anteil unterstützender Komponenten lag bei 10 %; die Spannweite betrug 8–10 %, wenn sich nur diese Komponente änderte, und 7–12 %, wenn alle Komponenten Extremwerte annahmen
Annahmen und Grenzen
- Die Komponenten kosten können je nach Vertrag, Zulieferer und Zeitpunkt variieren, daher bestehen Unsicherheiten bei den geschätzten Kosten pro Chip
- Auch bei den geschätzten Chip-Produktionsmengen pro Quartal und der Zusammensetzung der Chiptypen bestehen Unsicherheiten; diese sind in den berichteten Anteilen berücksichtigt
Daten und Explorationstools
- AI chip component cost shares by quarter: CSV, aktualisiert am 21. Mai 2026
- AI Chip Components: Explorationstool für Verbrauchsdaten der AI-Chip-Lieferkette
1 Kommentare
Hacker-News-Kommentare
Für AI-Inference und Training scheint es einen Weg zu geben, die Hardwarekosten um etwa das Dreifache und die Gesamtkosten um etwa das Doppelte zu senken, selbst ganz ohne technologische Durchbrüche
Dafür müsste das DRAM-Angebot nur mit der Nachfrage Schritt halten; ob durch Ausbau der Fertigung oder dadurch, den Nachfrageschub mit dem aktuellen Produktionstempo aufzufangen, ist letztlich nur eine Frage der Zeit
An vielem, was Sam Altman kulturell in Umlauf gebracht hat, kann man Kritik üben, aber langfristig betrachtet ist die Aussage „Jetzt ist es das Schlechteste, was es je sein wird“ ein ziemlich interessanter und unterschätzter Punkt
In zehn Jahren wird das Training von LLMs auf heutigem Niveau wohl so selbstverständlich sein wie heute der Betrieb von Datenbanken. Schon das aktuelle Niveau ist recht fortgeschritten, und selbst unabhängig von Hardwarefortschritten gibt es mit besseren Reinforcement-Learning-Trainingssystemen noch viel Luft nach oben
Ich empfehle sehr, sich die GitHub- und HF-Projekte des Allen Institute anzusehen. Dort gibt es Open-Source-Trainingsmaterial, etwa zum Training von LLMs von Grund auf mit Common Crawl und interessante Qwen-Tunings, sodass man einen Eindruck davon bekommt, wie Dinge aussehen könnten, die bald Nachmittagsprojekte oder Lehrmaterial werden
Diese Branche neigt dazu, den Markt in einem Zustand von Unterversorgung zu halten, weil sonst die darauffolgende Überproduktion die Unternehmen ruiniert. Stattdessen wird Angebot aus weniger profitablen Bereichen wie Mobile und Personal Computing in profitablere Segmente umgeschichtet
IEEE-Gleitkomma ist bei geringer Bitbreite, besonders bei 16 Bit oder weniger, bekanntermaßen ziemlich schlecht. Formate wie posit sind bei 16 oder 8 Bit deutlich besser. Wenn man statt 32 Bit pro Wert mit 16 Bit trainieren könnte und der Genauigkeitsverlust viel geringer wäre als beim Wechsel von IEEE32 zu IEEE16, wäre das ziemlich relevant
Vor ein paar Jahren habe ich 96 GB RAM für etwa 250 Dollar gekauft, und derselbe RAM kostet jetzt 1.200 Dollar
Bei Amazon kostet dasselbe Kit jetzt 1.048,90 Dollar
Gebrauchte Enterprise-Speichermodule waren auf eBay wirklich spottbillig
Jetzt sind es etwa 22 Dollar pro Modul, also insgesamt ungefähr 350 Dollar. Ich habe keine Ahnung, wer überhaupt noch etwas mit DDR3 macht
Der Wert von ultraschnellen SSDs wie Optane könnte dadurch stark steigen
In allem, was ich lese, sieht es so aus, als würde die RAM-Kapazität pro Jahr um 20–25 % steigen, aber das scheint nicht auszureichen
Selbst für Consumer-Anwendungen wären Handys und Laptops mit doppelt so viel RAM deutlich besser, und von der AI-Nachfrage ganz zu schweigen
Es sieht nicht so aus, als würde dieser Trend verschwinden. Vielleicht wächst er nicht mehr so schnell wie jetzt, aber verschwinden wird er wohl nicht. Ich verstehe, warum Speicherhersteller sich nicht selbst ruinieren wollen, aber es müsste einen Weg geben, dieses Risiko an Modellanbieter oder andere Teilnehmer des Ökosystems weiterzugeben und die RAM-Kapazität eher um 50 % pro Jahr zu steigern
In einem Wettbewerbsmarkt ist es ineffizient, wenn RAM-Hersteller nicht an alle verkaufen, die kaufen wollen
Ich weiß nicht, wie hoch die Wachstumsrate vor Oktober tatsächlich war, aber irgendwer hier weiß das vermutlich
Dass 20–25 % Wachstum zu wenig sind, sehe ich ähnlich, aber wenn man annimmt, dass Rechenzentrums-Ausbaupläne an Grenzen stoßen und der AI-Hype abkühlt, dann ist das keine völlig abwegige Zahl
Kurzfristig reichen 20–25 % vielleicht nicht, aber wenn der AI-Ausbau noch dieses Jahr stoppt, entsteht statt Knappheit ein massives Überangebot
Damit könnten DRAM-Anbieter dieses Risiko absichern
Was wäre, wenn es unterm Strich vorteilhafter wäre, dass alle Computer z. B. nur mit einem Drittel der bisherigen Geschwindigkeit weniger kaufen und stattdessen komplett auf HBM umstellen?
Die Lücke zwischen Rechenleistung und Speicher wächst schon seit langer Zeit, und vielleicht ist genau der schmerzhafte Umstieg auf HBM nötig
Ist es besser, drei Mittelklasse-Computer mit geringer Speicherbandbreite zu haben, oder statistisch etwas länger zu warten, damit alle neue Computer kaufen, die flächenbedingt nur ein Drittel so schnell sind, dafür aber viel höhere Bandbreite bieten?
Wenn ich mir den aktuellen Verlauf ansehe, frage ich mich wirklich, wie man Consumer-Märkte wie Gaming oder Machine Learning stemmen will
Cloud-Gaming wird sicher in der Zukunft ankommen, und nur Puristen wie ich werden wohl noch eine RTX 5090 kaufen und für Offline-Gaming einen Aufpreis zahlen
Denn es ist wirtschaftlich effizienter, die für Grafik-Rendering nötigen Hardwarekosten auf mehrere Verbraucher zu verteilen, ungenutzte Ressourcen nicht brachliegen zu lassen und sie zusammen mit den Spiel-Assets in POPs zu platzieren
Wenn genug Game-Compute am Edge läuft, werden dadurch auch technisch fortschrittlichere Spiele möglich, die heute wirtschaftlich kaum tragfähig sind. Dass es davon aktuell nicht viele gibt, liegt meiner Meinung nach vor allem am noch kleinen Cloud-Gaming-Markt und an entsprechend fehlendem technischen Know-how
In dem Moment, in dem die Kosten dafür, die gewünschten Spiele auf Consumer-Hardware zu rendern, nicht mehr tragbar sind, werden selbst die Hartnäckigen am Ende überzeugt werden und dieses Modell wird sich etablieren
Ich werde mein DDR4-Build nicht verlassen, bis die Preise zumindest teilweise wieder vernünftig geworden sind
Ich habe noch 32 GB DDR4-2133MHz-Backup-RAM von früher und nutze derzeit 3200MHz. Das heißt auch, dass CPU-Hersteller mein Geld nicht bekommen. Ein 5800X reicht mir noch eine ganze Weile, und ich habe auch keinen Grund, eine neue GPU zu kaufen. Klar, die B580 ist nicht perfekt, aber trotzdem
Es ist ziemlich ironisch, dass der Iran die Heliumversorgung blockiert hat
Gleichzeitig ist der Iran darauf angewiesen, von AI erzeugte minderwertige Propaganda zu nutzen, um feindliche Staaten zu destabilisieren. Das wirkt wie eine dieser historischen Ironien, die erst im Nachhinein sichtbar werden
Für Gamer und PC-Hobbyisten, die nicht völlig auf AI fixiert sind, ist das wirklich eine schreckliche Zeit
Als ich anfing, Gaming-PCs zusammenzubauen, kostete die Top-Grafikkarte 750 neuseeländische Dollar. Heute kostet allein die GPU 10.000 Dollar und dazu kommen noch einmal 1.000–2.000 Dollar für RAM
Früher war ein Gaming-PC ein erschwingliches Hobby, heute wirkt sogar die allgemeine Fliegerei wie eine Alternative
Kurzfristig steht die Hobby-Szene zwar unter Druck, aber das Kapital, das nötig ist, um den neuesten Stand voranzutreiben, ist im Vergleich zu Fortune-500-Unternehmen gering. Schon bald wird auch die Hobby-Szene profitieren, besonders wenn der Markt zusammenbricht
Ich frage mich, warum Hyperscaler sich nicht stärker vertikal integrieren und eigene Fabs bauen
Selbst wenn eine Fab nur 1 Milliarde Dollar kosten würde, geben sie derzeit Hunderte Milliarden Dollar für Chips von Nvidia und anderen aus
Aber die Tatsache, dass Hyperscaler und AI-Unternehmen das nicht tun, sagt viel darüber aus, wie sehr sie selbst an die zukünftige AI-Nachfrage glauben
AI-Unternehmen behaupten, eine gewaltige Skalierung sei nötig, wollen aber das dafür erforderliche Kapitalrisiko nicht tragen
Man hört viele klagende Stimmen aus der AI-Ecke, dass Chip-Hersteller sie ausbremsen, aber wer hat denn tatsächlich das Geld, um diese Expansion problemlos zu finanzieren? Die Chiphersteller spielen dieses Spiel schon viel länger. Als Sam Altman überall davon sprach, dass Fabs im Wert von 7 Billionen Dollar nötig seien, haben AI-Unternehmen gezeigt, dass sie zu absurden Behauptungen bereit sind, und damit Vertrauen verspielt
Was jetzt gebraucht wird, ist, dass sie einen sehr kleinen Teil ihrer riesigen Cash-Reserven direkt in die Finanzierung von Fabs lenken
Das ist so etwas wie die „Raketenwissenschaft“ unserer Zeit, und Geld allein reicht nicht. Man kann sehr leicht Milliarden verbrennen und am Ende nichts vorweisen
Man muss sich nur ansehen, wie schwer sich Intel in den letzten Jahren im Wettbewerb getan hat. Das ist ein Unternehmen, das seit Jahrzehnten in diesem Geschäft ist
Ohne dieses Know-how bräuchte es zusätzliche Experimente, bevor man überhaupt mit etablierten Herstellern konkurrieren kann. Bis man brauchbare Chips produzieren könnte, wäre die Knappheit womöglich längst vorbei
Es ist wahrscheinlich einfach kein Geschäft, in das sie sich integrieren möchten
Außerdem erfordert sie Fachwissen, das keines dieser Unternehmen besitzt
Ich habe vor einer Woche einen gebrauchten Dell-Server gekauft
Das komplette System mit 12-Kern-CPU und 32 GB DDR4-ECC-RAM kostete ungefähr so viel wie 64 GB DDR-RAM allein. Ich hoffe, dass diese absurde Situation bald endet. Sonst wird sich der Schmerz auf andere Märkte ausweiten. Ich habe kürzlich gelesen, dass die Verkäufe von PC-Gehäusen um mehr als 40 % eingebrochen sind
https://www.cnet.com/tech/mobile/smartphone-sales-to-plummet...
Hersteller, die auf „Enterprise“-Komponenten umgeschwenkt sind, werden nicht zum Markt für Consumer-Komponenten zurückkehren, weil es ihn dann nicht mehr geben wird
Und wenn es dann zu viele Rechenzentren gibt, die mit minderwertigen generierten Inhalten kein Geld verdienen können, werden sie für SaaS-Zwecke umgewidmet. So in der Art, dass sich etwas wie OnShape auf alle Anwendungen ausdehnt
Die meisten Nutzer scheinen wenig Probleme damit zu haben, alles, was sie erzeugen, in einem Cloud-Service zu speichern, und das lässt sich leicht als Alternative zum Besitz „teurer“ Desktop- oder Laptop-Hardware verkaufen
Wenn Hyperscaler mehr RAM verwenden und dieser RAM nicht an Verbraucher geht, dann bedeutet das, dass schwere Workloads vollständig in der Cloud stattfinden
Warum sollten Hyperscaler und Verbraucher gleichzeitig RAM besitzen müssen? Verbraucher wollen mehr RAM, um lokale Modelle auszuführen, aber dann würde die Kapazität der Hyperscaler brachliegen
Speicherhersteller sitzen auf einem Berg an geistigem Eigentum
Selbst wenn also jemand freie Fab-Kapazität hätte und in die Speicherfertigung einsteigen wollte, müsste er gegen massive Patentbarrieren ankämpfen
Die meisten Speicherunternehmen haben untereinander informelle Absprachen, bei denen sie ihre jeweiligen Patentverletzungen gegenseitig verrechnen
Ich sehe nicht, wie ein neuer Speicherhersteller entstehen soll, ohne an Lizenzkosten zu ersticken