1 Punkte von GN⁺ 2 시간 전 | 1 Kommentare | Auf WhatsApp teilen
  • HBM stieg im produktionsmengengewichteten Durchschnitt von Nvidia-, AMD-, Google- und Amazon-AI-Chips von 52 % im 1. Quartal 2024 auf 63 % im 4. Quartal 2025
  • Im selben Zeitraum blieb der Anteil der Logik-Dies mit rund 13 % nahezu unverändert, während Advanced Packaging von 19 % auf 15 % und unterstützende Komponenten von 15 % auf 9 % zurückgingen
  • Die HBM-Ausgaben der vier Chipdesigner stiegen von rund 12 Milliarden US-Dollar im Jahr 2024 auf 32 Milliarden US-Dollar im Jahr 2025 und wuchsen damit im Jahresvergleich schneller als die anderer Komponenten
  • Die gesamten Ausgaben für AI-Chip-Komponenten stiegen von rund 22 Milliarden US-Dollar auf 52 Milliarden US-Dollar, wobei HBM allein rund 20 Milliarden US-Dollar des Zuwachses ausmachte
  • 2026 könnte der Kostendruck durch Speicherknappheit und steigende Preise weiter zunehmen; auch Microsoft und Meta nannten höhere Komponentenpreise als Grund für steigende Investitionsausgaben

Zentrale Veränderungen

  • Der Anteil von High Bandwidth Memory (HBM) an den Ausgaben für AI-Chip-Komponenten stieg von 52 % im 1. Quartal 2024 auf 63 % im 4. Quartal 2025
  • Diese Schätzung ist ein produktionsmengengewichteter Durchschnitt über alle von Nvidia, AMD, Google und Amazon entwickelten AI-Chips
  • Im selben Zeitraum blieb der Anteil der Logik-Dies mit etwa 13 % nahezu unverändert, während Advanced Packaging von 19 % auf 15 % und unterstützende Komponenten von 15 % auf 9 % zurückgingen
  • Die HBM-Ausgaben der vier Chipdesigner stiegen von rund 12 Milliarden US-Dollar im Jahr 2024 auf 32 Milliarden US-Dollar im Jahr 2025 und wuchsen damit im Jahresvergleich schneller als die anderer Komponenten
  • Die gesamten Ausgaben für AI-Chip-Komponenten stiegen von rund 22 Milliarden US-Dollar im Jahr 2024 auf etwa 52 Milliarden US-Dollar im Jahr 2025, wobei HBM-Ausgaben allein rund 20 Milliarden US-Dollar des Zuwachses ausmachten

Kostendruck im Jahr 2026

Berechnungsmethode und Datenumfang

  • Für jeden von Nvidia, AMD, Google und Amazon entwickelten AI-Chip wurden die Kosten pro Chip für Speicher, Logik-Die, Advanced Packaging und unterstützende Komponenten geschätzt
  • Die gesamten Komponentenausgaben je Kategorie wurden berechnet, indem die Komponenten kosten jedes Chips mit der geschätzten Produktionsmenge pro Quartal multipliziert wurden; daraus wurde der Anteil an den gesamten Komponentenausgaben von Q1 2024 bis Q4 2025 ermittelt
  • Die Kostenschätzungen für die Komponenten stammen aus dem AI Chip Components explorer und basieren auf Finanzberichten, Zuliefererdaten und Analystenberichten, aus denen stückbezogene Komponentenaufstellungen für die Chips erstellt wurden
  • Die detaillierte Methodik ist in der explorer’s methodology documentation beschrieben

Komponentenkategorien

  • Speicher

    • Enthalten sind HBM-Stacks, konkret HBM3 und HBM3e
  • Logik

    • Enthalten sind Logik-Dies in fortschrittlichen 3- bis 5-nm-Prozessen
  • Packaging

    • Enthalten ist TSMC CoWoS Advanced Packaging
  • Unterstützende Komponenten

    • Enthalten sind Substrate, Stromversorgung und sonstige Eingabeelemente, die weder Logik noch Speicher sind

Umgang mit Unsicherheit

  • Für die Stückkosten jeder Komponente, darunter HBM-Stack-Preise, Logik-Die-Preise und CoWoS-Paketpreise, besteht Kostenunsicherheit
  • Die Kosten je Komponente für jeden Chip wurden mit einem 90-%-Konfidenzintervall modelliert
  • Komponentenanteile sind der jeweilige Komponentenpreis geteilt durch die Gesamtkosten, daher sind sowohl Zähler als auch Nenner unsicher
  • Es werden zwei Spannweiten angegeben
    • Spannweite, wenn sich nur die Kosten dieser Komponente ändern: der Anteil, wenn diese Komponente beim 5. oder 95. Perzentil liegt und die drei anderen Komponenten beim Median bleiben
    • Spannweite, wenn alle Komponenten Extremwerte annehmen: der Anteil, wenn diese Komponente an einem Ende des Konfidenzintervalls liegt und alle übrigen Komponenten gleichzeitig am entgegengesetzten Extrem liegen

Vierteljährliche Komponentenanteile

  • 1. Quartal 2024

    • Der Speicheranteil lag bei 52 %; die Spannweite betrug 48–56 %, wenn sich nur diese Komponente änderte, und 42–62 %, wenn alle Komponenten Extremwerte annahmen
    • Der Logikanteil lag bei 14 %; die Spannweite betrug 12–17 %, wenn sich nur diese Komponente änderte, und 10–20 %, wenn alle Komponenten Extremwerte annahmen
    • Der Packaging-Anteil lag bei 19 %; die Spannweite betrug 14–24 %, wenn sich nur diese Komponente änderte, und 12–27 %, wenn alle Komponenten Extremwerte annahmen
    • Der Anteil unterstützender Komponenten lag bei 15 %; die Spannweite betrug 13–18 %, wenn sich nur diese Komponente änderte, und 11–21 %, wenn alle Komponenten Extremwerte annahmen
  • 4. Quartal 2025

    • Der Speicheranteil lag bei 63 %; die Spannweite betrug 60–67 %, wenn sich nur diese Komponente änderte, und 54–73 %, wenn alle Komponenten Extremwerte annahmen
    • Der Logikanteil lag bei 13 %; die Spannweite betrug 10–16 %, wenn sich nur diese Komponente änderte, und 9–19 %, wenn alle Komponenten Extremwerte annahmen
    • Der Packaging-Anteil lag bei 15 %; die Spannweite betrug 11–19 %, wenn sich nur diese Komponente änderte, und 9–22 %, wenn alle Komponenten Extremwerte annahmen
    • Der Anteil unterstützender Komponenten lag bei 10 %; die Spannweite betrug 8–10 %, wenn sich nur diese Komponente änderte, und 7–12 %, wenn alle Komponenten Extremwerte annahmen

Annahmen und Grenzen

  • Die Komponenten kosten können je nach Vertrag, Zulieferer und Zeitpunkt variieren, daher bestehen Unsicherheiten bei den geschätzten Kosten pro Chip
  • Auch bei den geschätzten Chip-Produktionsmengen pro Quartal und der Zusammensetzung der Chiptypen bestehen Unsicherheiten; diese sind in den berichteten Anteilen berücksichtigt

Daten und Explorationstools

1 Kommentare

 
GN⁺ 2 시간 전
Hacker-News-Kommentare
  • Für AI-Inference und Training scheint es einen Weg zu geben, die Hardwarekosten um etwa das Dreifache und die Gesamtkosten um etwa das Doppelte zu senken, selbst ganz ohne technologische Durchbrüche
    Dafür müsste das DRAM-Angebot nur mit der Nachfrage Schritt halten; ob durch Ausbau der Fertigung oder dadurch, den Nachfrageschub mit dem aktuellen Produktionstempo aufzufangen, ist letztlich nur eine Frage der Zeit

    • Wenn man sogar die Nvidia-Margen einrechnet, die durch die Knappheit bei aktuellen High-End-Chips entstanden sind, könnte der Spielraum für Kostensenkungen noch deutlich größer sein
      An vielem, was Sam Altman kulturell in Umlauf gebracht hat, kann man Kritik üben, aber langfristig betrachtet ist die Aussage „Jetzt ist es das Schlechteste, was es je sein wird“ ein ziemlich interessanter und unterschätzter Punkt
      In zehn Jahren wird das Training von LLMs auf heutigem Niveau wohl so selbstverständlich sein wie heute der Betrieb von Datenbanken. Schon das aktuelle Niveau ist recht fortgeschritten, und selbst unabhängig von Hardwarefortschritten gibt es mit besseren Reinforcement-Learning-Trainingssystemen noch viel Luft nach oben
      Ich empfehle sehr, sich die GitHub- und HF-Projekte des Allen Institute anzusehen. Dort gibt es Open-Source-Trainingsmaterial, etwa zum Training von LLMs von Grund auf mit Common Crawl und interessante Qwen-Tunings, sodass man einen Eindruck davon bekommt, wie Dinge aussehen könnten, die bald Nachmittagsprojekte oder Lehrmaterial werden
    • Speicherhersteller werden das Angebot nicht stark genug ausweiten, um der Nachfrage zu entsprechen
      Diese Branche neigt dazu, den Markt in einem Zustand von Unterversorgung zu halten, weil sonst die darauffolgende Überproduktion die Unternehmen ruiniert. Stattdessen wird Angebot aus weniger profitablen Bereichen wie Mobile und Personal Computing in profitablere Segmente umgeschichtet
    • Es wirkt, als hätte Sam Altmans raffinierter Versuch, den Speichermarkt zu kontrollieren, unerwartete Folgen gehabt
    • Ich frage mich, ob die Nutzung alternativer Gleitkommaformate zunehmen wird
      IEEE-Gleitkomma ist bei geringer Bitbreite, besonders bei 16 Bit oder weniger, bekanntermaßen ziemlich schlecht. Formate wie posit sind bei 16 oder 8 Bit deutlich besser. Wenn man statt 32 Bit pro Wert mit 16 Bit trainieren könnte und der Genauigkeitsverlust viel geringer wäre als beim Wechsel von IEEE32 zu IEEE16, wäre das ziemlich relevant
    • Ich frage mich, wie es um Lebensdauer und Aufarbeitbarkeit solcher CapEx-Komponenten wie „GPU“-Module oder das darauf verlötete DRAM steht
  • Vor ein paar Jahren habe ich 96 GB RAM für etwa 250 Dollar gekauft, und derselbe RAM kostet jetzt 1.200 Dollar

    • Am 22. Oktober letzten Jahres habe ich Crucial 96GB DDR5 5600MHz SO-DIMM RAM für 279 Dollar gekauft
      Bei Amazon kostet dasselbe Kit jetzt 1.048,90 Dollar
    • Ich ärgere mich sehr, dass ich meinen Hauptserver nicht komplett voll bestückt habe, als ich die Gelegenheit dazu hatte
      Gebrauchte Enterprise-Speichermodule waren auf eBay wirklich spottbillig
    • Vor einem Jahr habe ich 192 GB DDR3 buchstäblich für 60 Dollar gekauft, also 5 Dollar pro Modul
      Jetzt sind es etwa 22 Dollar pro Modul, also insgesamt ungefähr 350 Dollar. Ich habe keine Ahnung, wer überhaupt noch etwas mit DDR3 macht
    • Die bisherige Annahme, dass man dutzende GB RAM günstig bekommen kann, ist komplett zusammengebrochen
      Der Wert von ultraschnellen SSDs wie Optane könnte dadurch stark steigen
    • Beim Aufräumen der Garage habe ich zwei unbenutzte Samsung EVO 4TB-Laufwerke gefunden
  • In allem, was ich lese, sieht es so aus, als würde die RAM-Kapazität pro Jahr um 20–25 % steigen, aber das scheint nicht auszureichen
    Selbst für Consumer-Anwendungen wären Handys und Laptops mit doppelt so viel RAM deutlich besser, und von der AI-Nachfrage ganz zu schweigen
    Es sieht nicht so aus, als würde dieser Trend verschwinden. Vielleicht wächst er nicht mehr so schnell wie jetzt, aber verschwinden wird er wohl nicht. Ich verstehe, warum Speicherhersteller sich nicht selbst ruinieren wollen, aber es müsste einen Weg geben, dieses Risiko an Modellanbieter oder andere Teilnehmer des Ökosystems weiterzugeben und die RAM-Kapazität eher um 50 % pro Jahr zu steigern

    • Schon allein der OpenAI-Deal könnte zwei Jahre eines solchen Wachstums absorbieren
      In einem Wettbewerbsmarkt ist es ineffizient, wenn RAM-Hersteller nicht an alle verkaufen, die kaufen wollen
      Ich weiß nicht, wie hoch die Wachstumsrate vor Oktober tatsächlich war, aber irgendwer hier weiß das vermutlich
    • Das größte Risiko ist, dass die chinesische CXML-Seite profitiert, sich Märkte nimmt, die andere Anbieter liegen lassen, und dann konkurriert und die etablierten Anbieter verdrängt, sobald sich die Kosten wieder normalisieren
      Dass 20–25 % Wachstum zu wenig sind, sehe ich ähnlich, aber wenn man annimmt, dass Rechenzentrums-Ausbaupläne an Grenzen stoßen und der AI-Hype abkühlt, dann ist das keine völlig abwegige Zahl
      Kurzfristig reichen 20–25 % vielleicht nicht, aber wenn der AI-Ausbau noch dieses Jahr stoppt, entsteht statt Knappheit ein massives Überangebot
    • Theoretisch könnte ein neuer Terminmarkt für Chip-Komponenten helfen
      Damit könnten DRAM-Anbieter dieses Risiko absichern
    • Laut einem aktuellen Artikel ist HBM gemessen an der Waferfläche dreimal ineffizienter als LPDDR, bietet aber mehr als die dreifache Bandbreite
      Was wäre, wenn es unterm Strich vorteilhafter wäre, dass alle Computer z. B. nur mit einem Drittel der bisherigen Geschwindigkeit weniger kaufen und stattdessen komplett auf HBM umstellen?
      Die Lücke zwischen Rechenleistung und Speicher wächst schon seit langer Zeit, und vielleicht ist genau der schmerzhafte Umstieg auf HBM nötig
      Ist es besser, drei Mittelklasse-Computer mit geringer Speicherbandbreite zu haben, oder statistisch etwas länger zu warten, damit alle neue Computer kaufen, die flächenbedingt nur ein Drittel so schnell sind, dafür aber viel höhere Bandbreite bieten?
  • Wenn ich mir den aktuellen Verlauf ansehe, frage ich mich wirklich, wie man Consumer-Märkte wie Gaming oder Machine Learning stemmen will
    Cloud-Gaming wird sicher in der Zukunft ankommen, und nur Puristen wie ich werden wohl noch eine RTX 5090 kaufen und für Offline-Gaming einen Aufpreis zahlen

    • Langfristig ist Cloud-Gaming unvermeidlich
      Denn es ist wirtschaftlich effizienter, die für Grafik-Rendering nötigen Hardwarekosten auf mehrere Verbraucher zu verteilen, ungenutzte Ressourcen nicht brachliegen zu lassen und sie zusammen mit den Spiel-Assets in POPs zu platzieren
      Wenn genug Game-Compute am Edge läuft, werden dadurch auch technisch fortschrittlichere Spiele möglich, die heute wirtschaftlich kaum tragfähig sind. Dass es davon aktuell nicht viele gibt, liegt meiner Meinung nach vor allem am noch kleinen Cloud-Gaming-Markt und an entsprechend fehlendem technischen Know-how
      In dem Moment, in dem die Kosten dafür, die gewünschten Spiele auf Consumer-Hardware zu rendern, nicht mehr tragbar sind, werden selbst die Hartnäckigen am Ende überzeugt werden und dieses Modell wird sich etablieren
  • Ich werde mein DDR4-Build nicht verlassen, bis die Preise zumindest teilweise wieder vernünftig geworden sind
    Ich habe noch 32 GB DDR4-2133MHz-Backup-RAM von früher und nutze derzeit 3200MHz. Das heißt auch, dass CPU-Hersteller mein Geld nicht bekommen. Ein 5800X reicht mir noch eine ganze Weile, und ich habe auch keinen Grund, eine neue GPU zu kaufen. Klar, die B580 ist nicht perfekt, aber trotzdem

    • Was, wenn das gerade der Tiefstpreis für die Zukunft ist?
  • Es ist ziemlich ironisch, dass der Iran die Heliumversorgung blockiert hat
    Gleichzeitig ist der Iran darauf angewiesen, von AI erzeugte minderwertige Propaganda zu nutzen, um feindliche Staaten zu destabilisieren. Das wirkt wie eine dieser historischen Ironien, die erst im Nachhinein sichtbar werden

  • Für Gamer und PC-Hobbyisten, die nicht völlig auf AI fixiert sind, ist das wirklich eine schreckliche Zeit

    • Das wird den Markt für selbstgebaute PCs zu 100 % töten
      Als ich anfing, Gaming-PCs zusammenzubauen, kostete die Top-Grafikkarte 750 neuseeländische Dollar. Heute kostet allein die GPU 10.000 Dollar und dazu kommen noch einmal 1.000–2.000 Dollar für RAM
      Früher war ein Gaming-PC ein erschwingliches Hobby, heute wirkt sogar die allgemeine Fliegerei wie eine Alternative
    • Ich sehe es eher genau andersherum
      Kurzfristig steht die Hobby-Szene zwar unter Druck, aber das Kapital, das nötig ist, um den neuesten Stand voranzutreiben, ist im Vergleich zu Fortune-500-Unternehmen gering. Schon bald wird auch die Hobby-Szene profitieren, besonders wenn der Markt zusammenbricht
    • Auch für Menschen, die völlig auf AI fixiert sind, ist es eine schreckliche Zeit
  • Ich frage mich, warum Hyperscaler sich nicht stärker vertikal integrieren und eigene Fabs bauen
    Selbst wenn eine Fab nur 1 Milliarde Dollar kosten würde, geben sie derzeit Hunderte Milliarden Dollar für Chips von Nvidia und anderen aus

    • Ich bin nicht sicher, ob vertikale Integration zwingend nötig ist; vielleicht wäre es besser, direkt die Ausweitung von Produktionskapazitäten zu finanzieren, so wie Apple es bei der Skalierung neuer Technologien für das iPhone tut
      Aber die Tatsache, dass Hyperscaler und AI-Unternehmen das nicht tun, sagt viel darüber aus, wie sehr sie selbst an die zukünftige AI-Nachfrage glauben
      AI-Unternehmen behaupten, eine gewaltige Skalierung sei nötig, wollen aber das dafür erforderliche Kapitalrisiko nicht tragen
      Man hört viele klagende Stimmen aus der AI-Ecke, dass Chip-Hersteller sie ausbremsen, aber wer hat denn tatsächlich das Geld, um diese Expansion problemlos zu finanzieren? Die Chiphersteller spielen dieses Spiel schon viel länger. Als Sam Altman überall davon sprach, dass Fabs im Wert von 7 Billionen Dollar nötig seien, haben AI-Unternehmen gezeigt, dass sie zu absurden Behauptungen bereit sind, und damit Vertrauen verspielt
      Was jetzt gebraucht wird, ist, dass sie einen sehr kleinen Teil ihrer riesigen Cash-Reserven direkt in die Finanzierung von Fabs lenken
    • Fabs gehören zu den komplexesten Technologien überhaupt
      Das ist so etwas wie die „Raketenwissenschaft“ unserer Zeit, und Geld allein reicht nicht. Man kann sehr leicht Milliarden verbrennen und am Ende nichts vorweisen
      Man muss sich nur ansehen, wie schwer sich Intel in den letzten Jahren im Wettbewerb getan hat. Das ist ein Unternehmen, das seit Jahrzehnten in diesem Geschäft ist
    • Selbst mit dem nötigen Know-how dauert der Bau einer Fab Jahre
      Ohne dieses Know-how bräuchte es zusätzliche Experimente, bevor man überhaupt mit etablierten Herstellern konkurrieren kann. Bis man brauchbare Chips produzieren könnte, wäre die Knappheit womöglich längst vorbei
    • Die durchschnittlichen Margen von Fabs sind im Vergleich zu denen großer Tech-Konzerne sehr dünn, und entsprechend hoch ist das Risiko
      Es ist wahrscheinlich einfach kein Geschäft, in das sie sich integrieren möchten
    • Eine einzelne Fab kostet 15–20 Milliarden Dollar und braucht mindestens 5 Jahre bis zur Fertigstellung
      Außerdem erfordert sie Fachwissen, das keines dieser Unternehmen besitzt
  • Ich habe vor einer Woche einen gebrauchten Dell-Server gekauft
    Das komplette System mit 12-Kern-CPU und 32 GB DDR4-ECC-RAM kostete ungefähr so viel wie 64 GB DDR-RAM allein. Ich hoffe, dass diese absurde Situation bald endet. Sonst wird sich der Schmerz auf andere Märkte ausweiten. Ich habe kürzlich gelesen, dass die Verkäufe von PC-Gehäusen um mehr als 40 % eingebrochen sind

    • Durch die steigenden Stückkosten bei RAM werden arme Menschen bereits selbst aus dem Markt für günstige Smartphones gedrängt
      https://www.cnet.com/tech/mobile/smartphone-sales-to-plummet...
    • Ich habe das Gefühl, dass der PC-Markt bis zum Platzen der AI-Blase irreparabel beschädigt sein wird
      Hersteller, die auf „Enterprise“-Komponenten umgeschwenkt sind, werden nicht zum Markt für Consumer-Komponenten zurückkehren, weil es ihn dann nicht mehr geben wird
      Und wenn es dann zu viele Rechenzentren gibt, die mit minderwertigen generierten Inhalten kein Geld verdienen können, werden sie für SaaS-Zwecke umgewidmet. So in der Art, dass sich etwas wie OnShape auf alle Anwendungen ausdehnt
      Die meisten Nutzer scheinen wenig Probleme damit zu haben, alles, was sie erzeugen, in einem Cloud-Service zu speichern, und das lässt sich leicht als Alternative zum Besitz „teurer“ Desktop- oder Laptop-Hardware verkaufen
    • Man kann es auch anders sehen
      Wenn Hyperscaler mehr RAM verwenden und dieser RAM nicht an Verbraucher geht, dann bedeutet das, dass schwere Workloads vollständig in der Cloud stattfinden
      Warum sollten Hyperscaler und Verbraucher gleichzeitig RAM besitzen müssen? Verbraucher wollen mehr RAM, um lokale Modelle auszuführen, aber dann würde die Kapazität der Hyperscaler brachliegen
  • Speicherhersteller sitzen auf einem Berg an geistigem Eigentum
    Selbst wenn also jemand freie Fab-Kapazität hätte und in die Speicherfertigung einsteigen wollte, müsste er gegen massive Patentbarrieren ankämpfen
    Die meisten Speicherunternehmen haben untereinander informelle Absprachen, bei denen sie ihre jeweiligen Patentverletzungen gegenseitig verrechnen
    Ich sehe nicht, wie ein neuer Speicherhersteller entstehen soll, ohne an Lizenzkosten zu ersticken