KI verlangsamt sich
(wheresyoured.at)- Generative-KI-Infrastruktur muss bis 2030 jährlich mehr als 2 Billionen US-Dollar an KI-Compute-Umsatz erzeugen, um Investitionen in Rechenzentren und Compute-Verpflichtungen zu rechtfertigen
- Die geplanten 190 GW an Rechenzentren entsprechen bei Kosten von 80 bis 100 Milliarden US-Dollar pro GW einem Volumen von 9,5 bis 15 Billionen US-Dollar; zur Umsetzung wären jährlich Rechenzentrums-Schulden in Höhe von 500 Milliarden bis 1 Billion US-Dollar nötig
- OpenAI wird bis Ende 2030 voraussichtlich mindestens 852 Milliarden US-Dollar aufgebraucht haben, und Anthropic muss bis 2029 ein Umsatzziel von 174 Milliarden US-Dollar pro Jahr erreichen, um seine Compute-Verpflichtungen tragen zu können
- Nach der Umstellung auf tokenbasierte Abrechnung haben Unternehmen Schwierigkeiten mit der Transparenz ihrer KI-Ausgaben und der Messung des ROI; Uber, T-Mobile und Brex setzen Ausgabenlimits pro Mitarbeiter für Tokens fest
- Derzeit konzentrieren sich 89 % der Umsätze von KI-Startups auf OpenAI und Anthropic; um den im Aufbau befindlichen Compute-Umfang zu rechtfertigen, werden zusätzlich mindestens 250 Milliarden US-Dollar jährliche KI-Compute-Nachfrage benötigt
KI kann es sich nicht leisten, langsamer zu werden — bis Ende 2030 sind mehr als 3 Billionen US-Dollar Umsatz nötig
- Wendet man die Daten von Sightline Climate direkt an, ergibt sich eine geplante Rechenzentrumskapazität von 190 GW; kombiniert mit Jensen Huangs Aussage von 80 bis 100 Milliarden US-Dollar pro GW ergeben sich Kosten von 9,5 bis 15 Billionen US-Dollar
- Bloombergs Formulierung von einem 3-Billionen-US-Dollar-Ausbau von Rechenzentren passt nicht zu dieser Rechnung; das notwendige Kapital muss irgendwoher kommen
- Ein Bericht der Financial Times kam zu dem Schluss, dass Banken die Rechenzentrums-Schulden womöglich nicht tragen können; das Emissionsvolumen liegt derzeit bei rund 250 Milliarden US-Dollar pro Jahr und müsste für den tatsächlichen Ausbau auf 500 Milliarden bis 1 Billion US-Dollar pro Jahr steigen
- NVIDIA erwartet bis Ende 2027 einen Umsatz von 1 Billion US-Dollar, und da 54 % des Umsatzes von drei Kunden kommen, hängt der künftige Umsatz von wenigen Kunden und deren Fähigkeit zur Schuldenfinanzierung ab
- Googles Verkauf von Anteilen im Wert von 85 Milliarden US-Dollar und Metas Plan für Anteilsverkäufe in Milliardenhöhe stehen im Zusammenhang mit der schwieriger werdenden Schuldenfinanzierung der Hyperscaler
Compute-Verpflichtungen von OpenAI und Anthropic
- Anthropics Verpflichtungen bei Compute und Chips summieren sich auf 330 Milliarden US-Dollar bei Google, Amazon und Microsoft, 30 Milliarden US-Dollar bei CoreWeave und 15 Milliarden US-Dollar bei SpaceX
- Anthropic muss sein Umsatzziel von 174 Milliarden US-Dollar pro Jahr bis 2029 erreichen, um diese Compute-Kosten tragen zu können
- Anthropic hat in den Runden im Februar, April und Mai 95 Milliarden US-Dollar eingesammelt, kann diese Kosten aber weder mit diesem Kapital noch mit dem Cashflow decken und braucht im folgenden Jahr mindestens weitere 200 Milliarden US-Dollar
- Für OpenAI wird bis Ende 2030 ein Mittelabfluss von mindestens 852 Milliarden US-Dollar erwartet; das Unternehmen ist Compute-Verpflichtungen von mehr als 770 Milliarden US-Dollar gegenüber Microsoft, Amazon, CoreWeave, Cerebras und Oracle eingegangen
- OpenAIs Finanzierung über 122 Milliarden US-Dollar im März reicht nicht aus, um die Kosten zu decken; bis Jahresende werden mindestens weitere 250 Milliarden US-Dollar benötigt
Berechnung der Rechenzentrumsumsätze und das Oracle-Risiko
- Generative KI und KI-Compute müssen bis 2030 jährlich mehr als 2 Billionen US-Dollar Umsatz erzeugen; andernfalls lassen sich die Investitionsausgaben für Rechenzentren und die Zahlungen für die Verpflichtungen von Anthropic und OpenAI nicht aufrechterhalten
- Bei 190 GW Rechenzentren und einem PUE von 1,35 liegt die zentrale IT-Last bei rund 140 GW; bei einer Verrechnung von 12,5 Millionen US-Dollar pro MW wären dafür jährlich 1,75 Billionen US-Dollar Umsatz nötig
- Selbst wenn nur die Hälfte der geplanten Kapazität gebaut wird, wären noch immer 875 Milliarden US-Dollar Jahresumsatz nötig, damit den Rechenzentren nicht das Geld ausgeht
- OpenAI und Anthropic erwarten für 2029 Umsätze von jeweils 184 Milliarden und 174 Milliarden US-Dollar, zusammen also nur 358 Milliarden US-Dollar
- Wenn OpenAI Oracle-Compute nicht tragen kann oder will, könnte Oracle das Geld ausgehen; Oracle gibt derzeit 340 bis 700 Milliarden US-Dollar für 7,1 GW Rechenzentren für OpenAI aus
Die aktuellen KI-Ausgaben reichen nicht aus
- Salesforces geplanter Anthropic-Aufwand von 300 Millionen US-Dollar im Jahr 2026 liegt weit unter dem nötigen Umfang
- Die gesamte aktuelle Compute-Nachfrage aller KI-Unternehmen weltweit erreicht zusammen nicht einmal 100 Milliarden US-Dollar; 2030 wird das Zehnfache benötigt
- Laut einem Bericht von The Information liegt die Umsatzkonzentration von KI-Startups bei OpenAI und Anthropic bei 89 % wie in {p:89}
- Microsofts annualisierte KI-Rate von 37 Milliarden US-Dollar besteht größtenteils aus OpenAI-Compute, und Microsoft AI CEO Mustafa Suleyman sagt, Anthropics Modelle seien zu teuer und er wolle Microsofts Nutzung auf null senken
- Selbst wenn Anthropic und OpenAI jährlich 500 Milliarden US-Dollar für Compute ausgeben, wären zusätzlich mehr als 250 Milliarden US-Dollar jährlicher Compute-Umsatz nötig, um den Ausbau der Rechenzentren zu rechtfertigen
Token-Abrechnung und Unsicherheit beim ROI
- Die Kosten und die Kapitalrendite bestimmter KI-Aufgaben lassen sich nicht messen, und Unternehmen haben den KI-Einsatz ausgeweitet, ohne die Ergebnisse zu messen
- Anthropic und OpenAI stellten ihre Kunden im ersten Quartal 2026 auf tokenbasierte Abrechnung um, und schon nach zwei bis drei Monaten wurden Unsicherheit bei KI-Kosten und ROI zum wiederkehrenden Thema in den großen Wirtschaftsmedien
- In einer von der Wall Street Journal zitierten KPMG-Umfrage verteilt sich die Transparenz von KI-Kosten auf insgesamt 26 %, teilweise 50 % und keine bzw. erst nach Rechnungsstellung erkennbare 22 %, wie in
- Ein Unternehmen gab ohne Ausgabenkontrollen in einem Monat 500 Millionen US-Dollar für Anthropic-Modelle aus, und Uber verbrauchte in nur einem Quartal sein jährliches Token-Budget
- Uber begrenzt KI-Ausgaben auf 1.500 US-Dollar pro Nutzer und Monat, T-Mobile vorübergehend auf 2.000 US-Dollar pro Nutzer und Monat, Brex auf 500 US-Dollar pro Woche für Ingenieure und 5 US-Dollar pro Woche für Nicht-Ingenieure
Coding-Agenten, Loops und das Output-Problem
- Claude-Code-Verantwortlicher Boris Cherny und der zu OpenAI gehörende OpenClaw-Evangelist Peter Steinberger verlangen von Nutzern, Loops für Agenten zu entwerfen
- Loops sorgen dafür, dass ein LLM über einen gewünschten Zeitraum weiterarbeitet, auch ohne zusätzliche Prompts des Nutzers
- Bei unterstützten Abonnements werden die Kosten für Modellfehler hinter 20, 100 oder 200 US-Dollar pro Monat verborgen, aber wenn Nutzer die echten Kosten tragen, werden auch die Kosten des Scheiterns sichtbar
- Das steht im Zusammenhang mit Forschungsergebnissen, wonach mehr Schlussfolgern bei LLMs zu mehr Halluzinationen führt, während der Agentenansatz LLMs ihre Pläne selbst erstellen lässt
- Notion blockierte nach einem Ausfall des Anthropic-Dienstes den Zugriff auf Anthropic für mehrere Stunden, und viele Apps, die von KI-Coding-Tools erzeugt werden, bleiben nutzlose und unsichere Slopware
Die Metapher der riesigen Metallspinne
- Die riesige Metallspinne ist ein Gerät im Wert von 1 Million US-Dollar, verbraucht aber bei jeder Nutzung 40.000 US-Dollar an Treibstoff und kann Gegenstände aufheben oder das Abendessen machen
- Dasselbe Gerät kann eine Diet Coke präzise aus dem Kühlschrank holen oder ein Loch in den Kühlschrank schlagen, und der Nutzer muss unabhängig vom Ergebnis 40.000 US-Dollar bezahlen
- Dank Subventionen erleben normale Nutzer die Zerstörung nur gelegentlich, doch Unternehmen tragen die echten Kosten und die Hersteller verlieren jedes Jahr Milliarden durch Training und Wartung
- Neue Funktionen erweitern, was das Gerät angeblich tun kann, aber jede zusätzliche Funktion kostet Hunderte Millionen US-Dollar, und manchmal ist nicht einmal klar, ob dafür tatsächlich neu trainiert wurde
- Selbst wenn eine Studie zeigt, dass die Fähigkeit gestiegen ist, Aufgaben einer bestimmten Länge zu 50 % zu erledigen, bleibt die Spinne in der Metapher unberechenbar und tut auch Dinge, um die sie nicht gebeten wurde
KI-Kreislaufwirtschaft und reale Produktnachfrage
- Generative KI hat hohe Ausführungskosten, die großen KI-Labore haben keinen Weg zur Profitabilität, und Kosten sowie ROI von LLM-basierten Aufgaben lassen sich weiterhin nicht messen
- KI-Projekte können die Betriebskosten um 10 bis 100 % erhöhen, und entgegen dem Versprechen sinkender Kosten für Betreiber und Kunden von KI-Diensten sind die Kosten weiter gestiegen
- Die hohen Kosten erhalten eine Struktur aufrecht, in der KI-Labore Geld an Compute-Partner der Hyperscaler zahlen und dieses Kapital anschließend als Nachfrage nach den Laboren selbst und nach NVIDIA-GPUs zurückfließt
- Wenn OpenAI oder Anthropic Profitabilität oder Nachhaltigkeit verfolgen, sinkt die Nachfrage nach KI-Compute, ebenso wie die Nachfrage nach Azure, Google Cloud, Amazon Web Services, CoreWeave, Oracle Cloud Infrastructure und NVIDIA-GPUs
- Um die aktuellen Verpflichtungen und Prognosen zu erfüllen, müsste der gesamte KI-Stack um das Zehnfache wachsen; nötig wären zusätzlich 250 Milliarden US-Dollar jährliche KI-Compute-Nachfrage und mindestens zwei weitere Unternehmen in der Größenordnung von OpenAI oder Anthropic
11 Kommentare
Gibt es hier noch andere, die das Gefühl haben, dass sich die Leistung beim Upgrade von opus 4.6 -> 4.7, 4.8 spürbar verschlechtert hat?
In letzter Zeit merkt man deutlich, dass die koreanischen Übersetzungen merkwürdiger geworden sind. Sie übersetzen
pain pointinzwischen als „schmerzhafter Wert“.Huch … die Firma scheint wohl angeschlagen zu sein. Eine Übersetzung auf einem Niveau, das nicht einmal Google Übersetzer liefern würde.
Scheint kompletter Schrott geworden zu sein...
Genau, oder?? Plötzlich konnte es Dinge nicht mehr, die es vorher gut beherrscht hat.........
Früher wurden Fragen knapp beantwortet und Aufgaben einfach gelöst, aber inzwischen wird alles möglichst weitschweifig erklärt und unnötig kompliziert angegangen.
Sehe ich genauso. Dieses gute Gespür, alles passend auf den Punkt zu bringen, ist verschwunden.
Die API wurde doch schon immer tokenbasiert abgerechnet ...
Ich glaube, im Text ist wohl gemeint, dass Anthropic kürzlich beim Enterprise-Tarif von einem Abonnement auf nutzungsbasierte Abrechnung umgestellt hat. Im Vergleich zum Abo ist nutzungsbasierte Abrechnung pro Token bis zu etwa 10-mal teurer, und Anthropic verfolgt dabei wohl die Strategie, Entwickler mit dem persönlichen Abotarif als Lockangebot zu binden und Unternehmen dann die teuren nutzungsbasierten Enterprise-Gebühren zahlen zu lassen.
Aus Sicht der Unternehmen heißt das, dass tokenbasierte Abrechnung zu teuer ist und der ROI dadurch unsicher wird.
Jetzt ergibt der Kontext endlich etwas mehr Sinn. Ich habe im Abo nur Codex genutzt und Anthropic-Modelle ausschließlich über Bedrock ... danke.
Hacker-News-Kommentare
Heute hat Apple seine überarbeiteten AI-Funktionen vorgestellt, und nach verschiedenen Berichten zahlt Apple dafür an Google offenbar nur etwa 1 Milliarde US-Dollar pro Jahr
Das kommt faktisch einer Lizenzierung von geistigem Eigentum gleich, und Google scheint damit einverstanden zu sein, für diesen Betrag die Rechte zum Betrieb und zur Destillation seiner Modelle zu überlassen
Selbst wenn Verbraucherumsätze nur ein Teil des Gesamtpuzzles sind, frage ich mich, warum Mac- oder iPhone-Nutzer für ChatGPT bezahlen müssten, wenn Apples neue AI für sie ausreicht
Google wird ähnliche Tools ebenfalls auf Smartphones bringen und in der Suche weiter AI-Funktionen anbieten; ich sehe daher nicht, wo der Beleg dafür sein soll, dass Consumer-AI für Anthropic oder OpenAI nach dem Vorhandensein von Apples Technik deutlich mehr als 1 Milliarde US-Dollar pro Jahr wert ist
Selbst wenn OpenAI einen Vertrag für Samsung-Handys abschließt und Samsung zehnmal so verzweifelt ist wie Apple, wären das etwa 10 Milliarden US-Dollar pro Jahr; wenn OpenAIs prognostizierter Verbraucherumsatz für 2026 bei 14–15 Milliarden US-Dollar liegt, scheint das selbst im Erfolgsfall schwer aufrechtzuerhalten, sobald es nützliche integrierte Funktionen für iPhone-Nutzer gibt
Ed Zitron ist eher ein lauter britischer Agitator, aber im Großen und Ganzen scheint er recht zu haben
Obwohl es in Windows inzwischen sogar eine Copilot-Taste gibt, nutzen die Leute GPT, Microsoft Edge ist unter Windows nicht der beliebteste Browser, und Instagram Threads hat TikTok ebenfalls nicht ernsthaft getroffen
Die Fragestellung ist umgekehrt. Menschen nutzen, was ihnen gefällt, und haben eine starke Präferenz dafür, es weiter zu nutzen
Man braucht nicht unbedingt einen riesigen Burggraben; problematisch wird es erst, wenn Nutzer mit dem Produkt dauerhaft unzufrieden sind oder es einen deutlich besseren Wettbewerber gibt, über den alle sprechen
Wenn Apples Funktionen gegenüber der einfachen Nutzung von GPT keinen echten Vorteil bieten, sollte man kein Wunder erwarten
Die offene Frage ist, ob ich Kagi wegen der Suche weiter nutzen werde oder ob die neue Siri mich insgesamt dorthin bringt, wo ich hinmuss. Ich sollte wohl stärker darauf achten, wie oft ich tatsächlich Suchergebnisse anschaue und wie oft ich nur AI-Zusammenfassungen lese
Es gab auch Dinge in der Apple-Präsentation, die ich nicht gesehen habe. Für einfaches Coding wurden zum Beispiel zwar das LLM in Xcode, die Shortcuts-App und Safari Extensions erwähnt, aber ich habe mir gerade eine Webseite erstellen lassen, die Daten von Kagi anzeigt, und Gemini konnte das auch
Ob Siri das auch kann, muss sich noch zeigen, und die Erfahrung ist ebenfalls wichtig. ChatGPT erledigt den Code-Erstellungsprozess viel besser mit einer Coding-Oberfläche samt Live-Editor, während Kagi sich eher wie ChatGPT von vor ein paar Jahren anfühlt: Es wirft komplette Codeblöcke aus und liefert bei jeder Änderung einen neuen Code-Dump
Der Sprung zu Xcode könnte zu groß sein und Siri zu wenig bieten, sodass eine Lücke für Prosumer-AI-Nutzung bleibt, die Apple nicht schließen kann
Anthropic scheint sich nicht besonders für Consumer-AI zu interessieren, und Verbraucher sind wahrscheinlich die Kundengruppe mit der geringsten Profitabilität
Apple dürfte eher dazu beitragen, die allgemeine AI-Nutzung unter Verbrauchern zu erhöhen, ähnlich wie Instagram mit der Einführung von Stories. Das hat zwar Snapchats Wachstum gebremst, aber ich wäre vorsichtig mit der Behauptung, Apple werde auch viele OpenAI-Nutzer abziehen
Wer heute für ChatGPT bezahlt, nutzt es wahrscheinlich für Hobby-Coding, Projekte oder Bildgenerierung, und Nutzer mit hohen Ausgaben setzen es fast sicher für persönliche Programmierprojekte ein
Abonnenten mit mehr als 100 US-Dollar pro Monat werden deshalb nicht abspringen, und selbst bei Nutzern für 20 US-Dollar im Monat halte ich einen nennenswerten Abfluss für sehr unwahrscheinlich
Die meisten Nutzer weltweit verwenden günstige Smartphones mit schwacher CPU und wenig RAM und können daher kein brauchbares Modell lokal ausführen
Beim Google-Apple-Deal ist unklar, ob Google für diese 1 Milliarde US-Dollar auch Zugang zu Cloud-Compute verkauft oder nur Gewichte und geistiges Eigentum teilt
Apple hat ebenfalls Nutzungslimits und kostenpflichtige Upgrades für mehr Nutzung angekündigt; damit gibt es nun eine direkte Wettbewerbslinie mit den AI-Laboren. Selbst mit einem Default kann es erfolgreiche Konkurrenten geben, wie Safari und Chrome zeigen
Es ist auch gut möglich, dass Google seine Modelle unter ihrem tatsächlichen Wert anbietet, um einem zahlungskräftigen Hauptkonkurrenten den ökonomischen Anreiz zu nehmen, in das Wettrüsten beim Training von Foundation Models einzusteigen
Nutzer, die mehr als Zusammenfassungen und Stilkorrekturen wollen, könnten selbst bei gelegentlicher Nutzung in einem angemessen bepreisten Abo oder einem werbefinanzierten Tarif für höherwertige Modelle einen Mehrwert sehen
Apple kann das ebenfalls anbieten, aber sobald man beginnt, Funktionen zu vergleichen, könnten Gemini, Claude und ChatGPT für viele Menschen besser passen
Außerdem besteht real das Risiko, dass Apple wieder zu viel verspricht und die Qualität der tatsächlich ausgelieferten Modelle schwach ist, was Nutzer noch stärker in Richtung Abo-Dienste treiben könnte
Dazu gehören persönliches Leben, Interessen, Pläne, Geschäftliches und sogar Familieninformationen; zu einer anderen AI-App zu wechseln wäre schmerzhaft, weil man wieder ganz von vorn anfangen müsste
Einer der Hinweise, an denen man einen schlampigen Agitator erkennt, ist ein erregter Ton im Stil von „Warum versteht das denn niemand?“, obwohl die eigentliche Logik nicht zusammenhängend ist
Wenn Zitrons Behauptung so solide wäre, wie er sagt, müssten Leser sie nachvollziehen und erkennen können, dass sie solide ist
Wenn er bei den Statistiken zur AI-Nachfrage beginnen und die Rechnung vorsichtig zu den nächsten Schritten weiterführen würde, etwa zu den Umsätzen, die für die Profitabilität von AI-Unternehmen nötig sind, könnte man ihm folgen, aber er springt, setzt zu Sprüngen an und kehrt dann wieder zurück
Wenn die Lage wirklich so eindeutig auf dem Niveau von „Warum seht ihr das nicht?“ wäre, müsste auch die Erklärung eindeutig sein, ist sie aber nicht. Und sie ist nicht eindeutig, weil die Lage selbst nicht so eindeutig ist
Seine Botschaft ist im Großen und Ganzen, dass die Tech-Industrie auf tiefe Weise moralisch verrottet ist. Das lässt sich schwer ohne Erregung sagen, aber es liest sich weniger wie unbegründete Übertreibung als wie Unglaube im Sinne von „Warum investiert und arbeitet ihr immer noch bei Meta, obwohl es überwältigende Belege dafür gibt, dass Meta schreckliche Dinge mit Menschen macht?“
Trotzdem habe ich seine Gedanken so verstanden, dass AI-Unternehmen zugesagt haben, Rechenleistung im Umfang von X zu kaufen, dass dafür Rechenzentren gebaut werden, um diese Nachfrage zu bedienen, dass die Rechenzentren Y einnehmen müssen, und dass die AI-Unternehmen nicht genug Umsatz haben, um Y zu zahlen
Mich persönlich überrascht das nicht. Die praktischen Einsatzfelder von AI, die ich gesehen habe, sind Code-Generierung oder automatisierte Vertriebs- und Betrugsanrufe, und das wirkt nicht wie ein Markt, der groß genug wäre, um die gewaltigen Summen zu tragen, um die es gerade geht
Mich würde interessieren, warum Ed deiner Meinung nach so weit danebenliegt. Für mich sieht es so aus, als stehe AI insgesamt eine große Korrektur bevor
Solche Informationen sind nichts, von dem man erwarten würde, dass es in jedem regelmäßigen Blogpost immer wieder vervielfältigt wird
Das ist zwar sarkastisch formuliert, aber falls du tatsächlich geklickt hast, würde mich die Antwort wirklich interessieren
Das ist ein schwacher Versuch, modernen Enthüllungsjournalismus nachzuahmen, der geistreich sein will, aber wenig substance hat
Wurde schon oft gesagt, aber Ed Zitron ist schwer zu vertrauen
Meiner Ansicht nach war er selbst bei sehr offensichtlichen und banalen Dingen oft voreingenommen und falsch, weshalb es schwerfällt, komplexe Analysen mit Zahlen und Trends einfach so zu übernehmen
Ich erinnere mich zum Beispiel an einen Tweet vor ein paar Monaten, in dem er Leute verspottete, die über Agents und agentisches Coding sprachen. So in der Art von: „Agents? Welche Agents? Wisst ihr überhaupt, wovon ihr redet?“ Und in den Antworten erklärten Hunderte Leute, dass sie tatsächlich Agents nutzen
Er hat ein Publikum und ein Ziel bei der Interaktion, und sein Zweck ist nicht Aufklärung, sondern Klicks zu bekommen
Die Richtung kann stimmen. Zum Beispiel könnte es stimmen, dass die Umsätze, die nötig wären, um die Ausgaben zu decken, absurd hoch erscheinen, aber er scheint Zahlen so zusammenzumischen, dass ein Worst-Case-Szenario entsteht, das nicht zwingend der Realität entspricht
Zusammen mit seiner Unfähigkeit, auch nur ein bisschen Offenheit gegenüber irgendetwas mit AI-Bezug zu zeigen, macht ihn das schwer ernst zu nehmen
Publikationen lieben katastrophische und düstere Langtiraden, und deshalb wirkt es so, als hätte er seine Karriere mit hysterischen Anti-AI-Texten aufgebaut. Das heißt nicht, dass er deshalb falsch liegt
Der überzeugendste Teil des Textes ist, dass schon die Zahlen allein die nötige Größenordnung der Investitionen in reinen Dollarbeträgen nicht nachhaltig erscheinen lassen
Auch wenn man dem Autor nicht zustimmt, kann man die Argumentation nachvollziehen. OpenAI, SpaceX und Anthropic müssten dieses Jahr an die Börse gehen, wenn ihnen das Geld nicht ausgehen soll, und es gibt nicht mehr genug privates Kapital. Der IPO ist die letzte Finanzierungsrunde
AI kann sehr nützlich und transformativ sein, und die Unternehmen können schnell wachsen, aber vielleicht gibt es nicht genug Geld, um dieses Wachstum zu tragen
Der Teil darüber, dass ein insolventes AI-Unternehmen seinen Oracle-Vertrag gekündigt hat, ließ Oracle für mich wie eine Analogie zu Nortel wirken. Wenn plötzlich ein großer Kundenblock wegbricht, könnten Abschreibungen in Höhe von Hunderten Milliarden Dollar nötig werden
Ich bin den AI-Herrschern gegenüber zutiefst skeptisch, aber ständig zu behaupten, da sei gar nichts, ist nicht ehrlich
Zitron ist inzwischen auf einem Niveau, auf dem er geradezu um einen Zusammenbruch fleht
Er hat zwar mit makroökonomischer Analyse reale große Finanzrisiken benannt, verpasst wegen seines ständigen Pessimismus aber völlig den praktischen Nutzen der massiven Produktivitätssteigerungen, die viele auf HN täglich erleben
Im Moment möchte ich daran glauben, dass es einen Zwischenbereich gibt, in dem diese Erweiterung individueller Fähigkeiten zu großen Entdeckungen führt
Wo landet dann all diese Produktivität, wo ist der Wert, wo sind die Statistiken zu Massenarbeitslosigkeit oder die Millionen neuen Startups, die große Summen verdienen?
In einem überhitzten Hype-Zyklus sind Gegenstimmen und ausgewogene Kritik wertvoll, aber seine Argumentation ist selbst dann nicht belastbar, wenn man seinen Prämissen zustimmt
Mein größter Einwand gegen seine grobe Rechnung ist, dass er die Bruttomarge bei Inferenz wie etwas Neues behandelt, das sich nicht mit normalen SaaS-Margen vergleichen lasse
Teilweise stimmt das. Das ständige F&E-Karussell aus Modelltraining, Aufbau der zugehörigen Infrastruktur und den Nebenkosten, die nötig sind, um wettbewerbsfähig zu bleiben, verändert die Analyse ein Stück weit
Aber zu behaupten, das sei strukturell etwas anderes als gewöhnliche SaaS-Margen, geht zu weit. Das Geschäftsmodell ist nicht wie Dropbox, aber ziemlich ähnlich zu frühem AWS, CDNs und Telekommunikationsanbietern
Zum Telekom-Bereich kann ich etwas sagen, weil ich mehr als die Hälfte meiner Laufbahn dort als Ingenieur und Gründer verbracht habe: Auch ein extrem kapitalintensives Infrastrukturgeschäft, dessen Profitabilität von Auslastung, Overbooking, Spitzenkapazitätsplanung, Segmentierung und der Amortisation von Investitionsausgaben abhängt, kann funktionieren
Mit dem Auftauchen expliziter Aufgaben-Segmentierung zur Kostensenkung wird seine Rechnung noch fragwürdiger. Führende Organisationen erkennen, dass man nicht für jede Aufgabe das beste und teuerste Modell einsetzen muss
Einfache Aufgaben kann man an günstige Modelle routen, Caching nutzen, unkritische Aufgaben im Batch verarbeiten und Frontier-Modelle nur für einen Teil der Aufgaben reservieren, die tatsächlich Frontier-Intelligenz brauchen. Das widerspricht direkt der Behauptung, Anbieter müssten immer nach Frontier-Intelligenz streben, um die aktuelle Nachfrage, Auslastung und Preiskurve aufrechtzuerhalten
Man kann Produktivitätsgewinne spüren, ohne dass realer Wert entsteht, und genau das zeigen meiner Ansicht nach die belastbarsten Daten
https://unessays.substack.com/p/talk-is-cheap
Gibt es groß angelegte peer-reviewte Studien oder Metastudien, die diese Behauptung bestätigen?
Allein die Tatsache, dass er auf die auffälligen Fehlschläge seiner eigenen Analyse nie zurückgeblickt hat, sagt schon alles Nötige über seine intellektuelle Redlichkeit
In Teilen seiner Aussagen über Finanzrisiken steckt Wahrheit, aber wenn man das Aufwärtspotenzial nicht anerkennen kann, kann man Risiken auch nicht richtig einschätzen
Deshalb fällt es mir schwer, ihn ernst zu nehmen
In diesem Thread gibt es viele abwinkende Kommentare, aber nur wenige befassen sich mit dem eigentlichen Inhalt des Artikels
Zentral ist, ob „AI kann es sich nicht leisten, sich zu verlangsamen — um weiter zu existieren, braucht sie bis Ende 2030 mehr als 3 Billionen Dollar Umsatz“ tatsächlich stimmt
Wenn die gesamten Löhne 2024 bei 11,7 Billionen Dollar lagen [0] und die Beschäftigung außerhalb der Landwirtschaft im selben Jahr 158.000 betrug [1], dann liegt das mindestens eine Größenordnung über meiner groben Rechnung, nach der AI mindestens einen von 20 Jobs übernehmen oder schaffen müsste, um die Gewinnschwelle zu erreichen
[0] https://fred.stlouisfed.org/series/BA06RC1A027NBEA
[1] https://fred.stlouisfed.org/series/PAYEMS
2008 und 2020–2023 wurde enorm viel Geld in die Wirtschaft gepumpt, und die Reichen sind absurd reich geworden. Dieser Reichtum ist nun in der Version der 2020er von Eisenbahn/Glasfaser gebunden, und wir versuchen im Grunde, Billionen Dollar aus der Weltwirtschaft zu löschen und einen Reset zu machen
Ein Reset ist wohl nötig
Bevor man 20 Minuten darauf verwendet, diesen Artikel zu lesen, sollte man wissen, dass dieser Autor seit über zwei Jahren populäre, aber durchgehend falsche Ansichten verbreitet, wonach AI scheitere, Geldverschwendung sei, schlecht sei und niemals funktionieren werde
Zum Beispiel so ein Artikel aus dem März 2024: https://www.wheresyoured.at/peakai/
Zwei Jahre lang wirkte diese Person offensichtlich verrückt und verpasste den massiven Börsenanstieg, am Ende lag sie aber richtig. Natürlich haben sich Tech-Aktien später langsam erholt
Den Zeitpunkt solcher Dinge vorherzusagen ist bekanntermaßen extrem schwer, und nur weil jemand vor zwei Jahren beim Timing falsch lag, heißt das nicht, dass es keine Korrektur geben wird
Ed ist als Stimmungsbarometer ein wenig interessant, aber ich finde es schwer, das, was er schreibt, ernst zu nehmen
Tim Lee hat auch darauf hingewiesen, dass einige Details in Eds Analysen ziemlich seltsam wirkten, als er sie veröffentlicht hat: https://x.com/binarybits/status/2034377838883700953
In dem Moment, in dem das Newsletter-Abo-Popup erscheint, schließe ich den Tab sofort
Ed ist eine interessante Figur
Seine finanzielle Analyse der AI-Industrie klingt logisch, aber ich habe nicht genug Wissen, um zu beurteilen, ob sie tatsächlich stimmt
Allerdings scheint er insgesamt so wütend auf AI zu sein, dass er offensichtliche Bereiche übersieht, in denen LLMs tatsächlich den Stand der Technik verändern
Coding scheint, wie Simon Willison kürzlich angemerkt hat, einer der zentralen Anwendungsfälle für LLMs zu sein, und selbst wenn das der einzige echte Anwendungsfall wäre, wäre das enorm nützlich
Nützlichkeit und Rentabilität sind nicht dasselbe, und ich denke, genau da spricht Ed einen wichtigen Punkt an. Bis Inferenz deutlich billiger wird, können diese Unternehmen keinen Gewinn machen, und einige wenige extrem große Player werden API-Token-Preise zahlen, die meisten aber nicht
Wenn AI-Unternehmen zig Milliarden Dollar Umsatz brauchen, um sich über Wasser zu halten, ist es zu 100 % unerheblich, ob 0,5 %, 5 % oder 50 % dieses Umsatzes daraus kommen, den Stand der Technik zu verändern
Entscheidend ist nicht, ob etwas transformativ ist, sondern dass diese Unternehmen nicht die Einnahmen haben werden, um ihre Rechnungen zu bezahlen, und wenn sie das nicht können, können viele andere Unternehmen es ebenfalls nicht
Deshalb bleibt es, ob transformativ oder nicht, ein Kartenhaus, das nur darauf wartet zusammenzubrechen. Um das zu ändern, braucht es nicht mehr „Transformation“, sondern ein Funktionsbündel, das die bestehende Nutzerbasis um ein Mehrfaches vergrößern oder die Preise um ein Mehrfaches erhöhen kann
In gewisser Weise ist das ziemlich erfrischend. Viele kritisieren diesen oder jenen Aspekt von AI und hängen am Ende doch noch einen Haftungsausschluss an wie: „Aber eigentlich mag ich AI wirklich und nutze es jeden Tag“
Vermutlich will man damit vermeiden, dass praktische Builder in die Kommentare stürmen und ruhig Nuancen liefern — oder, moderner gesagt, auf wütende Keyboard Warriors mit einem Chip auf der Schulter treffen —, und es ist ermüdend, sich durch diese Falsch-Ausgewogenheit zu lesen
Bei Zitron ist diese Kritik schwer zu äußern. Was auch immer man über ihn sagt, er hat keine Angst davor, so zu wirken, als würde er Partei ergreifen
Diese drei Positionen sind völlig voneinander getrennt. Man kann AI für sehr nützlich halten und sie trotzdem ablehnen, weil sie den eigenen sozialen Status mindern könnte, oder die Technologie mögen, aber Sam Altman für unehrlich halten
Dennoch scheinen viele Anti-AI-Kommentatoren seltsamerweise zu meinen, sie müssten alle drei Behauptungen zugleich vorbringen
Noch absurder ist, dass man sich gar nicht darum kümmern müsste, wenn sie wirklich nutzlos wäre. Der Markt würde am Ende schon herausfinden, dass sie nutzlos ist, alles würde sich normalisieren, und die Leute, die man nicht mag, würden Geld verlieren
Ich glaube natürlich nicht, dass sie sie wirklich für nutzlos halten. Ich denke eher, sie sorgen sich darum, was das für ihr Prestige bedeutet, und hoffen verzweifelt, dass irgendwann alle „aufwachen“ und die Überzeugung teilen, dass LLMs nur stochastische Papageien ohne Nutzen seien. Aber die Leute benutzen sie jeden Tag und sehen in Echtzeit, wie sie besser werden
Sein Argument ist, dass sehr große Dinge passieren müssten, wie es sie vor 2022 noch nie gegeben hat, damit diese Unternehmen profitabel werden. Dem stimme ich im Großen und Ganzen zu, aber ich denke, dass solche Dinge bereits seit einigen Jahren passieren und daher auch weiter passieren werden
Es gibt überhaupt keinen Grund, außer der allgemeinen Stimmung, zu glauben, dass Inferenz teuer ist. Daten und Intuition sprechen für hohe Margen
Diese Denkweise bestärkt meinen Eindruck, dass Leute, die es nicht wirklich verstehen, „AI ist nicht profitabel und zu teuer“ wie eine Art Katharsis als Reaktion auf enorme Fortschritte benutzen
Zitron ist kein Unternehmen, das mit erfolgreichen Vorhersagen Geld verdient, sondern eines, das Inhalte produziert
Es spielt keine Rolle, wie oft er oder ähnliche Leute sagen, das Ende sei gekommen; sie müssen nur ein einziges Mal richtig liegen
Derzeit hat er beim Thema Wirtschaftlichkeit allerdings eindeutig in Teilen recht. Es gibt bislang keinen Weg, wie sich diese gewaltigen Investitionen amortisieren sollen
Meiner Ansicht nach wird AI die Welt radikal verändern.
Ob zum Schlechteren, zum Besseren oder als Mischung aus beidem, ist möglich, aber daran selbst zweifle ich nicht.
Der Sprung mit den LLMs hat erst vor etwa 5–6 Jahren begonnen. Zum Vergleich: Funkwellen wurden 1886 entdeckt, Marconi nutzte sie 1895 für Kommunikation, und obwohl Telefon und Radio jahrzehntelang nebeneinander existierten, begann das eigentliche Wachstum von Mobiltelefonen und drahtloser Technik erst 1995.
Dass es so lange dauerte, lag nicht daran, dass die Physik der Funkwellen noch reifen musste, sondern daran, dass alles andere, was nötig war, um damit Geld zu verdienen, Zeit brauchte.
Für mich sind LLMs weniger AI als vielmehr Bausteine. Sie könnten dem Funk oder dem Transistor entsprechen.
Wir sehen bereits, dass man LLMs zu Agenten verknüpfen kann. Momentan sind die Kosten der harte begrenzende Faktor bei Coding und Agenten.
Wenn man nur Claude Code oder Codex will, geht es einigermaßen, aber es gibt viele LLM-Kombinationen, bei denen die meisten Leute sich Experimente gar nicht leisten können. Zum Beispiel ist es wegen der Kosten noch kein gangbarer Weg, NPC-Dialoge und Weltmechaniken in Spielen mit LLMs zu betreiben.
Wenn die Preise für Inferenz-Hardware sinken und sich die Inferenz-Algorithmen weiter verbessern, bin ich überzeugt und zugleich beunruhigt, dass wir Dinge sehen werden, die heute schwer vorstellbar sind.
Die Kosten sind nicht das Problem. Kontextuell konsistente Antworten und Szenarien sind zahlenmäßig begrenzt, deshalb muss ein LLM im Spiel nicht in Echtzeit Text erzeugen.
Stattdessen kann man mit einem LLM einen riesigen Korpus von „Atomen“ wie Dialognachrichten, Fragmenten und Hinweisen erzeugen und diese dann anhand der Spielereingaben deterministisch zusammensetzen. Vor der Implementierung sind auch Vorabprüfung und vielfältige Tests möglich.
Für Spieler, die im Spiel damit interagieren, wäre ein solches System innerhalb des vorgesehenen Interaktionsrahmens funktional kaum von generiertem Text zu unterscheiden.
Es hat zudem große Vorteile. Wenn Spieler aus der Rolle fallen und gezielt daran herumstochern, können die Nähte sichtbar werden, aber es lässt sich nicht so ausnutzen wie ein LLM.
Was für eine scharfsinnige Einsicht, zu vermuten, dass etwas Dinge besser, schlechter oder beides machen könnte.
Auch „wir sind noch zu früh dran“ wirkt seltsam. Es gab bereits mehrere Super-Bowl-Werbungen, Unternehmen, die die Tech-Nachrichten praktisch beherrschen, bringen Journalisten dazu, absurde Aussagen ihrer CEOs einfach zu wiederholen, und wenn sie behaupten, ihre Bewertung liege über 1 Billion Dollar, scheinen die Menschen, die befugt wären, die Finanzzahlen zu hinterfragen, nur noch zuzustimmen.
Es wurden Rechenzentren im Umfang von Hunderten Acres gebaut, Verträge für Rechenzentren abgeschlossen, die nie realisiert werden, und es werden jeden Monat zig Milliarden Dollar gefordert.
AI verschlingt das Silizium, und die Leute sehen mit eigenen Augen, wie sich die Hardwarepreise verdoppeln, verdreifachen oder noch weiter steigen.
Arbeitsplätze haben ihren Beschäftigten die Nutzung von AI aufgezwungen und sind dann zurückgerudert, als die Subventionen wegfielen und die Kosten sichtbar wurden, weil der Spaß vorbei war.
Trotzdem heißt es, wir bräuchten noch mehr Zeit, noch mehr Aufmerksamkeit, noch mehr Menschen, die hinschauen. Ich wüsste nicht, wo es in der Geschichte des Funks so etwas je gegeben hätte.
Simulation ist langweilig.
Eds Grundlage für die Einschätzung, dass „AI langsamer wird“, sind die Ausgabenobergrenzen der Unternehmen, insbesondere Ubers Limit von 1.500 Dollar pro Ingenieur und Monat für jedes Tool.
Ich deute dieselben Belege genau umgekehrt. Noch vor einem Jahr wäre die Vorstellung absurd gewesen, dass ein Unternehmen 1.500 Dollar pro Mitarbeiter und Monat für AI-Tools ausgibt, und man hätte sich gefragt, was man mit Ersatz-AI überhaupt tun müsste, damit es so viel kostet.
Aber mit dem Aufkommen von Coding-Agenten und zunehmend universell einsetzbaren Agenten ist die Nachfrage der Beschäftigten so hoch geworden, dass Unternehmen gezwungen sind, Limits einzuführen.
Der gesamte adressierbare Markt dieser AI-Unternehmen ist auf 1.500 Dollar pro Wissensarbeiter und Monat gesprungen, und ich verstehe nicht, wie das eine Verlangsamung sein soll.
Aber um die Kapitalrendite zu erreichen, müsste dieser Betrag oder mehr weltweit ausgegeben werden, und langfristig wird kein solches Budget genehmigt werden.
Unternehmen lieben Kostensenkungen, und in dem Moment, in dem sie glauben, es gebe einen anderen Weg zu gleichem oder besserem Wert, so wie sie nach Belieben Stellen abbauen, wird auch ein solches Budget schnell verschwinden.
Oder es verschwindet einfach wegen der Forderung der Aktionäre nach kurzfristigem Wert.
Das heißt, schon mit Claude Code und Cursor kommt man leicht auf 3.000 Dollar im Monat, und wenn Codex ebenfalls eine Option ist, können es 4.500 Dollar werden.
Und es ist eine weiche Obergrenze, die man überschreiten kann, wenn man sie so rechtfertigt, wie du es in deinem Blog geschrieben hast.