Ich denke, Anthropic und OpenAI haben Product-Market-Fit gefunden

(simonwillison.net)

9 Punkte von GN⁺ 2026-05-28 | 1 Kommentare | Auf WhatsApp teilen

Die Coding- und General-Agenten von Anthropic und OpenAI zeigen größeres Umsatzpotenzial über nutzungsbasierte Enterprise-Abrechnung als über Consumer-Abos
Heavy User von Claude Code und Codex verbrauchen mit einem Abo für 200 US-Dollar pro Monat Token im Wert von 2.180,16 US-Dollar zu API-Preisen, während Enterprise-Kunden von ähnlichen Rabatten ausgeschlossen sind
Im April 2026 legten beide Unternehmen die Enterprise-Kosten von Codex und Claude Code/Cowork auf das Niveau der öffentlichen API-Preise fest und brachten zudem teurere Frontier-Modelle heraus
Von 703 Stellenausschreibungen bei OpenAI wurden 229, von 390 bei Anthropic 105 als Enterprise-Vertrieb/-Support eingeordnet, was eine klare Verlagerung hin zum Direktvertrieb zeigt
Die Kostenkontroversen bei Uber und Microsoft lassen sich weniger als AI-Scheitern lesen als als Signal für Preisakzeptanz: Kunden empfinden die Preise als schmerzhaft, nutzen die Produkte aber trotzdem

Enterprise-Kunden beginnen, API-Preise zu zahlen

Der Max-Plan für 100 US-Dollar pro Monat von Anthropic und der Pro-Plan für 100 US-Dollar pro Monat von OpenAI sind für Heavy User von Coding-Agenten extrem vorteilhaft bepreist
Rechnet man die Nutzung der letzten 30 Tage mit ccusage zu API-Tokenpreisen um, entspricht Anthropic Claude Code 1.199,79 US-Dollar, OpenAI Codex 980,37 US-Dollar
- Zusammen sind das 2.180,16 US-Dollar an Tokens für 200 US-Dollar
- Selbst beim Maßstab „ziemlich intensive Nutzung“ und nicht dem Dauerbetrieb von Agenten den ganzen Tag entsteht bereits eine große Differenz
Die Annahme, Unternehmen würden bei großflächigem Einsatz von Agenten ähnliche Rabatte erhalten, hat sich als falsch erwiesen
Anthropic scheint seinen Enterprise-Plan in den letzten sechs Monaten von einer Struktur mit „genug Nutzung für einen typischen Arbeitstag“ zu 20 US-Dollar pro Sitzplatz und Monat plus nutzungsbasierter API-Abrechnung geändert zu haben
- Im August 2025 hieß es noch: „Claude seats include enough usage for a typical workday”
- Der Bericht von The Information ist zwar vom 14. April 2026, aber ein Anthropic-Sprecher sagte, die Preisänderung sei bereits im November 2025 erfolgt
- Bestehende Kunden erfahren von den Änderungen derzeit bei der Vertragsverlängerung
OpenAI führte im April 2026 eine ähnliche Preisänderung ein
- Laut der Codex rate card wurde die Codex-Bepreisung am 2. April 2026 von einer Abrechnung pro Nachricht auf API-Tokennutzung umgestellt
- Die Änderung vom 2. April galt für neue und bestehende Plus-, Pro- und ChatGPT-Business-Pläne sowie für neue ChatGPT-Enterprise-Pläne
- Am 23. April wurde sie auch auf alle bestehenden ChatGPT-Enterprise-Pläne ausgeweitet, einschließlich Edu, Health, Gov und ChatGPT for Teachers
- Die Preise werden zwar als „Credits“ angezeigt, scheinen aber den API-Tokenkosten je Modell zu entsprechen
Seit April 2026 entsprechen die Enterprise-Kosten von OpenAI Codex und Anthropic Claude Code/Cowork den öffentlichen API-Preisen
Im selben Monat brachten beide führenden Modellanbieter zudem teurere Frontier-Modelle heraus
- GPT-5.5, veröffentlicht am 23. April, kostet über die API doppelt so viel wie GPT-5.4
- Opus 4.7, veröffentlicht am 16. April, ist unter Berücksichtigung des neuen Tokenizers etwa 1,4-mal teurer als Opus 4.6
Im April 2026 fielen die Einführung hochpreisiger Frontier-Modelle und die Umstellung von Enterprise-Kunden von bisherigen starken Rabatten auf API-Preise zeitlich zusammen

Einschätzung: Product-Market-Fit ist erreicht

Die plötzliche Preisoffensive von Anthropic und OpenAI könnte zwar auch mit IPO-Vorbereitungen zusammenhängen, wichtiger ist aber wohl, dass Coding- und General-Agent-Produkte wie Claude Code/Cowork und Codex offenbar Product-Market-Fit gefunden haben
ChatGPT wurde zwar ein Massenphänomen, ließ sich aber nur schwer in Umsatz verwandeln
- OpenAI erklärte im Februar, ChatGPT habe mehr als 900 Millionen wöchentliche aktive Nutzer
- Zahlende Consumer-Abonnenten lagen bei 50 Millionen, also 5,6 % der Gesamtzahl
10 bis 20 US-Dollar pro Monat und Nutzer sind ein ordentliches Geschäft, aber um 1 Billion US-Dollar Infrastrukturkosten zu tragen, müssten 1 bis 2 Milliarden Abonnenten über vier Jahre gehalten werden
Ein Modell, bei dem Unternehmen mehr als 200 US-Dollar pro Nutzer und Monat ausgeben, kann viel schneller zu großen Umsätzen führen
- Bei Power Usern fällt pro Anbieter bereits Nutzung in einer Größenordnung an, die API-Kosten von rund 1.000 US-Dollar pro Monat entspricht
Coding-Agenten verbrauchen deutlich mehr Tokens, werden aber zum Alltagswerkzeug hochbezahlter Fachkräfte
- Der Schwerpunkt liegt derzeit vor allem bei Softwareingenieuren
- Weil sie Aufgaben automatisieren können, die sich durch Eingaben an einen Computer bearbeiten lassen, sind sie auch für ein breiteres Spektrum qualifizierter Wissensarbeiter relevant
Die im November 2025 veröffentlichten Modelle hoben Agenten auf ein wirklich nützliches Niveau; in den folgenden sechs Monaten begannen Unternehmen, sich an die Technik anzupassen und tatsächlich mehr Geld auszugeben
Man könnte argumentieren, dass ChatGPT bereits im Februar 2023 als am schnellsten wachsende Consumer-App der Geschichte Product-Market-Fit erreicht hatte, damals aber noch keine substanziellen Umsätze erzeugte
Die Kombination aus Coding-Agenten und Enterprise-Preismodellen wirkt wie der Punkt, an dem diese Unternehmen anfangen, sehr reale Umsätze zu erzielen

Der Enterprise-Fokus zeigt sich auch im Hiring

Auch die öffentlichen Stellenausschreibungen von OpenAI und Anthropic deuten darauf hin, dass Enterprise-Agenten Product-Market-Fit erreicht haben
OpenAI hat derzeit 703 Stellenanzeigen, davon werden 229 beziehungsweise 32,6 % dem Enterprise-Vertrieb oder -Support zugeordnet
- Darunter Account Executives, „Go To Market“ und „Forward Deployed Engineers“
Anthropic hat 390 Stellenanzeigen, davon wirken 105 beziehungsweise 26,9 % enterprise-orientiert
Ironisch ist, dass AI-Labore sich für ein arbeitsintensives Enterprise-Sales-Modell entschieden haben
- Enterprise-Verträge kommen nur zustande, wenn viele Menschen beteiligt sind
Die Hiring-Analyse wurde durch Scraping der Karrierewebsites mit Claude Code durchgeführt und lief über die JSON API von Datasette, Datasette Cloud und Datasette Agent; die Ergebnisse sind in einem gist veröffentlicht

Kostenkontroversen als AI-Misserfolg zu deuten, ist schwach begründet

Es gibt mehr Berichte, wonach Großunternehmen wegen stark steigender AI-Kosten Alarm schlagen, aber die oft zitierten Beispiele wirken überzeichnet
Fall Uber
- Das meistdiskutierte Beispiel ist ein Bericht von The Information, in dem Uber-CTO Praveen Neppalli Naga sagte, Uber habe „im Jahr 2026 in wenigen Monaten das gesamte jährliche AI-Budget aufgebraucht“
- Ein erheblicher Teil des Kostenanstiegs wird dort Claude Code zugeschrieben
- Da Claude Code erst im November 2025 wirklich deutlich besser wurde, ist es nicht überraschend, dass ein 2025 aufgestelltes Budget die Nachfrage von 2026 nicht vorhersehen konnte
- Auch Aussagen von Uber-COO Andrew Macdonald im Podcast Rapid Response heizten die Debatte an, doch die betreffende Stelle ist inhaltlich begrenzt
- Andrew Macdonald sagte, 25 % der Code-Commits des vergangenen Quartals seien über Claude Code entstanden, doch es sei schwer, den Produktivitätsgewinn damit zu verknüpfen, ob tatsächlich gestrichene Projekte wiederbelebt oder für Kunden 25 % mehr nützliche Funktionen gebaut wurden
- Daraus entstanden Schlagzeilen wie Business Insiders „AI tokenmaxxing spending is getting harder to justify”
Fall Microsoft
- Ein weiteres populäres Beispiel ist die Geschichte, Microsoft habe begonnen, Claude-Code-Lizenzen zu kündigen
- Oberflächlich betrachtet sollte das Ingenieure dazu bewegen, stattdessen den eigenen Copilot-CLI-Agenten zu nutzen
- Tom Warren von The Verge berichtete unter Berufung auf Quellen, die Entscheidung habe auch finanzielle Gründe und stehe im Zusammenhang mit Microsofts Geschäftsjahresende am 30. Juni
- Beide Fälle lassen sich weniger als AI-Scheitern lesen als als Signal für Preisakzeptanz: Der Preis schmerzt, aber Kunden entscheiden sich letztlich trotzdem dafür
- Das passt zur Sichtweise, dass ein guter Produktpreis dort liegt, wo Kunden kurz schlucken und dann trotzdem „ja“ sagen
- Ubers Budgetüberschreitung und Microsofts Sitzplatzkündigungen wirken wie reale Beispiele dieses Effekts

Auch die Ausgaben der AI-Labore selbst sind enorm

Große AI-Labore geben sowohl für Training als auch für Inferenz Milliardenbeträge aus
Präzise und verlässliche Zahlen sind selten, aber im jüngsten SpaceX-S-1 steckt ein großer Hinweis auf Anthropic
SpaceX erklärte, im Mai 2026 mit Anthropic PBC Cloud Services Agreements abgeschlossen zu haben, die Zugang zu Compute-Kapazität von COLOSSUS und COLOSSUS II bieten
- Anthropic habe zugestimmt, SpaceX bis Mai 2029 monatlich 1,25 Milliarden US-Dollar zu zahlen
In seiner Ankündigung erklärte Anthropic, der Vertrag ermögliche es, „die Nutzungslimits für Claude Code und die Claude API zu erhöhen“
- Das deutet stark darauf hin, dass Colossus nicht für das Modelltraining, sondern für Inferenz verwendet wird
Anthropic hat bereits enorme Compute-Kapazitäten bei anderen Anbietern gesichert
- Dass allein für zusätzliche Kapazität bei einem einzelnen Anbieter 1,25 Milliarden US-Dollar pro Monat ausgegeben werden sollen, zeigt, wie groß das Inferenzbudget geworden ist

API-Umsätze verlieren relativ an Bedeutung

In den vergangenen zwei Jahren schien bei OpenAI der Anteil der Abo-Umsätze größer zu sein, während bei Anthropic API-Umsätze stärker ins Gewicht fielen
Historisch hing Anthropics API-Umsatz stark von einigen wenigen großen API-Kunden ab
- Laut einem Bericht von VentureBeat vom August 2025 entfielen damals 1,2 Milliarden US-Dollar der 4 Milliarden US-Dollar Umsatz auf die beiden Kunden Cursor und GitHub Copilot
Nun heißt es, Anthropic könne im zweiten Quartal 10,9 Milliarden US-Dollar Umsatz erreichen und womöglich erstmals operativ profitabel werden
Die Enterprise-Verschiebung deutet darauf hin, dass die Labore glauben, mit weniger Zwischenhändlern und direktem Vertrieb an Kunden mehr Geld verdienen zu können
Claude Code von Anthropic konkurriert direkt mit Cursor und Copilot
- Dass Cursor in eigene Modelle investiert, wirkt in diesem Kontext folgerichtig

April 2026 ist ein neuer Wendepunkt

November 2025 kann als November inflection point gelten: GPT-5.1 und Opus 4.5 wurden in Kombination mit ihren jeweiligen Coding-Agent-Harnesses erstmals wirklich brauchbar
In den folgenden sechs Monaten haben sich Unternehmen an Agentensysteme angepasst, die zuverlässig nützliche Arbeit erledigen
April 2026 scheint ein neuer Wendepunkt zu sein, an dem die Umsatzwirkung dieses Technologiesprungs ernsthaft sichtbar wird
- Zum Vorteil der Frontier-AI-Labore
- Mit spürbaren Auswirkungen auf die Budgets großer Unternehmen
Wenn künftig die S-1-Unterlagen von Anthropic und OpenAI für ihre IPOs veröffentlicht werden, lässt sich die Realität dieses Moments an geprüften Zahlen ablesen

1 Kommentare

GN⁺ 2026-05-28

Hacker-News-Kommentare

In den kommenden 5 Jahren müssen 5–10 Billionen Dollar wieder hereingeholt werden, andernfalls wird man beginnen, den Ausbau der Hardware abzuschreiben
Das bedeutet, dass jährlich mehr als 1 Billion Dollar an Token-Ausgaben nötig wären. Geht man von weltweit 200 Millionen Wissensarbeitern und 30 Millionen Entwicklern aus, dann wäre das eine Welt, in der 5 % aller Gehälter von Wissensarbeitern und bei Entwicklern sogar 20 % in Token fließen müssten
In meinem Umfeld heißt es, dass solche Tools bei Aufgaben, die Unternehmen tatsächlich wichtig sind, die Geschwindigkeit real um 20–40 % erhöhen. Wenn 20 % mehr Ausgaben nur 20 % mehr Tempo bringen, ist es schwer, jährliche Ausgaben von 1 Billion Dollar zu rechtfertigen
So weit sind wir noch nicht. Im Moment befinden wir uns auf dem ansteigenden Abschnitt des Hype-Zyklus, und wenn Entwickler bei wichtigen Aufgaben nicht 2x, 5x oder 10x produktiver werden, dürfte das nicht gut ausgehen
- Ich habe dazu ein paar Gedanken. Betrachtet man nur öffentlich verfügbare Informationen, scheint das Verhältnis zwischen Inferenzkosten und Trainingskosten widersprüchlich zu sein
  Elektroingenieure, die mit Rechenzentren zu tun haben, sprechen so, als seien die Lastspitzen beim Stromverbrauch während Trainingsläufen ein zentraler Faktor für das Design, während Paper zum kostenoptimalen Scaling die Rechenmenge bei der Inferenz mit großer Sicherheit als wichtigen Faktor behandeln
  Ein Argument dafür, dass Training selbst nach Abschreibung deutlich rechenintensiver ist als Inferenz, ist, dass chinesische Anbieter mit stark eingeschränktem Zugang zu Rechenressourcen zu niedrigeren Preisen nahezu unbegrenzte Token anbieten, aber eine schwächere Modellleistung haben. Es würde Sinn ergeben, wenn US-Anbieter die Inferenzkosten um das 20- bis 30-Fache aufblähen, weil darin abgeschriebene Trainingskosten stecken, die ausländische Anbieter nicht tragen konnten
  Wenn Trainingskosten viel höher sind als Inferenzkosten, stecken diese Unternehmen in einem Gefangenendilemma, das noch deutlich schlimmer ist als im üblichen Wettbewerbsmodell mit Grenzkosten von null. Wenn umgekehrt die Inferenzkosten höher sind, könnte die Analyse stimmen, dass es sich, wie manche Denker sagen, eher um ein Utility-Geschäft handelt. Für CEOs ist der Anreiz groß, das so darzustellen. Denn wenn stattdessen das Gefangenendilemma sichtbar wird, könnte das Investment sehr schnell versiegen
  Das Einzige, was überhaupt leicht an Fakten heranreicht, sind Gerüchte von Facility Engineers; der Rest ist eher High-Level-Analyse und Sesselmanagement über ein geheimes Geschäft. Das zeigt den aktuellen Stand des Verständnisses
  Solange man nicht einmal das Verhältnis zwischen abgeschriebenen Investitionsausgaben und Betriebskosten kennt, ist externe Investorenanalyse unmöglich. Man kann die Buchhaltung für Büro- und Zimmerpflanzen noch so fein aufdröseln — wenn der größte Teil des Geschäfts durch Betriebsgeheimnisse verdeckt ist, bringt das nichts
- Ich arbeite in einem sehr kleinen Unternehmen mit 150 Millionen Dollar Jahresumsatz und 9 % Nettomarge, und wir prüfen bereits, ob wir 100.000 Dollar für Hardware ausgeben, um lokale Modelle zu betreiben, weil sie für uns gut genug sind
  Die erwarteten Ausgaben für AI-as-a-Service werden diese Kosten in weniger als einem Jahr übersteigen
  Es wirkt wahrscheinlich, dass es in einigen Jahren Hardware geben wird, auf der selbst sehr kleine Unternehmen Frontline-Modelle für die meisten Aufgaben zu erschwinglichen Preisen betreiben können
- Beobachtungen unterscheiden sich natürlich, aber meine unterscheiden sich auch nicht so sehr davon. Nur ist das ein Blick von unten nach oben. Müsste man es zu diesem Zeitpunkt nicht auch von oben nach unten sehen?
  Wenn wir die Phase des bloßen Potenzials hinter uns gelassen haben und in echte Produktivitätsgewinne eingetreten sind, warum zeigt sich das dann nicht in den Kennzahlen auf Kundenseite?
  Warum hat Delta Airlines in den letzten 3 Monaten seine operative Effizienz nicht deutlich verbessert, weil bessere Software eingeführt wurde?
  Ich frage das wirklich aus ehrlichem Interesse. Ich sehe dort einen Bruch
- Ich erinnere mich noch sehr klar an etwas, das mein Ökonometrie-Professor Ende der 1990er bis Anfang der 2000er gesagt hat, als ich an der Universität war
  Als Kabelfernsehen und Pay Per View aufkamen, gab es Studien dazu, wie viele Filme Menschen schauen würden, wenn sie unbegrenzten Zugang hätten, und die Ergebnisse kursierten als Beleg dafür, dass die komplette Infrastruktur für dieses Geschäft aufgebaut werden müsse. Als Statistiker die Daten aber genauer analysierten, kamen sie zu dem Schluss, dass die Leute geantwortet hatten, sie würden jeden Tag, 7 Tage die Woche, 10–12 Stunden am Tag Filme schauen. Das war unmöglich
  Im Moment fühlt es sich ähnlich an. Manche gehen davon aus, dass alle bis zum Maximum Token nutzen werden und dass Token trotz Verbesserungen bei Hardware, Software, Design und Marktdruck niemals billiger werden
- Ein Faktor, den man berücksichtigen sollte, ist, dass die zugrunde gelegte Bevölkerungsbasis in den kommenden 5 Jahren nicht unverändert bleiben wird
  Jede Generation von Entwickler-Tools hat den absoluten Code-Durchsatz erhöht und dabei neue Entwicklerklassen und Nutzer hervorgebracht
  Das war schon seit den ersten Compilern so, über die Framework-Ära hinweg bis heute, und das nötige Kompetenzniveau, um Entwickler zu werden, ist gesunken. In den mittleren bis späten 1980ern brauchte man Master- oder Promotionsniveau in Informatik, um Anwendungen zu schreiben, später reichte das Niveau von Bachelor-Studenten und IT-Ingenieuren, Informatiktheorie wurde weitgehend optional, danach ging es weiter hin zu Hochschulabsolventen mit etwas Training, und über No-Code-/Low-Code-Tools wie retool vor 2022 geht es nun weiter zu agentischen Codegenerierungsdiensten wie v0/Replit
  Die nächste Entwicklergeneration wird Anwendungen und Architekturen nicht so bauen wie die vorherige. Die meisten hier würden sie wohl auch nicht mit dem Qualitätsniveau bauen, das pg beim Aufbau dieser Plattform hatte, aber das spielt keine Rolle, solange Nutzer darin Wert sehen. Die zahllosen Unternehmensanwendungen mittlerer Qualität beweisen das bereits
  Die Logik dieser Geschäfte ist letztlich also, dass die Zahlen 200 Millionen / 30 Millionen nicht konstant bleiben werden. Ich glaube auch nicht, dass diese Veränderung groß und schnell genug sein wird, um die Investitionsausgaben zu rechtfertigen. Aber völlig unrealistisch ist es nicht, weil auch Web 1, Web 2.0, SaaS und die mobile Revolution ziemlich schnell neue Nutzer- und Entwicklerklassen hervorgebracht haben
  [1] HN ist mit seiner Custom-Lisp-Implementierung ein starker Ausreißer, aber in früheren Epochen gab es viele Beispiele, in denen Entscheidungen zwar moderater waren, aber dennoch für solide Architekturen standen, und ein solches Kompetenzniveau ist unter heutigen Gründergenerationen womöglich schwerer zu finden
Diese Analyse ist verwirrend. Product-Market Fit (PMF) im Coding-Bereich wurde vermutlich schon letztes Jahr erreicht. Profitabilität ist eine andere Frage, und dazu weiß man es noch nicht.
Der Text vermischt beides, ohne ein starkes ökonomisches Argument oder überzeugende Zahlen vorzulegen. Ich verstehe auch nicht, warum das Uber-Beispiel relevant sein soll. Selbst der Uber-COO hat klar gesagt, dass zumindest aus Sicht des Return on Investment keine Ergebnisse zu sehen sind.
Meiner Ansicht nach war das Produkt schon vor einigen Monaten fürs Coding sehr nützlich. Aber es ist ganz sicher nicht zu jedem Preis nützlich.
- Verwirrend ist, dass die Leute die Entwicklungskurve zu ignorieren scheinen. Dabei ist das vielleicht der wichtigste Punkt, der hier untergeht.
  Wie Simon sagte, ist es erst sechs Monate her, dass „gut genug“ Coding-Agenten aufgetaucht sind, und das ist ein Wimpernschlag. Trotzdem hat sich meine Arbeit in unserem Unternehmen komplett verändert, und das ist fast traumhaft.
  Und das ist nur ein einziger Wendepunkt. Es gab bereits mehrere Wendepunkte, und weitere liegen noch vor uns. Ich kann nachvollziehen, dass der ROI bei absurd hohen Unternehmenskosten heute noch nicht positiv ist, aber es ist vollkommen vernünftig, schon jetzt den Weg zu bereiten für das, was in ein paar Monaten und erst recht in ein paar Jahren kommt.
- PMF ist ein seltsam definiertes Konzept, fast so, als gelte: „Wenn man nicht sicher ist, dass es existiert, dann existiert es nicht.“
  Für Leute, die sich die Zeit genommen haben, es zu nutzen und zu verstehen, war es schon vor Monaten eindeutig nützlich. Inzwischen hat sich dieses Wissen aber auch zu denjenigen verbreitet, die über das Budget entscheiden, und sie sind überzeugt, dass es nicht nur ein Hype oder eine Modeerscheinung ist. Deshalb scheint man PMF jetzt „beanspruchen“ zu können.
  Ich stimme aber zu, dass es seltsam ist zu sagen: „Die da haben PMF.“ Normalerweise ist das ein Begriff, den man für das eigene Produkt definiert.
- Stimmt. Kosten sind ebenfalls Teil der Wirtschaftlichkeit.
  Deshalb wäre es für viele hier besser, sich nicht in die Diskussion einzumischen. Sie wiederholen nur die Vorteile, ohne die Kosten und deren Auswirkungen auf die Finanzlage eines Unternehmens zu benennen und zu erklären.
- Der Text legt zu viel Gewicht auf das Wort „gut“, und das macht die Analyse für mich fragwürdig.
  „Den November 2025 nenne ich einen November-Wendepunkt, weil GPT-5.1 und Opus 4.5 in Verbindung mit ihren jeweiligen Coding-Agent-Harnesses besser geworden sind. Sie sind gut genug geworden, um nützliche Arbeit zuverlässig zu erledigen, und wir haben uns in den vergangenen sechs Monaten an Agentensysteme angepasst.“
- Es soll gar kein logischer Text sein. Eher ein LLM-Evangelisten-Blog, und kritische Analysen, die der Branche nicht wohlgesonnen sind, gibt es fast gar nicht.
  Wenn man andere Texte liest, findet man kaum Skepsis, dafür umso mehr Inhalte darüber, wie großartig das alles sei.
Dieser Text hat ein bisschen etwas von einer AI-Psychose.
„Diese Tools verbrennen viel mehr Tokens, werden aber schnell zu Alltagswerkzeugen für Arbeiten, die von sehr hoch bezahlten Fachkräften erledigt werden.“
„Irgendwie wurde daraus eine Schlagzeile wie: ‚Uber-COO sagt, es werde schwieriger, Ausgaben für den übermäßigen Verbrauch von AI-Tokens zu rechtfertigen‘, weil der Markt für AI-Misserfolgsgeschichten immer noch riesig ist.“
Ja klar, es ist einfach nur der Wunsch, dass AI scheitert. Es können unmöglich explodierende Kosten, Rekordumsätze und Massenentlassungen sein. Ebenso wenig kann es sein, dass bereits hoch bezahlte Leute mit diesen Tools Geld verbrennen und dabei überhaupt keinen zusätzlichen „Wert“ schaffen. Ich gestehe zu, dass der Output 100-fach ist, während die Ergebnisse bei allen Kennzahlen flach bleiben.
[1] https://cmr.berkeley.edu/2025/10/seven-myths-about-ai-and-pr...
[2] https://futuretech.mit.edu/publication/crashing-waves-vs-ris...
- Was genau ist mit Psychose gemeint?
Wenn GLM-5.1 ähnlich gut ist, Open Source und viel günstiger, wie wollen OpenAI und Anthropic dann ihre Kunden halten?
Das Geschäftsmodell scheint nicht zu funktionieren. Ein sehr enger Freund von mir entwickelt tatsächlich Automatisierungssoftware für Großunternehmen und nutzt weder Claude noch OpenAI
Er verwendet hauptsächlich gpt 120b und GLM-5.1 auf Cerebras für aufwendige Denkaufgaben und für verschiedene andere Aufgaben kleinere Modelle. Alles Open Source
Diese Systeme sind für Unternehmen sehr nützlich und können sehr stabile und schnelle vollautomatische Pipelines betreiben
Wir sprechen oft über dieses Thema, und wir beide haben den Eindruck, dass Unternehmen, die mit Claude und OpenAI aufwendige Agentenaufgaben erledigen, nicht genau wissen, wie sehr Open Source im letzten Jahr besser und günstiger geworden ist
Wenn dann etablierte Unternehmen und Entwickler aufholen, werden Claude und OpenAI ihre Kosten doch nicht wieder hereinholen können, oder?
- GLM-5.1 ist nicht auf demselben Niveau. Mit Opus in Claude Code kann es nicht mithalten. Probier es einfach selbst aus. Open-Source-Modelle liegen mindestens etwa 1 Jahr zurück
- Ich stimme zu, dass das Geschäftsmodell nicht erkennbar ist. Aus Sicht von Porters 5 Kräften ist das ein Albtraum
  In diesem Bereich werden extrem viele Unternehmen konkurrieren, und obwohl die Kapitalintensität einen gewissen Burggraben schafft, wird es trotzdem praktisch unendlich viele Wettbewerber geben
  Für Verbraucher ist das gut
- Beim Coden sollte man immer das beste Modell des jeweiligen Bereichs nutzen, nicht ein Modell, das vor einem Jahr das beste gewesen wäre. Genau dort steht GLM 5.1
  Das sage ich als großer Fan davon, weil das Preis-Leistungs-Verhältnis von GLM gut genug ist, um es für Übersetzungsseiten zu nutzen
  Im Moment steckt das meiste Geld im Coding. Wenn OpenAI und Anthropic auch nur 6 Monate vor den modernsten Open-Source-Modellen bleiben, können sie den Großteil des Unternehmens- und Entwicklermarkts mitnehmen
- Ich habe über OpenRouter mehrere große offene Modelle in OpenCode als Coding-Hilfe ausprobiert, und alle waren im Vergleich zu Claude Opus ziemlich schlecht
  Kannst du einen Hinweis geben, wie man mit offenen Modellen mehr Wert herausholt?
  Ich stimme der verbreiteten Aussage zu, dass offene Modelle etwa 1 Jahr zurückliegen. Aber vor ungefähr 1 Jahr ist etwas Magisches passiert, durch das Modelle auf dem neuesten Stand extrem nützlich wurden. Nach dieser Logik müssten offene Modelle bald ebenfalls gut funktionieren, aber ich mache mir Sorgen, dass mehr dahintersteckt, als einfach nur darauf zu warten, dass sich die Erde noch einmal dreht
  Zur Einordnung: Mein Anwendungsfall ist Coding-Hilfe. Für andere Zwecke können offene Modelle großartig sein
- Muss man nicht 5.000–10.000 Dollar ausgeben, um diese Modelle zu betreiben, die „so gut wie Frontier-Modelle“ sein sollen?
  Ich habe noch nie eine überzeugende Analyse zum ROI selbst betriebener Coding-Modelle gesehen. Besonders nicht im Vergleich zu einem 20- oder 200-Dollar-Monatsplan
Die Formulierung „für 200 Dollar 2.180,16 Dollar an Token“ ist seltsam
Token haben keine inhärenten Kosten oder keinen inhärenten Wert. Zu sagen, man habe Token im Wert von 2.180,16 Dollar verbraucht, ist ungefähr so, als würde man einem Verkäufer glauben, der einen davon überzeugen will, dass ein Topfset für 19,99 Dollar eigentlich 1 Milliarde Dollar wert ist
Es ist schon komisch, wie Leute beim Bewerten voreingenommener Quellen ihr kritisches Denken aus dem Fenster werfen
- Ich bin mir nicht sicher, worauf du hier hinauswillst
  Ich habe 200 Dollar ausgegeben. Hätte ich API-Preise gezahlt, wären es 2.180,16 Dollar gewesen. Im Beitrag geht es darum, dass Unternehmenskunden API-Preise zahlen, und wenn ich bei so einer Firma angestellt gewesen wäre, hätte ich dem Unternehmen Kosten von 2.180,16 Dollar verursacht
  Was habe ich übersehen?
- Token haben eindeutig berechenbare inhärente Kosten. Es gibt die Grenzkosten der Produktion, also die Inferenzkosten, und außerdem die anteilig abgeschriebenen F&E-Kosten für das Modell, das diese Token erzeugt
  Den Wert zu berechnen ist schwierig, aber zum Glück gibt es genau dafür den Marktpreis-Mechanismus. Es gibt keine bessere Zahl als den Preis, den Menschen zu zahlen bereit sind
  Also ja, im Unternehmensplan würde man 2.180,16 Dollar ausgeben. Die Person selbst zahlt das nicht, aber das Unternehmen tut es
- Nach einer groben Rechnung für mein Projekt ist die Bezahlung pro Token bei OpenRouter konkurrenzfähig oder manchmal sogar günstiger, als dasselbe Open-Weights-Modell auf gemieteten GPUs zu betreiben
  Die Preise pro Token liegen sowohl bei geschlossenen Frontier-Modellen als auch bei Open-Weights-Modellen in einem ähnlichen Bereich, nämlich bei Cent bis Dollar pro Million Token. Für mich ist das ein Signal, dass diese Preise einigermaßen realitätsbasiert sind
- Mit nur ein wenig kritischem Denken liest sich der Satz als „Token im Wert von 2.180 Dollar zu aktuellen API-Preisen“
- Natürlich gibt es inhärente Kosten. Die Untergrenze sind die Stromkosten. Es ist wirklich komisch, wie Leute beim Bewerten voreingenommener Quellen ihr kritisches Denken aufgeben
Das eigentliche Timing liegt darin, dass es derzeit an starker Nachfrage nach neuen Geschäften fehlt und zugleich genügend technologische Vermögenswerte aufgebaut wurden, sodass Arbeit immer mehr zu inkrementeller Arbeit wird
Das bedeutet, dass man stabile Funktionen auf einem riesigen Bestand früherer Arbeit aufbauen kann, und genau da glänzt AI besonders. Deshalb hätten Unternehmen auch ohne AI weniger Softwareingenieure eingestellt, wenn die meiste Arbeit nur darin besteht, eine Funktion hinzuzufügen, einen Bug zu beheben oder ein wenig Konfiguration anzupassen. AI hat diesen Druck nur beschleunigt
Stell dir umgekehrt vor, dieselbe AI hätte es schon vor 20 Jahren gegeben. Das wäre anders. Hätte AI damals, als die Leute noch versuchten, JAX-RS zu verstehen, Jersey wirklich nutzen können? Hätte sie alle Fragen zu React beantworten können, als React gerade erst erfunden wurde? Hätte sie den Personalbedarf zum Aufbau öffentlicher Cloud-Infrastruktur oder ganzer sogenannter Big-Data-Plattformen auf ein Zehntel reduzieren können? Damals entwickelte sich alles so schnell, dass man viele Ingenieure brauchte, um unzählige Möglichkeiten zu erkunden. Ich bezweifle auch stark, dass man mit AI das Machine-Learning-Ökosystem mit einem Zehntel der Belegschaft hätte aufbauen können. Vor 20 Jahren war R das Maß der Dinge und das Python-Ökosystem überhaupt nicht ausgereift. Dasselbe gilt für Mobile Computing: Hätte AI die Zahl der Menschen, die alle mobilen Apps und die zugrunde liegende Infrastruktur bauen, auf ein Zehntel reduzieren können?
- Bei „Hätte AI alle Fragen zu React beantworten können?“ würde ich wegen In-Context Learning (ICL) sagen: ja
  Bei „Hätte sie öffentliche Cloud-Infrastruktur oder Big-Data-Plattformen mit einem Zehntel der Leute bauen können?“ würde ich nein sagen. Die Kernprobleme löst sie nicht, und mit wachsender Größe richtet sie Chaos an
  Bei inkrementeller Arbeit stimmt das. Allerdings war historisch gesehen die meiste Arbeit inkrementell, und F&E-Rollen waren eine Minderheit
Man muss anerkennen, was anzuerkennen ist. Das Ganze ist der größte Schwindel der Geschichte.
Es gibt nützliche Anwendungsfälle für AI, aber nicht zu den aktuellen Preisen. Ich nutze AI seit GPT-2 zusammen mit ziemlich vielen Heavy Usern. Alle Nutzer erzählen dieselbe Geschichte: Neugier, Staunen, Hype, Abscheu, Erkenntnis. Unternehmen sind gewöhnlich etwas langsamer, und gerade befinden wir uns im Hype-Zyklus. Genau an diesem Punkt verkauft man alle Verträge und geht an die Börse.
Wirklich wie aus dem VC-Lehrbuch.
Was man nicht missverstehen sollte: Es gibt nützliche Einsatzfälle für AI. Nur nicht in der Form, wie sie es wollen. Das ist ziemlich ähnlich wie bei Blockchain. Die Idee einer dezentralen Währung hat eine Existenzberechtigung. 99 % der anderen Coins nicht.
AI ist eine schnellere, aber weiterhin ungenauere Suchmaschine. Zum Finden von Bugs ist sie großartig, und auch für Rubber-Duck-Debugging ist sie gut.
Ich nenne es einen Schwindel, weil es zusammen mit dem Marketing weltweit unzähligen Menschen den Eindruck vermittelt, sie könnten jetzt Startups, Spiele, Infrastruktur usw. bauen, ohne selbst lernen zu müssen. Das Ergebnis sind Millionen verlassener Projekte und Produkte von niedriger Qualität. Die meisten haben nie die mentalen Modelle aufgebaut, die nötig sind, um ein Problem wirklich gründlich zu lösen. Am Ende verschwenden sie Monate und Geld und verbrennen nur Tokens. Das nenne ich einen Schwindel.
Alle Early Adopter, die ich kenne, haben ihre Nutzung stark reduziert, nicht wegen des Geldes, sondern weil es keine neuen Anwendungsfälle gibt. Wenn ich ein neues Projekt erkunde, kann ich mich damit schnell einarbeiten und viel lernen, und danach gehe ich zu Dokumentation und echten Tests über. Meine Nutzung ist auf dem niedrigsten Stand der letzten zwei Jahre.
Ich werde nicht zulassen, dass AI meinen Code anfasst. Ich habe Angst, dass sie sich wieder hineinschleicht. Stattdessen lasse ich sie meinen Code lesen und mir sagen, was ich falsch gemacht habe, damit ich mich selbst verbessern kann.
Hunderte Unternehmen können so etwas anbieten, einschließlich Open-Source-Lösungen.
Meine nichttechnischen Freunde stecken gerade alle im Hype-Zyklus und erzählen mir von der kommenden Begeisterung und der vorhersehbaren Enttäuschung.
In gewisser Weise ist es beeindruckend, dass AI, ob bewusst oder unbewusst, so gründlich auf VC-Art genutzt wurde, um vor den Augen der ganzen Welt riesige Unternehmen aufzubauen.
- Kannst du mir helfen, die ursprüngliche Behauptung zu ordnen?
  Bedeutet das, dass Coding-Modelle, die Tokens verbrauchen, einen nicht positiven ROI haben und deshalb ein Schwindel sind? Also zum Beispiel, dass sie nicht genug Wert schaffen, um 100 Dollar im Monat zu rechtfertigen?
  Bedeutet das, dass Unternehmenskunden nicht klug genug sind, das zu erkennen?
  Bedeutet es letztlich, dass es sich um eine blockchainartige Fata Morgana handelt und man an die Börse geht, um die CEO-Erträge zu maximieren?
  Habe ich das richtig verstanden, oder lege ich dir Worte in den Mund?
  Der Teil mit „den Leuten den Eindruck zu vermitteln, sie könnten jetzt ihr eigenes Startup, Spiel oder ihre eigene Infrastruktur bauen, ohne selbst lernen zu müssen“ — ist das nicht ein Strohmann, auch wenn man die Überzeugungen und Motive der Leute nicht endgültig festlegen kann? AI ist ein mächtiges Werkzeug, das Menschen verstärkt. Man kann nicht einfach einen Prompt wie „Erstelle mir eine Enterprise-SaaS-App im Wert von 1 Milliarde Dollar“ oder „Mach GTA6, ohne zu halluzinieren“ eingeben. Aber ist das wirklich der Eindruck, der entsteht? Sagen Dario und Sam, „Kauft unser Coding-Agent-Abonnement, dann könnt ihr ohne technisches Wissen in einem Rutsch ein Spiel bauen und reich werden“?
  Dass man heute keinen Wert in AI-Agenten sieht, kann völlig nachvollziehbar sein. Es kann sich auch einfach irgendwie falsch anfühlen. Aber sie als Schwindel auf dem Niveau von Blockchain zu bezeichnen, scheint mir den enormen Signalen zu widersprechen und auch den tatsächlichen Gesprächen darüber, was diese Systeme heute können und was man bis Ende dieses Jahres von ihnen erwartet.
Soweit ich gelesen habe, ist Anthropic in Wirklichkeit nicht profitabel und wirkte nur kurz wegen Rabatten profitabel. Dieser Artikel legt die Behauptung gut dar: https://www.wheresyoured.at/anthropics-profitability-swindle...
Ich bin skeptisch, ob die aktuellen Preiserhöhungen ausreichen, und ebenso skeptisch, ob die meisten Nutzer und Unternehmen die künftig nötigen noch größeren Preiserhöhungen akzeptieren werden. Besonders für Privatnutzer sind 200 Dollar im Monat bereits extrem teuer, und ich glaube nicht, dass die meisten Preise wie 1.000 Dollar im Monat zahlen würden.
News rund um LLMs sollte man wohl einfach ignorieren, bis diese Unternehmen nach dem IPO sind. Es gibt viele Bots, die positive Stimmung erzeugen.
200 Dollar pro Seat und Monat sind gar nichts.
Eines der 3D-CAD-Lizenzpakete, die die Leute in unserer F&E-Gruppe nutzen, kostet mehrere tausend Dollar pro Seat und Monat.
Software-Seats haben es verdient, auch mal geliebt zu werden.
- AutoCAD kostet 175 Dollar pro Monat und Nutzer [1]
  [1] https://www.autodesk.com/products/autocad/buy
- Stimmt, es ist nicht viel, aber das ist auch nicht das, was Unternehmen tatsächlich zahlen. Wie im Artikel steht, liegt der Preis bei 20 Dollar pro Seat und Monat plus API-Nutzungsgebühren pro Token.
  Unternehmen zahlen also keine „All-you-can-eat“-Flatrate, sondern nutzungsbasierte Abrechnung.
- Selbst die teuerste CATIA-Lizenz, die ich gesehen habe, lag bei ungefähr 600 Dollar pro Monat und Nutzer. Wo hast du „mehrere tausend Dollar“ pro Seat gesehen?
- Wenn man jetzt noch die Gehälter der Ingenieure dazurechnet, merkt man, dass Software-Seats bereits teurer sind als diese F&E-Seats.
- Wird CAD ein Werkzeug werden, das alle Arbeitenden benutzen?

Ich denke, Anthropic und OpenAI haben Product-Market-Fit gefunden

Enterprise-Kunden beginnen, API-Preise zu zahlen

Einschätzung: Product-Market-Fit ist erreicht

Der Enterprise-Fokus zeigt sich auch im Hiring

Kostenkontroversen als AI-Misserfolg zu deuten, ist schwach begründet

Fall Uber

Fall Microsoft

Auch die Ausgaben der AI-Labore selbst sind enorm

API-Umsätze verlieren relativ an Bedeutung

April 2026 ist ein neuer Wendepunkt

Verwandte Beiträge

1 Kommentare

Hacker-News-Kommentare