KI-Abonnements sind die Zeitbombe für Unternehmen

(thestateofbrand.com)

7 Punkte von GN⁺ 2026-05-18 | 7 Kommentare | Auf WhatsApp teilen

Anbieter wie OpenAI, Anthropic und Google bieten Unternehmen Abonnementpreise unter den tatsächlichen Bereitstellungskosten an, was bei Preisanpassungen zu erheblichen Kostenschocks führen kann
Die monatliche Flatrate von 20 US-Dollar für Claude Pro und ChatGPT Plus kann bei Vielnutzern tatsächliche, auf API-Preise umgerechnete Kosten von 200 bis 400 US-Dollar pro Sitz und Monat verursachen
Agentenbasierte KI erhöht durch lange autonome Ausführung den Token-Verbrauch massiv, und auch GitHub Copilot wechselt ab Juni 2026 zu nutzungsbasierter Abrechnung
Die monatlichen Abokosten eines 50-köpfigen Teams von 1.000 US-Dollar können auf Token-Basis tatsächlich bei 15.000 bis 40.000 US-Dollar pro Monat liegen, wodurch das Budgetrisiko stark steigt
Die IPO-Vorbereitungen von OpenAI und Anthropic erhöhen den Druck auf Margen und Unit Economics und könnten Preiserhöhungen, Nutzungslimits und den Umstieg auf verbrauchsbasierte Abrechnung beschleunigen

Die Lücke zwischen KI-Abo-Preisen und den tatsächlichen Kosten

Führende KI-Anbieter wie OpenAI, Anthropic und Google stellen Unternehmenskunden ihre Dienste zu Abonnementpreisen unter den tatsächlichen Bereitstellungskosten bereit. Wenn Unternehmen diese Preise als dauerhaften Maßstab ansehen und darauf ihre Workflows aufbauen, können spätere Preisanpassungen zu erheblichen Kostenschocks führen
Claude Pro kostet 20 US-Dollar pro Monat und bietet Sonnet 4.6, Opus 4.6, Websuche, Code-Ausführung, Dateierstellung und etwa das Fünffache der Nutzung des kostenlosen Tarifs
Auf API-Basis kostet Sonnet 4.6 3 US-Dollar pro 1 Million Eingabetokens und 15 US-Dollar pro 1 Million Ausgabetokens; bei Opus 4.6 sind es 5 US-Dollar pro 1 Million Eingabetokens und 25 US-Dollar pro 1 Million Ausgabetokens
Wenn Wissensarbeiter Claude täglich mehrere Stunden nutzen, Dokumente hochladen sowie Berichte erstellen und Daten analysieren, können sie pro Woche mehrere Millionen Tokens verbrauchen; auf API-Gebühren umgerechnet kann das auf 200 bis 400 US-Dollar pro Sitz und Monat steigen
Berichten zufolge verlor Microsoft bei GitHub Copilot mehr als 20 US-Dollar pro Nutzer und Monat, und bei Vielnutzern stiegen die Compute-Kosten eines 10-US-Dollar-Abos auf 80 US-Dollar
Analysen zufolge verbrauchten Anthropic-Nutzer mehr als 8 US-Dollar Compute pro 1 US-Dollar Abo-Umsatz. OpenAI-Produkt-VP Nick Turley bezeichnete die Preisstruktur von Abonnements als eher zufällig entstanden und verglich eine mögliche schrittweise Abschaffung unbegrenzter Tarife mit unbegrenztem Stromverbrauch
ChatGPT Plus kostet seit drei Jahren 20 US-Dollar pro Monat, obwohl in dieser Zeit Funktionen wie Bildgenerierung, Code-Interpretation, Sprachmodus, agentenbasierte Schlussfolgerung und Websuche hinzugekommen sind

Gemeinsame Preisstrategie der großen Anbieter

Google bündelt Gemini Advanced im Google-One-AI-Premium-Paket für 20 US-Dollar pro Monat, berechnet den API-Zugang zum selben Modell jedoch separat
Meta stellt Llama kostenlos bereit und subventioniert die Compute-Kosten von Hunderten Millionen KI-Anfragen auf seinen eigenen Plattformen über Werbeumsätze
xAI hat den API-Eingabepreis von Grok auf 0,20 US-Dollar pro 1 Million Tokens gesenkt; das wird als Modell betrachtet, das Verluste in Kauf nimmt, um Marktanteile zu gewinnen
Das gemeinsame Muster ist, Preise eher auf Verbreitung als auf Wirtschaftlichkeit auszurichten, Organisationen an sich zu binden und KI zu einem zentralen Abhängigkeitspunkt im Arbeitsalltag der Teams zu machen, während die Kostenfrage vertagt wird
OpenAI macht Berichten zufolge Verluste im Consumer-Abo-Geschäft und prüft offenbar eine strategische Verlagerung hin zu Enterprise, wo die Unit Economics vergleichsweise weniger schlecht sind
Laut The Wall Street Journal verfehlte OpenAI auf dem Weg zum IPO wichtige Umsatz- und Nutzerziele, und auch das subventionsgestützte Preissystem zeigt erste Risse

Agentenbasierte KI verschlechtert die Kostenstruktur

Beim klassischen Chatbot-Einsatz führten Fragen und Antworten zu einem relativ vorhersehbaren Token-Verbrauch, doch agentenbasierte KI erhöht durch lange autonome Ausführungen den Token-Verbrauch deutlich
Claude-Code-Sitzungen laufen lange Zeit autonom und verbrauchen Tokens in weit höherem Tempo als interaktive Nutzung
Einige Nutzer berichteten, ein 5-Stunden-Rate-Limit-Fenster in nur 90 Minuten ausgeschöpft zu haben
GitHub kündigte an, Copilot ab 1. Juni 2026 auf nutzungsbasierte Abrechnung umzustellen, weil das Flatrate-Modell bei agentenbasierten Workloads nicht mehr funktionierte
GitHub erklärte, Copilot habe sich stark weiterentwickelt und agentenbasierte Nutzung „werde zum Standard“, wodurch Compute- und Inferenzanforderungen steigen
Sam Altman sagte öffentlich, OpenAI müsse nun ein Unternehmen für KI-Inferenz werden; das passt zu der Einschätzung, dass agentenbasierte Nutzung ein grundsätzlich anderes ökonomisches Modell erfordert
Agent Teams, bei denen in Engineering-Teams mehrere KI-Instanzen parallel an einem Projekt arbeiten, treiben die Kosten stark nach oben. Wenn Entwickler 3 bis 4 Coding-Agenten gleichzeitig ausführen, kann der Token-Verbrauch im Vergleich zu einfacher Konversation nicht nur um ein Mehrfaches, sondern um Größenordnungen steigen

Das Kostenrisiko, das Unternehmen nicht messen

In den vergangenen zwei Jahren haben viele Unternehmen KI-Abonnements tief in den operativen Betrieb integriert: Marketing erstellt Texte mit ChatGPT Plus, Engineering nutzt Claude Pro für Schreiben und Review von Code, und Teams in Research, Customer Success und Finance setzen KI für Dokumentzusammenfassungen, Ticket-Zusammenfassungen und Szenariomodellierung ein
Wenn 50 Personen Claude Pro nutzen, liegen die aktuellen Kosten bei 1.000 US-Dollar pro Monat, und bei ChatGPT Plus ähnlich, sodass KI in der Gewinn-und-Verlust-Rechnung wie ein kleiner Posten wirkt
Berechnet man jedoch die tatsächliche API-Nutzung desselben Teams auf Basis des Token-Verbrauchs, kann das je nach Nutzungsintensität 15.000 bis 40.000 US-Dollar pro Monat betragen und damit zu einer Ausgabenkategorie werden, die einen eigenen Budgetposten braucht
Wenn die Preise angepasst werden, erhalten Unternehmen, die KI für 20 US-Dollar pro Monat als dauerhaft günstigen Input eingeplant haben, plötzlich Rechnungen, die nicht im Budget vorgesehen waren — zu einem Zeitpunkt, an dem KI bereits tief in den Workflows verankert und kaum noch zu entfernen ist
Subventionen schaffen Abhängigkeit, und Abhängigkeit wird für Unternehmen zur Falle, weil sie Preiserhöhungen nur schwer ausweichen können
Laut KPMGs Q1 2026 AI Quarterly Pulse erwarten US-Organisationen in den kommenden 12 Monaten durchschnittliche KI-Ausgaben von 207 Millionen US-Dollar, fast doppelt so viel wie im Vorjahreszeitraum
Einer Goldman-Sachs-Umfrage zufolge überschreiten viele Großunternehmen ihre KI-Budgets bereits um zweistellige Prozentsätze, und KI-Ausgaben könnten in naher Zukunft an Ingenieursgehälter heranreichen
Swami Chandrasekaran, Leiter des AI & Data Lab von KPMG North America, sagte Marketplace, dass sich noch vor ein oder zwei Quartalen praktisch niemand um die Kosten des LLM-Verbrauchs gekümmert habe
Der Wirtschaftswissenschaftler Brian Jabarian von der University of Chicago, der Unternehmen bei der KI-Transformation berät, sagt, dass die Zeit komme, in der die Rechnung fällig wird

IPOs könnten eine Preisanpassung erzwingen

OpenAI und Anthropic bereiten sich auf einen IPO vor, und dabei könnte der Druck wachsen, die Lücke zwischen Abo-Preis und tatsächlichen Kosten zu verkleinern
Berichten zufolge hat Anthropic einen annualisierten Umsatz von mehr als 30 Milliarden US-Dollar erreicht, ein Anstieg gegenüber 9 Milliarden US-Dollar Ende 2025
Für OpenAI wird ein Umsatztempo von rund 25 Milliarden US-Dollar genannt
OpenAI rechnet bis 2029 mit einem kumulierten Cash-Burn von 115 Milliarden US-Dollar und soll bis 2030 Compute-Ausgaben von 665 Milliarden US-Dollar zugesagt haben
Oracle soll für den Bau von Rechenzentren für OpenAI in einem Geschäftsjahr 43 Milliarden US-Dollar Schulden aufgenommen haben
Solange Unternehmen privat sind und Venture Capital verbrennen, können sie Inferenzkosten subventionieren, Modelle mit Verlust betreiben und Tarife von 20 US-Dollar pro Monat aufrechterhalten, obwohl die Bereitstellung mehr als 100 US-Dollar kostet
Nach einem IPO verlangen die öffentlichen Märkte Margen, Analysten Unit Economics und Investoren einen Weg zur Profitabilität, der nicht auf unbegrenzter Finanzierung beruht
Die schnellsten Wege, die Preislücke zu schließen, sind Preiserhöhungen, Nutzungslimits und der Wechsel zu verbrauchsbasierter Abrechnung — und alle drei könnten bestehende Unternehmenskunden stark treffen

Signale einer Preisanpassung sind bereits sichtbar

GitHub wechselt am 1. Juni 2026 zu nutzungsbasierter Abrechnung und ersetzt Premium-Anfragen in der Flatrate durch tokenbasierte AI Credits
Microsoft hat die Preise für Microsoft 365 innerhalb von vier Jahren zweimal erhöht; die jüngste Erhöhung ist direkt mit den Kosten der KI-Infrastruktur verbunden
OpenAI hat mit dem 100-US-Dollar-Pro-Tier einen neuen realistischeren Preisbereich für Vielnutzer eingeführt
Das 200-US-Dollar-Max-Tier von Anthropic ist ein Beispiel dafür, welche Kosten ein verlässliches Nutzungsniveau tatsächlich verursachen kann, wenn die Subvention endet
Geoff Webb, VP bei Conga, sagte mit Blick auf den Wettlauf um die frühe Dominanz im KI-Markt, das Ausmaß dieses Wettbewerbs sei enorm, ebenso die Kosten, ihn zu beherrschen; daher seien große Veränderungen bei Geschäftsmodellen und Servicepreisen im Zuge von Monetarisierung und Kapitalrückfluss wahrscheinlich und könnten schnell eintreten

Was Unternehmensleitungen jetzt tun sollten

Unternehmen sollten nicht nur Sitze zählen, sondern den tatsächlichen Token-Verbrauch je Team auditieren
Sie sollten modellieren, wie sich die KI-Kosten bei Szenarien mit 2x, 5x und 10x gegenüber dem heutigen Preis verändern würden
Sie sollten Vendor-Optionalität in ihren Stack einbauen, damit eine Preisänderung eines einzelnen Anbieters das Budget nicht plötzlich sprengt
Sie sollten die Kostenlücke bei KI mit dem CFO besprechen, bevor der CFO das Thema selbst aufbringt
Die Differenz zwischen dem, was eine Organisation heute für KI zahlt, und dem, was sie in 18 Monaten zahlen wird, könnte für viele Unternehmen zu einem der größten Kostenanstiege überhaupt werden
Es könnte Unternehmen geben, die erklären müssen, warum ein Tool, das früher günstiger als das Team-Mittagessen war, plötzlich ein sechsstelliges Jahresbudget verlangt
Die Ära der Subventionen geht zu Ende, und viele Unternehmen haben diese Diskussion noch nicht einmal begonnen

7 Kommentare

hmmhmmhm 2026-05-18

Scheint dasselbe Thema zu sein wie damals bei den Mainframes..
Wenn sich die Konstellation ergibt, dass Server teuer sind und Ressourcen knapp, während persönliche Computer langsam sind,
am Ende werden auch Server billiger und persönliche Computer leistungsfähiger werden ... Ich glaube, Zeit wird die Antwort sein.

GN⁺ 2026-05-18

Hacker-News-Kommentare

Alle AI-Abos sind für Frontier-Model-Anbieter wie eine Zeitbombe
In ein paar Jahren wird man lokale Modelle, die so gut sind wie die heutigen Frontier-Modelle, fast ohne nennenswerte Kosten betreiben können, und die Unternehmensbasis der Frontier-Firmen wird zusammenbrechen
- Ich weiß nicht, worauf sich die Aussage stützt, dass man „in ein paar Jahren lokale Modelle betreibt, die so gut sind wie die heutigen Frontier-Modelle“
  Allein die Speicheranforderungen sind enorm, und noch eine ganze Weile wird es viel kosteneffizienter sein, gemeinsam genutzte spezialisierte Hosting-Hardware mit hoher Auslastung zu verwenden
- Anders gesagt sind Frontier-Modelle Vermögenswerte, die wegen des Wettbewerbs am Markt sehr schnell an Wert verlieren
  Sie müssen sich ständig verbessern, um einander und den Open-Weight-Modellen voraus zu bleiben, also sind sie eher das Gegenteil einer Zeitbombe
  Inferenz-Tokens auf dem heutigen Niveau werden immer billiger werden, und ob lokal der Endzustand ist, weiß ich wegen der hohen Hardwareanforderungen nicht, aber Wettbewerb drückt die Margen tendenziell nahe null
  Eine längere Diskussion zu diesem Thema: https://corecursive.com/the-pre-training-wall-and-the-treadm...
- Ich habe im letzten Monat ein kleines Demo gebaut, das Qwen, Gemma und Deepseek hinter LiteLLM hängt und zeigt, wie die Zukunft aussehen könnte
  Wir überwachen den Token-Verbrauch und bewegen uns aktiv darauf zu, die Inferenzkosten zu senken und ins Unternehmen zu holen, statt stumpf Unmengen an Tokens zu verbrauchen
  Mein Chef war sehr zufrieden, und jetzt wird es breiter ausgerollt. Ich denke, das ist die Zukunft
- Die Behauptung, dass wir in ein paar Jahren lokale Modelle betreiben werden, die so gut sind wie die heutigen Frontier-Modelle, ist sehr zweifelhaft
  Auch die Skalierungsgesetze sind bereits belastend geworden, und man sollte nicht auf die Übertreibung vom „Exponentialen“ hereinfallen
  Außerdem ist der eigentliche Wettbewerber das Frontier-Modell von in zwei Jahren
- Ohne wichtige Durchbrüche bei Hardwareproduktion oder Modellarchitektur ist eher das Gegenteil der Fall
  Im Vergleich zu vor 1–2 Jahren braucht man heute größere, teurere und energiehungrigere Hardware
Der überzogene Tonfall der Texte beider AI-Lager ist einfach ermüdend
Ich würde gern mit jemandem, der sich wirklich mit der Ökonomie und dem Geschäft der Token-Anbieter auskennt, vor einem Whiteboard stehen und mir das „wie einem Fünfjährigen“ erklären lassen
Ist es für Token-Anbieter ein Margenspiel und für Konsumenten ein Spiel um Service-/Produktqualität, und wenn sich die Linie von Qualität und Marge irgendwann kreuzt, ist es dann ein Rennen, diesen Punkt zu erreichen, bevor das Geld ausgeht? Falls ja: Gibt es historische Beispiele, bei denen die Lücke zwischen beiden sehr groß war?
LLMs wirken insofern einzigartig, als es praktisch keine Grenze dafür gibt, „wie viel besser“ Konsumenten sie erwarten, und sie unterscheiden sich damit von Diensten wie E-Mail, die aus Sicht der Rechenressourcen leicht skalieren
Das ist eine sehr grundlegende Frage, aber ich frage mich auch, warum man an die Börse gehen will, bevor überhaupt ein nachhaltiges Geschäftsmodell existiert. Was ist der Vorteil?
- Wenn man AI nach den Produktionskosten von Opus-Tokens fragt, bekommt man als Antwort 0,216 Dollar pro Million Tokens inklusive Hardware, Strom, Kühlung und Hosting
  Laut den hier verlinkten Quellen entfallen etwa 30 % der Anthropic-Ausgaben auf Inferenz, die übrigen 70 % auf Forschung und Entwicklung wie das nächste Modell
  Wenn man das berücksichtigt, Gewinn aufschlägt und die Zahlen vereinfacht, müsste man für etwa 1 Dollar pro Million Tokens verkaufen, um Geld zu verdienen
  Der aktuelle API-Preis liegt bei 25 Dollar pro Million Tokens, daher habe ich keinen Zweifel an der Profitabilität
  Wenn man dagegen den Max-Plan für 200 Dollar im Monat extrem ausreizt, kann man bis zu 10 Milliarden Tokens pro Monat verbrauchen; das entspricht 0,02 Dollar pro Million Tokens, also einer gewaltigen Verlustübernahme, und das wird irgendwann verschwinden
  Bei etwa 100 Millionen Tokens pro Monat im Anthropic-Plan für 100 Dollar verdient das Unternehmen allerdings Geld
  Um 10 Milliarden Tokens pro Monat zu verbrauchen, muss man extrem lange arbeiten und wirklich sehr gut im Umgang mit AI sein; solche Leute nutzen AI wahrscheinlich schon seit Jahren und konnten auch schon vor Opus Nutzen daraus ziehen
  Sie wären enttäuscht, wenn sie Opus verlieren, aber gerade diese Nutzer können in der Regel auch schwächere Modelle gut einsetzen, sodass sie in ein paar Jahren auf intern gehostete Open-Source-Modelle umsteigen und dennoch auf ein heutiges Niveau von 0,02 Dollar pro Million Tokens kommen könnten
  Deshalb überzeugt mich die pessimistische Stimmung des Artikels nicht. Die Lage wird sich ändern, aber das bedeutet nicht das Ende der AI-Nutzung
Ich stimme der Grundstimmung des Textes zu, aber der Stil wirkt zu LLM-mäßig
Vor allem die Abschnittsstruktur und Punchlines wie „That is not a rounding error. That is a line item that needs its own budget code.“
- Claude erzeugt solche Sätze wirklich sehr oft
  Das ist ziemlich nervig, und bei Gemini habe ich das mit demselben Prompt nicht so oft gesehen
- Ich weiß nicht einmal, wer diesen Text überhaupt geschrieben hat
  Im Artikel steht kein Autorenname
- Pangram markiert diesen Text mit hoher Sicherheit als 100 % AI-generiert
Brad Gerstner hat bestätigt, dass Tokens nicht mit Verlust verkauft werden
Unabhängig davon, wie die Formel API und Abos aufteilt, machen die Unternehmen beim reinen Tokenverkauf Gewinn
Wenn man Gehälter und Aktienvergütung einrechnet, kann es Verluste geben, aber die Tokens selbst sind derzeit profitabel
- Es ist, als würde man eine Rakete mit dem stärksten Triebwerk der Welt sehen, die nach dem Erreichen der Umlaufbahn den Motor abstellt und sagt: „Sie fliegt jetzt ohne Antrieb“
  Im Moment mag das stimmen, aber so ist sie nicht hierhergekommen
  Die Investitionen, die wieder eingespielt werden müssen, liegen bei Billionen Dollar, während die Umsätze bestenfalls im Milliardenbereich liegen; deshalb geht die Rechnung, dass Tokens in naher Zukunft Gewinn abwerfen, nicht auf
- Tokens können zwar mit Gewinn verkauft werden, aber 70 % der Ausgaben für Rechenleistung gehen in Forschung, Entwicklung und Modelltraining[0]
  Inferenz muss nicht nur für sich genommen profitabel sein, sondern auch diese Kosten mittragen
  [0] https://epoch.ai/data-insights/openai-compute-spend
- Sie verkaufen nicht mit Verlust, aber auch nicht teuer genug, um die aktuellen Verluste und Kosten zu decken
  Die Verluste werden in einer merkwürdigen zirkulären Finanzierungsstruktur weitergereicht, und irgendwann könnte das in einer Schuldenkrise zusammenbrechen
- Anders gesagt: AI-Unternehmen haben vor Kostenabzug positive Gewinne
- Ob das auch für Claude-Code- oder Codex-Tokens gilt, weiß ich nicht
  Ich vermute, dass dort stark subventioniert wird, aber das sind die einzigen Dinge, bei denen ich tatsächlich Wert spüre
Das Problem mit „AI“ insgesamt ist, dass es leicht ist, ohne sie zu leben
Die AI-Unternehmen wissen das, die Nutzer wissen das, und selbst der AI-freundlichste Manager weiß das
Wenn man sich vorstellt, dass weltweit sofort jede AI entfernt würde, wäre das Ergebnis einfach normales Arbeiten wie bisher
Der Artikel betont diesen Punkt nicht genug. Geht es darum, dass man Angst vor dem Tag haben soll, an dem PR-Reviews wieder von echten Ingenieuren gemacht werden müssen?
- Ich glaube, am Anfang jeder neuen Technologie ist das immer so
  Je tiefer die Technologie integriert wird, desto weniger stimmt das
  Dasselbe hätte man auch ein paar Jahre nach dem Aufkommen des Elektromotors sagen können, man hätte eben weiter mit Dampf gearbeitet
  Aber heute würde die Gesellschaft zusammenbrechen, wenn man ohne Elektromotoren leben müsste
  Die Frage ist nicht, ob man jetzt ohne sie auskommt, sondern ob das auch in 5–10 Jahren noch gilt, nachdem sie vollständig integriert ist
- Wahrscheinlich deshalb wird noch stärker gedrückt
  Nicht um ehrliche Umsätze zu erzeugen, sondern um AI-Produkte so tief einzubetten, dass „wir entfernen die AI einfach“ nicht mehr wie eine Option wirkt
  Selbst wenn die laufenden Kosten weiter steigen und irgendwann das Niveau von staatlichen Rettungsaktionen für Fluggesellschaften übertreffen
  Es ist eine neue vermittelnde Schicht zur Wohlstandsabschöpfung, verkauft mit falschen Versprechen
- Wer JavaScript nutzt, wird das natürlich so sehen
  Zumindest zum Schreiben von JavaScript kann ich ohne AI nicht mehr leben
- Es wirkt immer seltsam, wenn empfohlen wird, AI-Tools selbst für ganz gewöhnliche und allgemeine Aufgaben zu verwenden
  Als wären sie ein Haustier, das stirbt, wenn man es nicht ab und zu benutzt
Der Artikel liegt falsch. Solche Abos werden Unternehmen sehr wohl angeboten
Firmen zahlen Beträge, die viel näher an den API-Preisen liegen
Die Strategie besteht darin, Privatnutzer an unbegrenzte Tokens zu gewöhnen und dann zu hoffen, dass sich dieses Verhalten in den Arbeitsplatz überträgt
- Werden sie
  Team- oder Enterprise-Sitze sind teurer als Verbraucherpreise, aber es sind Festpreise mit zurückgesetzten Nutzungslimits
  Man kann Mitgliedern Sitze zuweisen, die den Plänen für 20/100/200 Dollar pro Monat entsprechen, oder alles komplett nutzungsbasiert abrechnen
  Es gibt viele Arten zu kaufen
- Abos werden Unternehmen definitiv angeboten
  Es gibt auch nutzungsbasierte Pläne, die den entsprechenden Verbraucherplänen gleichkommen
- Ich war verwirrt, warum hier von Enterprise-Abos gesprochen wird
  In meinem Unternehmen wird nach API-Nutzung abgerechnet
- Solche Absätze wirken eher wie etwas, das AI ausgespuckt hat
  „Im Großen und Ganzen ist das Muster dasselbe. Preisgestaltung für Einführung, nicht für Wirtschaftlichkeit. Organisationen binden. AI zum tragenden Teil der täglichen Arbeit jedes Teams machen. Sich um die Rechnung später kümmern.“
- Außerdem ist selbst die im Text dramatisierte Größenordnung der API-Kosten weiterhin relativ gering
  10.000 Dollar im Monat sind nicht nichts, aber wenn man damit ein Team aus 10–20 Ingenieuren unterstützt, ist das ein ziemlich guter Hebel
Ich habe das Original nicht bis zum Ende gelesen, aber ich konnte erkennen, dass es von AI geschrieben wurde
OpenRouter könnte vielleicht als Referenzpunkt für die Bereitstellungskosten von AI-Anbietern dienen
Ich höre ständig, dass es ein besseres Preis-Leistungs-Verhältnis als Claude habe; wenn das stimmt, scheint Anthropic entweder aus irgendeinem Grund besonders ineffizient zu sein oder bei Inferenz Gewinn zu machen
Beim Training könnten sie Geld verlieren, aber das ist möglicherweise einfach die Kostenstruktur, um ein führendes Forschungslabor zu bleiben
Wenn ein einzelnes Unternehmen wegen Schulden oder Ähnlichem zusammenbricht, könnten Unternehmen doch einfach wechseln, oder?
Wenn ich noch einmal Formulierungen wie „It’s not X. It’s Y.“ oder „load-bearing“ als Metapher sehe, muss ich mich übergeben
- Ich habe ziemlich viele solcher Ausdrücke generiert, und die Liste ist nicht kurz
  „Das Zeitalter der Subventionen endet nicht elegant. Es zeigt überall Risse.“
  „Die Frage ist nicht, ob es ein guter Deal war. Die Frage ist, wie lange der Deal hält.“
  „Ein Entwickler, der gleichzeitig drei oder vier Coding-Agenten laufen lässt, verbraucht nicht drei- oder viermal so viele Tokens wie bei einem Chat-Gespräch. Nicht um eine einstellige Größenordnung mehr, sondern um mehr als eine Größenordnung.“
  „Das sind keine Experimente mehr. Das sind tragende Workflows.“
  „Das ist kein Rundungsfehler. Das ist ein Posten, der einen eigenen Budgetcode braucht.“
- Wenn es zu einer großen Preisanpassung kommt, könnten viele Leute, die mit kostenlosen oder 20-Dollar-Abos Social-Media-Kommentare generiert haben, nach Sicht der tatsächlichen Kosten wieder selbst schreiben
  Zumindest darf man das hoffen
- Ich mag auch die Formulierung „the unlock“ überhaupt nicht
- Dieser Text war am Anfang noch okay
  Es gab Daten, und die Logik war plausibel, aber ungefähr zur Mitte hin kam dann Trendbeispiel, noch ein Beispiel, ein drittes Beispiel und „es ist nicht einfach X, sondern Y“
  Es nervt ungefähr so sehr, wie einen gut geschriebenen Text zu lesen, dann auf den Quellenlink zu klicken und einen Rickroll zu bekommen
Enterprise-Kunden nutzen kein Claude-Pro-Abo für 20 Dollar im Monat
Unser Unternehmen stellt Entwicklern ein Nutzungslimit im Wert von etwa 1.000 Dollar pro Monat bereit, und soweit ich sehe, liegt die Ersparnis gegenüber API-Kosten höchstens bei 30 %
Das ist keine verrückte Subventionshöhe
Für andere Rollen sind oft nur 50 Dollar pro Monat erlaubt, und diese Leute schöpfen ihr Limit trotzdem ständig aus
GitHub Copilot arbeitet bei Business- und Enterprise-Sitzen schon länger so, wird aber bald an Grenzen stoßen
Ich denke, nach der Neuordnung der Verbraucher-Accounts Pro und Pro+ ab Juni wird das schnell nachziehen
Bei OpenAI beunruhigt mich am meisten, dass sie Tokens herausblasen, um Kunden zu binden; deshalb fürchte ich nach einem IPO dort starke und plötzliche Änderungen bei Preisen und Bedingungen
Anthropic handelt in diesem Punkt bereits verantwortungsvoll, und auch GitHub Copilot versucht in den kommenden Monaten offenbar, übermäßige Subventionen zu korrigieren
- Eigentlich hat nur GitHub Copilot wirklich absurde Subventionen gegeben
  Weil dort nicht nach Tokens, sondern pro „Request“ abgerechnet wurde
  Eine einzelne Anfrage im Wert von 3 Cent konnte gemessen an Tokens mehr als 20 Dollar verbrennen, und dieses Modell endet in diesem Monat
  Ich war auch besorgt, weil ich GHCP für große Arbeitsblöcke genutzt habe, aber der neue Kostenschätzer zeigte nach API-Preisen etwa 150–200 Dollar pro Monat
  Das ist zwar eine Subvention gegenüber einem 20-Dollar-Abo, aber keine völlig verrückte
  Wer agentenartige Coding-Tools intensiv und verantwortungsvoll nutzt, landet nach API-Preisen wahrscheinlich grob bei 200 Dollar im Monat
  Wenn der Anbieter selbst bei diesem Preis noch Geld verdient, ist das für Unternehmen im Westen angesichts der eingesparten Entwicklerzeit nicht schwer zu akzeptieren
  Das eigentliche Risiko liegt bei Vibe-Codern mit privaten Projekten
  Die Zeit, in der man mit subventionierten Plänen riesige Apps missbrauchen konnte, geht zu Ende
Wenn sie Entwickler ersetzen, ist ein Preis über 20 oder 100 Dollar im Monat plausibel
Das eigentliche Problem der LLM-Unternehmen ist, dass sie außerhalb des Codings noch keinen Wert gezeigt haben
Ohne das würden sie einfach zu Coding-Tools herabgestuft
Deshalb eilen sie jetzt, und entscheidend ist, welche Workflows sich noch stärker automatisieren lassen
Papierkram ließe sich vielleicht vollständig automatisieren
Wenn andere Bereiche ausgebaut werden, werden sie ihr Preismodell ändern
- Es gibt auch einige Versuche, Figma zu ersetzen
  Das könnte durchaus Wert haben

taekim34 2026-05-19

Um Token zu sparen, ist es wichtig, in Echtzeit zu prüfen, „wie viel ich gerade verbrauche“. Gerade tokenbasierte Abrechnung schlägt im Unterschied zu einer Abogebühr je nach Nutzungsmuster nichtlinear aus, daher muss man auf Sitzungsebene sehen können, wo Kosten versickern, um reagieren zu können. Wenn Sie in einer Claude Code-Umgebung arbeiten, probieren Sie einmal cc-token-saver (https://github.com/ww-w-ai/cc-token-saver) aus. Das Tool zeigt Kosten pro Sitzung und Abschnitt in Echtzeit an, blockiert bei ablaufendem Cache automatisch teure erneute Übertragungen und delegiert schwere Aufgaben automatisch an kostengünstige SubTasks.

iolothebard 2026-05-18

Am Ende wird man es sowieso nutzen.
Das iPhone 3 kostete 200–300 Dollar … heute liegt es locker bei weit über 1000 Dollar, und man nutzt es trotzdem. Man hat schon Blut geleckt.

prunusnira 2026-05-18

Es scheint, dass der Aufbau lokaler LLMs zunehmend verbreitet sein wird.

master6559 2026-05-18

Wenn es zu teuer ist, benutzt man es eben nicht..

aer0700 2026-05-18

Vermutlich erhöhen die LLM-Provider die Preise, weil sie davon ausgehen, dass Unternehmen es trotz der hohen Kosten nutzen werden. Ich bin gespannt, wie sich Open-Source-LLMs wie GLM, qwen und deepseek künftig entwickeln. Die Leute werden wohl anfangen zu rechnen, ob sie diesen Preis zahlen müssen, um Frontier-Modelle zu nutzen, oder ob es sinnvoller ist, stattdessen Open Source zu verwenden, selbst wenn man sich die Mühe machen muss, eine eigene vLLM-Infrastruktur aufzubauen.