KI-Abonnements sind die Zeitbombe für Unternehmen
(thestateofbrand.com)- Anbieter wie OpenAI, Anthropic und Google bieten Unternehmen Abonnementpreise unter den tatsächlichen Bereitstellungskosten an, was bei Preisanpassungen zu erheblichen Kostenschocks führen kann
- Die monatliche Flatrate von 20 US-Dollar für Claude Pro und ChatGPT Plus kann bei Vielnutzern tatsächliche, auf API-Preise umgerechnete Kosten von 200 bis 400 US-Dollar pro Sitz und Monat verursachen
- Agentenbasierte KI erhöht durch lange autonome Ausführung den Token-Verbrauch massiv, und auch GitHub Copilot wechselt ab Juni 2026 zu nutzungsbasierter Abrechnung
- Die monatlichen Abokosten eines 50-köpfigen Teams von 1.000 US-Dollar können auf Token-Basis tatsächlich bei 15.000 bis 40.000 US-Dollar pro Monat liegen, wodurch das Budgetrisiko stark steigt
- Die IPO-Vorbereitungen von OpenAI und Anthropic erhöhen den Druck auf Margen und Unit Economics und könnten Preiserhöhungen, Nutzungslimits und den Umstieg auf verbrauchsbasierte Abrechnung beschleunigen
Die Lücke zwischen KI-Abo-Preisen und den tatsächlichen Kosten
- Führende KI-Anbieter wie OpenAI, Anthropic und Google stellen Unternehmenskunden ihre Dienste zu Abonnementpreisen unter den tatsächlichen Bereitstellungskosten bereit. Wenn Unternehmen diese Preise als dauerhaften Maßstab ansehen und darauf ihre Workflows aufbauen, können spätere Preisanpassungen zu erheblichen Kostenschocks führen
- Claude Pro kostet 20 US-Dollar pro Monat und bietet Sonnet 4.6, Opus 4.6, Websuche, Code-Ausführung, Dateierstellung und etwa das Fünffache der Nutzung des kostenlosen Tarifs
- Auf API-Basis kostet Sonnet 4.6 3 US-Dollar pro 1 Million Eingabetokens und 15 US-Dollar pro 1 Million Ausgabetokens; bei Opus 4.6 sind es 5 US-Dollar pro 1 Million Eingabetokens und 25 US-Dollar pro 1 Million Ausgabetokens
- Wenn Wissensarbeiter Claude täglich mehrere Stunden nutzen, Dokumente hochladen sowie Berichte erstellen und Daten analysieren, können sie pro Woche mehrere Millionen Tokens verbrauchen; auf API-Gebühren umgerechnet kann das auf 200 bis 400 US-Dollar pro Sitz und Monat steigen
- Berichten zufolge verlor Microsoft bei GitHub Copilot mehr als 20 US-Dollar pro Nutzer und Monat, und bei Vielnutzern stiegen die Compute-Kosten eines 10-US-Dollar-Abos auf 80 US-Dollar
- Analysen zufolge verbrauchten Anthropic-Nutzer mehr als 8 US-Dollar Compute pro 1 US-Dollar Abo-Umsatz. OpenAI-Produkt-VP Nick Turley bezeichnete die Preisstruktur von Abonnements als eher zufällig entstanden und verglich eine mögliche schrittweise Abschaffung unbegrenzter Tarife mit unbegrenztem Stromverbrauch
- ChatGPT Plus kostet seit drei Jahren 20 US-Dollar pro Monat, obwohl in dieser Zeit Funktionen wie Bildgenerierung, Code-Interpretation, Sprachmodus, agentenbasierte Schlussfolgerung und Websuche hinzugekommen sind
Gemeinsame Preisstrategie der großen Anbieter
- Google bündelt Gemini Advanced im Google-One-AI-Premium-Paket für 20 US-Dollar pro Monat, berechnet den API-Zugang zum selben Modell jedoch separat
- Meta stellt Llama kostenlos bereit und subventioniert die Compute-Kosten von Hunderten Millionen KI-Anfragen auf seinen eigenen Plattformen über Werbeumsätze
- xAI hat den API-Eingabepreis von Grok auf 0,20 US-Dollar pro 1 Million Tokens gesenkt; das wird als Modell betrachtet, das Verluste in Kauf nimmt, um Marktanteile zu gewinnen
- Das gemeinsame Muster ist, Preise eher auf Verbreitung als auf Wirtschaftlichkeit auszurichten, Organisationen an sich zu binden und KI zu einem zentralen Abhängigkeitspunkt im Arbeitsalltag der Teams zu machen, während die Kostenfrage vertagt wird
- OpenAI macht Berichten zufolge Verluste im Consumer-Abo-Geschäft und prüft offenbar eine strategische Verlagerung hin zu Enterprise, wo die Unit Economics vergleichsweise weniger schlecht sind
- Laut The Wall Street Journal verfehlte OpenAI auf dem Weg zum IPO wichtige Umsatz- und Nutzerziele, und auch das subventionsgestützte Preissystem zeigt erste Risse
Agentenbasierte KI verschlechtert die Kostenstruktur
- Beim klassischen Chatbot-Einsatz führten Fragen und Antworten zu einem relativ vorhersehbaren Token-Verbrauch, doch agentenbasierte KI erhöht durch lange autonome Ausführungen den Token-Verbrauch deutlich
- Claude-Code-Sitzungen laufen lange Zeit autonom und verbrauchen Tokens in weit höherem Tempo als interaktive Nutzung
- Einige Nutzer berichteten, ein 5-Stunden-Rate-Limit-Fenster in nur 90 Minuten ausgeschöpft zu haben
- GitHub kündigte an, Copilot ab 1. Juni 2026 auf nutzungsbasierte Abrechnung umzustellen, weil das Flatrate-Modell bei agentenbasierten Workloads nicht mehr funktionierte
- GitHub erklärte, Copilot habe sich stark weiterentwickelt und agentenbasierte Nutzung „werde zum Standard“, wodurch Compute- und Inferenzanforderungen steigen
- Sam Altman sagte öffentlich, OpenAI müsse nun ein Unternehmen für KI-Inferenz werden; das passt zu der Einschätzung, dass agentenbasierte Nutzung ein grundsätzlich anderes ökonomisches Modell erfordert
- Agent Teams, bei denen in Engineering-Teams mehrere KI-Instanzen parallel an einem Projekt arbeiten, treiben die Kosten stark nach oben. Wenn Entwickler 3 bis 4 Coding-Agenten gleichzeitig ausführen, kann der Token-Verbrauch im Vergleich zu einfacher Konversation nicht nur um ein Mehrfaches, sondern um Größenordnungen steigen
Das Kostenrisiko, das Unternehmen nicht messen
- In den vergangenen zwei Jahren haben viele Unternehmen KI-Abonnements tief in den operativen Betrieb integriert: Marketing erstellt Texte mit ChatGPT Plus, Engineering nutzt Claude Pro für Schreiben und Review von Code, und Teams in Research, Customer Success und Finance setzen KI für Dokumentzusammenfassungen, Ticket-Zusammenfassungen und Szenariomodellierung ein
- Wenn 50 Personen Claude Pro nutzen, liegen die aktuellen Kosten bei 1.000 US-Dollar pro Monat, und bei ChatGPT Plus ähnlich, sodass KI in der Gewinn-und-Verlust-Rechnung wie ein kleiner Posten wirkt
- Berechnet man jedoch die tatsächliche API-Nutzung desselben Teams auf Basis des Token-Verbrauchs, kann das je nach Nutzungsintensität 15.000 bis 40.000 US-Dollar pro Monat betragen und damit zu einer Ausgabenkategorie werden, die einen eigenen Budgetposten braucht
- Wenn die Preise angepasst werden, erhalten Unternehmen, die KI für 20 US-Dollar pro Monat als dauerhaft günstigen Input eingeplant haben, plötzlich Rechnungen, die nicht im Budget vorgesehen waren — zu einem Zeitpunkt, an dem KI bereits tief in den Workflows verankert und kaum noch zu entfernen ist
- Subventionen schaffen Abhängigkeit, und Abhängigkeit wird für Unternehmen zur Falle, weil sie Preiserhöhungen nur schwer ausweichen können
- Laut KPMGs Q1 2026 AI Quarterly Pulse erwarten US-Organisationen in den kommenden 12 Monaten durchschnittliche KI-Ausgaben von 207 Millionen US-Dollar, fast doppelt so viel wie im Vorjahreszeitraum
- Einer Goldman-Sachs-Umfrage zufolge überschreiten viele Großunternehmen ihre KI-Budgets bereits um zweistellige Prozentsätze, und KI-Ausgaben könnten in naher Zukunft an Ingenieursgehälter heranreichen
- Swami Chandrasekaran, Leiter des AI & Data Lab von KPMG North America, sagte Marketplace, dass sich noch vor ein oder zwei Quartalen praktisch niemand um die Kosten des LLM-Verbrauchs gekümmert habe
- Der Wirtschaftswissenschaftler Brian Jabarian von der University of Chicago, der Unternehmen bei der KI-Transformation berät, sagt, dass die Zeit komme, in der die Rechnung fällig wird
IPOs könnten eine Preisanpassung erzwingen
- OpenAI und Anthropic bereiten sich auf einen IPO vor, und dabei könnte der Druck wachsen, die Lücke zwischen Abo-Preis und tatsächlichen Kosten zu verkleinern
- Berichten zufolge hat Anthropic einen annualisierten Umsatz von mehr als 30 Milliarden US-Dollar erreicht, ein Anstieg gegenüber 9 Milliarden US-Dollar Ende 2025
- Für OpenAI wird ein Umsatztempo von rund 25 Milliarden US-Dollar genannt
- OpenAI rechnet bis 2029 mit einem kumulierten Cash-Burn von 115 Milliarden US-Dollar und soll bis 2030 Compute-Ausgaben von 665 Milliarden US-Dollar zugesagt haben
- Oracle soll für den Bau von Rechenzentren für OpenAI in einem Geschäftsjahr 43 Milliarden US-Dollar Schulden aufgenommen haben
- Solange Unternehmen privat sind und Venture Capital verbrennen, können sie Inferenzkosten subventionieren, Modelle mit Verlust betreiben und Tarife von 20 US-Dollar pro Monat aufrechterhalten, obwohl die Bereitstellung mehr als 100 US-Dollar kostet
- Nach einem IPO verlangen die öffentlichen Märkte Margen, Analysten Unit Economics und Investoren einen Weg zur Profitabilität, der nicht auf unbegrenzter Finanzierung beruht
- Die schnellsten Wege, die Preislücke zu schließen, sind Preiserhöhungen, Nutzungslimits und der Wechsel zu verbrauchsbasierter Abrechnung — und alle drei könnten bestehende Unternehmenskunden stark treffen
Signale einer Preisanpassung sind bereits sichtbar
- GitHub wechselt am 1. Juni 2026 zu nutzungsbasierter Abrechnung und ersetzt Premium-Anfragen in der Flatrate durch tokenbasierte AI Credits
- Microsoft hat die Preise für Microsoft 365 innerhalb von vier Jahren zweimal erhöht; die jüngste Erhöhung ist direkt mit den Kosten der KI-Infrastruktur verbunden
- OpenAI hat mit dem 100-US-Dollar-Pro-Tier einen neuen realistischeren Preisbereich für Vielnutzer eingeführt
- Das 200-US-Dollar-Max-Tier von Anthropic ist ein Beispiel dafür, welche Kosten ein verlässliches Nutzungsniveau tatsächlich verursachen kann, wenn die Subvention endet
- Geoff Webb, VP bei Conga, sagte mit Blick auf den Wettlauf um die frühe Dominanz im KI-Markt, das Ausmaß dieses Wettbewerbs sei enorm, ebenso die Kosten, ihn zu beherrschen; daher seien große Veränderungen bei Geschäftsmodellen und Servicepreisen im Zuge von Monetarisierung und Kapitalrückfluss wahrscheinlich und könnten schnell eintreten
Was Unternehmensleitungen jetzt tun sollten
- Unternehmen sollten nicht nur Sitze zählen, sondern den tatsächlichen Token-Verbrauch je Team auditieren
- Sie sollten modellieren, wie sich die KI-Kosten bei Szenarien mit 2x, 5x und 10x gegenüber dem heutigen Preis verändern würden
- Sie sollten Vendor-Optionalität in ihren Stack einbauen, damit eine Preisänderung eines einzelnen Anbieters das Budget nicht plötzlich sprengt
- Sie sollten die Kostenlücke bei KI mit dem CFO besprechen, bevor der CFO das Thema selbst aufbringt
- Die Differenz zwischen dem, was eine Organisation heute für KI zahlt, und dem, was sie in 18 Monaten zahlen wird, könnte für viele Unternehmen zu einem der größten Kostenanstiege überhaupt werden
- Es könnte Unternehmen geben, die erklären müssen, warum ein Tool, das früher günstiger als das Team-Mittagessen war, plötzlich ein sechsstelliges Jahresbudget verlangt
- Die Ära der Subventionen geht zu Ende, und viele Unternehmen haben diese Diskussion noch nicht einmal begonnen
4 Kommentare
Scheint dasselbe Thema zu sein wie damals bei den Mainframes..
Wenn sich die Konstellation ergibt, dass Server teuer sind und Ressourcen knapp, während persönliche Computer langsam sind,
am Ende werden auch Server billiger und persönliche Computer leistungsfähiger werden ... Ich glaube, Zeit wird die Antwort sein.
Wenn es zu teuer ist, benutzt man es eben nicht..
Vermutlich erhöhen die LLM-Provider die Preise, weil sie davon ausgehen, dass Unternehmen es trotz der hohen Kosten nutzen werden. Ich bin gespannt, wie sich Open-Source-LLMs wie GLM, qwen und deepseek künftig entwickeln. Die Leute werden wohl anfangen zu rechnen, ob sie diesen Preis zahlen müssen, um Frontier-Modelle zu nutzen, oder ob es sinnvoller ist, stattdessen Open Source zu verwenden, selbst wenn man sich die Mühe machen muss, eine eigene vLLM-Infrastruktur aufzubauen.
Hacker-News-Kommentare
Alle AI-Abos sind für Frontier-Model-Anbieter wie eine Zeitbombe
In ein paar Jahren wird man lokale Modelle, die so gut sind wie die heutigen Frontier-Modelle, fast ohne nennenswerte Kosten betreiben können, und die Unternehmensbasis der Frontier-Firmen wird zusammenbrechen
Allein die Speicheranforderungen sind enorm, und noch eine ganze Weile wird es viel kosteneffizienter sein, gemeinsam genutzte spezialisierte Hosting-Hardware mit hoher Auslastung zu verwenden
Sie müssen sich ständig verbessern, um einander und den Open-Weight-Modellen voraus zu bleiben, also sind sie eher das Gegenteil einer Zeitbombe
Inferenz-Tokens auf dem heutigen Niveau werden immer billiger werden, und ob lokal der Endzustand ist, weiß ich wegen der hohen Hardwareanforderungen nicht, aber Wettbewerb drückt die Margen tendenziell nahe null
Eine längere Diskussion zu diesem Thema: https://corecursive.com/the-pre-training-wall-and-the-treadm...
Wir überwachen den Token-Verbrauch und bewegen uns aktiv darauf zu, die Inferenzkosten zu senken und ins Unternehmen zu holen, statt stumpf Unmengen an Tokens zu verbrauchen
Mein Chef war sehr zufrieden, und jetzt wird es breiter ausgerollt. Ich denke, das ist die Zukunft
Auch die Skalierungsgesetze sind bereits belastend geworden, und man sollte nicht auf die Übertreibung vom „Exponentialen“ hereinfallen
Außerdem ist der eigentliche Wettbewerber das Frontier-Modell von in zwei Jahren
Im Vergleich zu vor 1–2 Jahren braucht man heute größere, teurere und energiehungrigere Hardware
Der überzogene Tonfall der Texte beider AI-Lager ist einfach ermüdend
Ich würde gern mit jemandem, der sich wirklich mit der Ökonomie und dem Geschäft der Token-Anbieter auskennt, vor einem Whiteboard stehen und mir das „wie einem Fünfjährigen“ erklären lassen
Ist es für Token-Anbieter ein Margenspiel und für Konsumenten ein Spiel um Service-/Produktqualität, und wenn sich die Linie von Qualität und Marge irgendwann kreuzt, ist es dann ein Rennen, diesen Punkt zu erreichen, bevor das Geld ausgeht? Falls ja: Gibt es historische Beispiele, bei denen die Lücke zwischen beiden sehr groß war?
LLMs wirken insofern einzigartig, als es praktisch keine Grenze dafür gibt, „wie viel besser“ Konsumenten sie erwarten, und sie unterscheiden sich damit von Diensten wie E-Mail, die aus Sicht der Rechenressourcen leicht skalieren
Das ist eine sehr grundlegende Frage, aber ich frage mich auch, warum man an die Börse gehen will, bevor überhaupt ein nachhaltiges Geschäftsmodell existiert. Was ist der Vorteil?
Laut den hier verlinkten Quellen entfallen etwa 30 % der Anthropic-Ausgaben auf Inferenz, die übrigen 70 % auf Forschung und Entwicklung wie das nächste Modell
Wenn man das berücksichtigt, Gewinn aufschlägt und die Zahlen vereinfacht, müsste man für etwa 1 Dollar pro Million Tokens verkaufen, um Geld zu verdienen
Der aktuelle API-Preis liegt bei 25 Dollar pro Million Tokens, daher habe ich keinen Zweifel an der Profitabilität
Wenn man dagegen den Max-Plan für 200 Dollar im Monat extrem ausreizt, kann man bis zu 10 Milliarden Tokens pro Monat verbrauchen; das entspricht 0,02 Dollar pro Million Tokens, also einer gewaltigen Verlustübernahme, und das wird irgendwann verschwinden
Bei etwa 100 Millionen Tokens pro Monat im Anthropic-Plan für 100 Dollar verdient das Unternehmen allerdings Geld
Um 10 Milliarden Tokens pro Monat zu verbrauchen, muss man extrem lange arbeiten und wirklich sehr gut im Umgang mit AI sein; solche Leute nutzen AI wahrscheinlich schon seit Jahren und konnten auch schon vor Opus Nutzen daraus ziehen
Sie wären enttäuscht, wenn sie Opus verlieren, aber gerade diese Nutzer können in der Regel auch schwächere Modelle gut einsetzen, sodass sie in ein paar Jahren auf intern gehostete Open-Source-Modelle umsteigen und dennoch auf ein heutiges Niveau von 0,02 Dollar pro Million Tokens kommen könnten
Deshalb überzeugt mich die pessimistische Stimmung des Artikels nicht. Die Lage wird sich ändern, aber das bedeutet nicht das Ende der AI-Nutzung
Ich stimme der Grundstimmung des Textes zu, aber der Stil wirkt zu LLM-mäßig
Vor allem die Abschnittsstruktur und Punchlines wie „That is not a rounding error. That is a line item that needs its own budget code.“
Das ist ziemlich nervig, und bei Gemini habe ich das mit demselben Prompt nicht so oft gesehen
Im Artikel steht kein Autorenname
Brad Gerstner hat bestätigt, dass Tokens nicht mit Verlust verkauft werden
Unabhängig davon, wie die Formel API und Abos aufteilt, machen die Unternehmen beim reinen Tokenverkauf Gewinn
Wenn man Gehälter und Aktienvergütung einrechnet, kann es Verluste geben, aber die Tokens selbst sind derzeit profitabel
Im Moment mag das stimmen, aber so ist sie nicht hierhergekommen
Die Investitionen, die wieder eingespielt werden müssen, liegen bei Billionen Dollar, während die Umsätze bestenfalls im Milliardenbereich liegen; deshalb geht die Rechnung, dass Tokens in naher Zukunft Gewinn abwerfen, nicht auf
Inferenz muss nicht nur für sich genommen profitabel sein, sondern auch diese Kosten mittragen
[0] https://epoch.ai/data-insights/openai-compute-spend
Die Verluste werden in einer merkwürdigen zirkulären Finanzierungsstruktur weitergereicht, und irgendwann könnte das in einer Schuldenkrise zusammenbrechen
Ich vermute, dass dort stark subventioniert wird, aber das sind die einzigen Dinge, bei denen ich tatsächlich Wert spüre
Das Problem mit „AI“ insgesamt ist, dass es leicht ist, ohne sie zu leben
Die AI-Unternehmen wissen das, die Nutzer wissen das, und selbst der AI-freundlichste Manager weiß das
Wenn man sich vorstellt, dass weltweit sofort jede AI entfernt würde, wäre das Ergebnis einfach normales Arbeiten wie bisher
Der Artikel betont diesen Punkt nicht genug. Geht es darum, dass man Angst vor dem Tag haben soll, an dem PR-Reviews wieder von echten Ingenieuren gemacht werden müssen?
Je tiefer die Technologie integriert wird, desto weniger stimmt das
Dasselbe hätte man auch ein paar Jahre nach dem Aufkommen des Elektromotors sagen können, man hätte eben weiter mit Dampf gearbeitet
Aber heute würde die Gesellschaft zusammenbrechen, wenn man ohne Elektromotoren leben müsste
Die Frage ist nicht, ob man jetzt ohne sie auskommt, sondern ob das auch in 5–10 Jahren noch gilt, nachdem sie vollständig integriert ist
Nicht um ehrliche Umsätze zu erzeugen, sondern um AI-Produkte so tief einzubetten, dass „wir entfernen die AI einfach“ nicht mehr wie eine Option wirkt
Selbst wenn die laufenden Kosten weiter steigen und irgendwann das Niveau von staatlichen Rettungsaktionen für Fluggesellschaften übertreffen
Es ist eine neue vermittelnde Schicht zur Wohlstandsabschöpfung, verkauft mit falschen Versprechen
Zumindest zum Schreiben von JavaScript kann ich ohne AI nicht mehr leben
Als wären sie ein Haustier, das stirbt, wenn man es nicht ab und zu benutzt
Der Artikel liegt falsch. Solche Abos werden Unternehmen sehr wohl angeboten
Firmen zahlen Beträge, die viel näher an den API-Preisen liegen
Die Strategie besteht darin, Privatnutzer an unbegrenzte Tokens zu gewöhnen und dann zu hoffen, dass sich dieses Verhalten in den Arbeitsplatz überträgt
Team- oder Enterprise-Sitze sind teurer als Verbraucherpreise, aber es sind Festpreise mit zurückgesetzten Nutzungslimits
Man kann Mitgliedern Sitze zuweisen, die den Plänen für 20/100/200 Dollar pro Monat entsprechen, oder alles komplett nutzungsbasiert abrechnen
Es gibt viele Arten zu kaufen
Es gibt auch nutzungsbasierte Pläne, die den entsprechenden Verbraucherplänen gleichkommen
In meinem Unternehmen wird nach API-Nutzung abgerechnet
„Im Großen und Ganzen ist das Muster dasselbe. Preisgestaltung für Einführung, nicht für Wirtschaftlichkeit. Organisationen binden. AI zum tragenden Teil der täglichen Arbeit jedes Teams machen. Sich um die Rechnung später kümmern.“
10.000 Dollar im Monat sind nicht nichts, aber wenn man damit ein Team aus 10–20 Ingenieuren unterstützt, ist das ein ziemlich guter Hebel
Ich habe das Original nicht bis zum Ende gelesen, aber ich konnte erkennen, dass es von AI geschrieben wurde
OpenRouter könnte vielleicht als Referenzpunkt für die Bereitstellungskosten von AI-Anbietern dienen
Ich höre ständig, dass es ein besseres Preis-Leistungs-Verhältnis als Claude habe; wenn das stimmt, scheint Anthropic entweder aus irgendeinem Grund besonders ineffizient zu sein oder bei Inferenz Gewinn zu machen
Beim Training könnten sie Geld verlieren, aber das ist möglicherweise einfach die Kostenstruktur, um ein führendes Forschungslabor zu bleiben
Wenn ein einzelnes Unternehmen wegen Schulden oder Ähnlichem zusammenbricht, könnten Unternehmen doch einfach wechseln, oder?
Wenn ich noch einmal Formulierungen wie „It’s not X. It’s Y.“ oder „load-bearing“ als Metapher sehe, muss ich mich übergeben
„Das Zeitalter der Subventionen endet nicht elegant. Es zeigt überall Risse.“
„Die Frage ist nicht, ob es ein guter Deal war. Die Frage ist, wie lange der Deal hält.“
„Ein Entwickler, der gleichzeitig drei oder vier Coding-Agenten laufen lässt, verbraucht nicht drei- oder viermal so viele Tokens wie bei einem Chat-Gespräch. Nicht um eine einstellige Größenordnung mehr, sondern um mehr als eine Größenordnung.“
„Das sind keine Experimente mehr. Das sind tragende Workflows.“
„Das ist kein Rundungsfehler. Das ist ein Posten, der einen eigenen Budgetcode braucht.“
Zumindest darf man das hoffen
Es gab Daten, und die Logik war plausibel, aber ungefähr zur Mitte hin kam dann Trendbeispiel, noch ein Beispiel, ein drittes Beispiel und „es ist nicht einfach X, sondern Y“
Es nervt ungefähr so sehr, wie einen gut geschriebenen Text zu lesen, dann auf den Quellenlink zu klicken und einen Rickroll zu bekommen
Enterprise-Kunden nutzen kein Claude-Pro-Abo für 20 Dollar im Monat
Unser Unternehmen stellt Entwicklern ein Nutzungslimit im Wert von etwa 1.000 Dollar pro Monat bereit, und soweit ich sehe, liegt die Ersparnis gegenüber API-Kosten höchstens bei 30 %
Das ist keine verrückte Subventionshöhe
Für andere Rollen sind oft nur 50 Dollar pro Monat erlaubt, und diese Leute schöpfen ihr Limit trotzdem ständig aus
GitHub Copilot arbeitet bei Business- und Enterprise-Sitzen schon länger so, wird aber bald an Grenzen stoßen
Ich denke, nach der Neuordnung der Verbraucher-Accounts Pro und Pro+ ab Juni wird das schnell nachziehen
Bei OpenAI beunruhigt mich am meisten, dass sie Tokens herausblasen, um Kunden zu binden; deshalb fürchte ich nach einem IPO dort starke und plötzliche Änderungen bei Preisen und Bedingungen
Anthropic handelt in diesem Punkt bereits verantwortungsvoll, und auch GitHub Copilot versucht in den kommenden Monaten offenbar, übermäßige Subventionen zu korrigieren
Weil dort nicht nach Tokens, sondern pro „Request“ abgerechnet wurde
Eine einzelne Anfrage im Wert von 3 Cent konnte gemessen an Tokens mehr als 20 Dollar verbrennen, und dieses Modell endet in diesem Monat
Ich war auch besorgt, weil ich GHCP für große Arbeitsblöcke genutzt habe, aber der neue Kostenschätzer zeigte nach API-Preisen etwa 150–200 Dollar pro Monat
Das ist zwar eine Subvention gegenüber einem 20-Dollar-Abo, aber keine völlig verrückte
Wer agentenartige Coding-Tools intensiv und verantwortungsvoll nutzt, landet nach API-Preisen wahrscheinlich grob bei 200 Dollar im Monat
Wenn der Anbieter selbst bei diesem Preis noch Geld verdient, ist das für Unternehmen im Westen angesichts der eingesparten Entwicklerzeit nicht schwer zu akzeptieren
Das eigentliche Risiko liegt bei Vibe-Codern mit privaten Projekten
Die Zeit, in der man mit subventionierten Plänen riesige Apps missbrauchen konnte, geht zu Ende
Wenn sie Entwickler ersetzen, ist ein Preis über 20 oder 100 Dollar im Monat plausibel
Das eigentliche Problem der LLM-Unternehmen ist, dass sie außerhalb des Codings noch keinen Wert gezeigt haben
Ohne das würden sie einfach zu Coding-Tools herabgestuft
Deshalb eilen sie jetzt, und entscheidend ist, welche Workflows sich noch stärker automatisieren lassen
Papierkram ließe sich vielleicht vollständig automatisieren
Wenn andere Bereiche ausgebaut werden, werden sie ihr Preismodell ändern
Das könnte durchaus Wert haben