2 Punkte von GN⁺ 5 시간 전 | 4 Kommentare | Auf WhatsApp teilen
  • Anbieter wie OpenAI, Anthropic und Google bieten Unternehmen Abonnementpreise unter den tatsächlichen Bereitstellungskosten an, was bei Preisanpassungen zu erheblichen Kostenschocks führen kann
  • Die monatliche Flatrate von 20 US-Dollar für Claude Pro und ChatGPT Plus kann bei Vielnutzern tatsächliche, auf API-Preise umgerechnete Kosten von 200 bis 400 US-Dollar pro Sitz und Monat verursachen
  • Agentenbasierte KI erhöht durch lange autonome Ausführung den Token-Verbrauch massiv, und auch GitHub Copilot wechselt ab Juni 2026 zu nutzungsbasierter Abrechnung
  • Die monatlichen Abokosten eines 50-köpfigen Teams von 1.000 US-Dollar können auf Token-Basis tatsächlich bei 15.000 bis 40.000 US-Dollar pro Monat liegen, wodurch das Budgetrisiko stark steigt
  • Die IPO-Vorbereitungen von OpenAI und Anthropic erhöhen den Druck auf Margen und Unit Economics und könnten Preiserhöhungen, Nutzungslimits und den Umstieg auf verbrauchsbasierte Abrechnung beschleunigen

Die Lücke zwischen KI-Abo-Preisen und den tatsächlichen Kosten

  • Führende KI-Anbieter wie OpenAI, Anthropic und Google stellen Unternehmenskunden ihre Dienste zu Abonnementpreisen unter den tatsächlichen Bereitstellungskosten bereit. Wenn Unternehmen diese Preise als dauerhaften Maßstab ansehen und darauf ihre Workflows aufbauen, können spätere Preisanpassungen zu erheblichen Kostenschocks führen
  • Claude Pro kostet 20 US-Dollar pro Monat und bietet Sonnet 4.6, Opus 4.6, Websuche, Code-Ausführung, Dateierstellung und etwa das Fünffache der Nutzung des kostenlosen Tarifs
  • Auf API-Basis kostet Sonnet 4.6 3 US-Dollar pro 1 Million Eingabetokens und 15 US-Dollar pro 1 Million Ausgabetokens; bei Opus 4.6 sind es 5 US-Dollar pro 1 Million Eingabetokens und 25 US-Dollar pro 1 Million Ausgabetokens
  • Wenn Wissensarbeiter Claude täglich mehrere Stunden nutzen, Dokumente hochladen sowie Berichte erstellen und Daten analysieren, können sie pro Woche mehrere Millionen Tokens verbrauchen; auf API-Gebühren umgerechnet kann das auf 200 bis 400 US-Dollar pro Sitz und Monat steigen
  • Berichten zufolge verlor Microsoft bei GitHub Copilot mehr als 20 US-Dollar pro Nutzer und Monat, und bei Vielnutzern stiegen die Compute-Kosten eines 10-US-Dollar-Abos auf 80 US-Dollar
  • Analysen zufolge verbrauchten Anthropic-Nutzer mehr als 8 US-Dollar Compute pro 1 US-Dollar Abo-Umsatz. OpenAI-Produkt-VP Nick Turley bezeichnete die Preisstruktur von Abonnements als eher zufällig entstanden und verglich eine mögliche schrittweise Abschaffung unbegrenzter Tarife mit unbegrenztem Stromverbrauch
  • ChatGPT Plus kostet seit drei Jahren 20 US-Dollar pro Monat, obwohl in dieser Zeit Funktionen wie Bildgenerierung, Code-Interpretation, Sprachmodus, agentenbasierte Schlussfolgerung und Websuche hinzugekommen sind

Gemeinsame Preisstrategie der großen Anbieter

  • Google bündelt Gemini Advanced im Google-One-AI-Premium-Paket für 20 US-Dollar pro Monat, berechnet den API-Zugang zum selben Modell jedoch separat
  • Meta stellt Llama kostenlos bereit und subventioniert die Compute-Kosten von Hunderten Millionen KI-Anfragen auf seinen eigenen Plattformen über Werbeumsätze
  • xAI hat den API-Eingabepreis von Grok auf 0,20 US-Dollar pro 1 Million Tokens gesenkt; das wird als Modell betrachtet, das Verluste in Kauf nimmt, um Marktanteile zu gewinnen
  • Das gemeinsame Muster ist, Preise eher auf Verbreitung als auf Wirtschaftlichkeit auszurichten, Organisationen an sich zu binden und KI zu einem zentralen Abhängigkeitspunkt im Arbeitsalltag der Teams zu machen, während die Kostenfrage vertagt wird
  • OpenAI macht Berichten zufolge Verluste im Consumer-Abo-Geschäft und prüft offenbar eine strategische Verlagerung hin zu Enterprise, wo die Unit Economics vergleichsweise weniger schlecht sind
  • Laut The Wall Street Journal verfehlte OpenAI auf dem Weg zum IPO wichtige Umsatz- und Nutzerziele, und auch das subventionsgestützte Preissystem zeigt erste Risse

Agentenbasierte KI verschlechtert die Kostenstruktur

  • Beim klassischen Chatbot-Einsatz führten Fragen und Antworten zu einem relativ vorhersehbaren Token-Verbrauch, doch agentenbasierte KI erhöht durch lange autonome Ausführungen den Token-Verbrauch deutlich
  • Claude-Code-Sitzungen laufen lange Zeit autonom und verbrauchen Tokens in weit höherem Tempo als interaktive Nutzung
  • Einige Nutzer berichteten, ein 5-Stunden-Rate-Limit-Fenster in nur 90 Minuten ausgeschöpft zu haben
  • GitHub kündigte an, Copilot ab 1. Juni 2026 auf nutzungsbasierte Abrechnung umzustellen, weil das Flatrate-Modell bei agentenbasierten Workloads nicht mehr funktionierte
  • GitHub erklärte, Copilot habe sich stark weiterentwickelt und agentenbasierte Nutzung „werde zum Standard“, wodurch Compute- und Inferenzanforderungen steigen
  • Sam Altman sagte öffentlich, OpenAI müsse nun ein Unternehmen für KI-Inferenz werden; das passt zu der Einschätzung, dass agentenbasierte Nutzung ein grundsätzlich anderes ökonomisches Modell erfordert
  • Agent Teams, bei denen in Engineering-Teams mehrere KI-Instanzen parallel an einem Projekt arbeiten, treiben die Kosten stark nach oben. Wenn Entwickler 3 bis 4 Coding-Agenten gleichzeitig ausführen, kann der Token-Verbrauch im Vergleich zu einfacher Konversation nicht nur um ein Mehrfaches, sondern um Größenordnungen steigen

Das Kostenrisiko, das Unternehmen nicht messen

  • In den vergangenen zwei Jahren haben viele Unternehmen KI-Abonnements tief in den operativen Betrieb integriert: Marketing erstellt Texte mit ChatGPT Plus, Engineering nutzt Claude Pro für Schreiben und Review von Code, und Teams in Research, Customer Success und Finance setzen KI für Dokumentzusammenfassungen, Ticket-Zusammenfassungen und Szenariomodellierung ein
  • Wenn 50 Personen Claude Pro nutzen, liegen die aktuellen Kosten bei 1.000 US-Dollar pro Monat, und bei ChatGPT Plus ähnlich, sodass KI in der Gewinn-und-Verlust-Rechnung wie ein kleiner Posten wirkt
  • Berechnet man jedoch die tatsächliche API-Nutzung desselben Teams auf Basis des Token-Verbrauchs, kann das je nach Nutzungsintensität 15.000 bis 40.000 US-Dollar pro Monat betragen und damit zu einer Ausgabenkategorie werden, die einen eigenen Budgetposten braucht
  • Wenn die Preise angepasst werden, erhalten Unternehmen, die KI für 20 US-Dollar pro Monat als dauerhaft günstigen Input eingeplant haben, plötzlich Rechnungen, die nicht im Budget vorgesehen waren — zu einem Zeitpunkt, an dem KI bereits tief in den Workflows verankert und kaum noch zu entfernen ist
  • Subventionen schaffen Abhängigkeit, und Abhängigkeit wird für Unternehmen zur Falle, weil sie Preiserhöhungen nur schwer ausweichen können
  • Laut KPMGs Q1 2026 AI Quarterly Pulse erwarten US-Organisationen in den kommenden 12 Monaten durchschnittliche KI-Ausgaben von 207 Millionen US-Dollar, fast doppelt so viel wie im Vorjahreszeitraum
  • Einer Goldman-Sachs-Umfrage zufolge überschreiten viele Großunternehmen ihre KI-Budgets bereits um zweistellige Prozentsätze, und KI-Ausgaben könnten in naher Zukunft an Ingenieursgehälter heranreichen
  • Swami Chandrasekaran, Leiter des AI & Data Lab von KPMG North America, sagte Marketplace, dass sich noch vor ein oder zwei Quartalen praktisch niemand um die Kosten des LLM-Verbrauchs gekümmert habe
  • Der Wirtschaftswissenschaftler Brian Jabarian von der University of Chicago, der Unternehmen bei der KI-Transformation berät, sagt, dass die Zeit komme, in der die Rechnung fällig wird

IPOs könnten eine Preisanpassung erzwingen

Signale einer Preisanpassung sind bereits sichtbar

Was Unternehmensleitungen jetzt tun sollten

  • Unternehmen sollten nicht nur Sitze zählen, sondern den tatsächlichen Token-Verbrauch je Team auditieren
  • Sie sollten modellieren, wie sich die KI-Kosten bei Szenarien mit 2x, 5x und 10x gegenüber dem heutigen Preis verändern würden
  • Sie sollten Vendor-Optionalität in ihren Stack einbauen, damit eine Preisänderung eines einzelnen Anbieters das Budget nicht plötzlich sprengt
  • Sie sollten die Kostenlücke bei KI mit dem CFO besprechen, bevor der CFO das Thema selbst aufbringt
  • Die Differenz zwischen dem, was eine Organisation heute für KI zahlt, und dem, was sie in 18 Monaten zahlen wird, könnte für viele Unternehmen zu einem der größten Kostenanstiege überhaupt werden
  • Es könnte Unternehmen geben, die erklären müssen, warum ein Tool, das früher günstiger als das Team-Mittagessen war, plötzlich ein sechsstelliges Jahresbudget verlangt
  • Die Ära der Subventionen geht zu Ende, und viele Unternehmen haben diese Diskussion noch nicht einmal begonnen

4 Kommentare

 
hmmhmmhm 2 시간 전

Scheint dasselbe Thema zu sein wie damals bei den Mainframes..
Wenn sich die Konstellation ergibt, dass Server teuer sind und Ressourcen knapp, während persönliche Computer langsam sind,
am Ende werden auch Server billiger und persönliche Computer leistungsfähiger werden ... Ich glaube, Zeit wird die Antwort sein.

 
master6559 3 시간 전

Wenn es zu teuer ist, benutzt man es eben nicht..

 
aer0700 2 시간 전

Vermutlich erhöhen die LLM-Provider die Preise, weil sie davon ausgehen, dass Unternehmen es trotz der hohen Kosten nutzen werden. Ich bin gespannt, wie sich Open-Source-LLMs wie GLM, qwen und deepseek künftig entwickeln. Die Leute werden wohl anfangen zu rechnen, ob sie diesen Preis zahlen müssen, um Frontier-Modelle zu nutzen, oder ob es sinnvoller ist, stattdessen Open Source zu verwenden, selbst wenn man sich die Mühe machen muss, eine eigene vLLM-Infrastruktur aufzubauen.

 
GN⁺ 5 시간 전
Hacker-News-Kommentare
  • Alle AI-Abos sind für Frontier-Model-Anbieter wie eine Zeitbombe
    In ein paar Jahren wird man lokale Modelle, die so gut sind wie die heutigen Frontier-Modelle, fast ohne nennenswerte Kosten betreiben können, und die Unternehmensbasis der Frontier-Firmen wird zusammenbrechen

    • Ich weiß nicht, worauf sich die Aussage stützt, dass man „in ein paar Jahren lokale Modelle betreibt, die so gut sind wie die heutigen Frontier-Modelle“
      Allein die Speicheranforderungen sind enorm, und noch eine ganze Weile wird es viel kosteneffizienter sein, gemeinsam genutzte spezialisierte Hosting-Hardware mit hoher Auslastung zu verwenden
    • Anders gesagt sind Frontier-Modelle Vermögenswerte, die wegen des Wettbewerbs am Markt sehr schnell an Wert verlieren
      Sie müssen sich ständig verbessern, um einander und den Open-Weight-Modellen voraus zu bleiben, also sind sie eher das Gegenteil einer Zeitbombe
      Inferenz-Tokens auf dem heutigen Niveau werden immer billiger werden, und ob lokal der Endzustand ist, weiß ich wegen der hohen Hardwareanforderungen nicht, aber Wettbewerb drückt die Margen tendenziell nahe null
      Eine längere Diskussion zu diesem Thema: https://corecursive.com/the-pre-training-wall-and-the-treadm...
    • Ich habe im letzten Monat ein kleines Demo gebaut, das Qwen, Gemma und Deepseek hinter LiteLLM hängt und zeigt, wie die Zukunft aussehen könnte
      Wir überwachen den Token-Verbrauch und bewegen uns aktiv darauf zu, die Inferenzkosten zu senken und ins Unternehmen zu holen, statt stumpf Unmengen an Tokens zu verbrauchen
      Mein Chef war sehr zufrieden, und jetzt wird es breiter ausgerollt. Ich denke, das ist die Zukunft
    • Die Behauptung, dass wir in ein paar Jahren lokale Modelle betreiben werden, die so gut sind wie die heutigen Frontier-Modelle, ist sehr zweifelhaft
      Auch die Skalierungsgesetze sind bereits belastend geworden, und man sollte nicht auf die Übertreibung vom „Exponentialen“ hereinfallen
      Außerdem ist der eigentliche Wettbewerber das Frontier-Modell von in zwei Jahren
    • Ohne wichtige Durchbrüche bei Hardwareproduktion oder Modellarchitektur ist eher das Gegenteil der Fall
      Im Vergleich zu vor 1–2 Jahren braucht man heute größere, teurere und energiehungrigere Hardware
  • Der überzogene Tonfall der Texte beider AI-Lager ist einfach ermüdend
    Ich würde gern mit jemandem, der sich wirklich mit der Ökonomie und dem Geschäft der Token-Anbieter auskennt, vor einem Whiteboard stehen und mir das „wie einem Fünfjährigen“ erklären lassen
    Ist es für Token-Anbieter ein Margenspiel und für Konsumenten ein Spiel um Service-/Produktqualität, und wenn sich die Linie von Qualität und Marge irgendwann kreuzt, ist es dann ein Rennen, diesen Punkt zu erreichen, bevor das Geld ausgeht? Falls ja: Gibt es historische Beispiele, bei denen die Lücke zwischen beiden sehr groß war?
    LLMs wirken insofern einzigartig, als es praktisch keine Grenze dafür gibt, „wie viel besser“ Konsumenten sie erwarten, und sie unterscheiden sich damit von Diensten wie E-Mail, die aus Sicht der Rechenressourcen leicht skalieren
    Das ist eine sehr grundlegende Frage, aber ich frage mich auch, warum man an die Börse gehen will, bevor überhaupt ein nachhaltiges Geschäftsmodell existiert. Was ist der Vorteil?

    • Wenn man AI nach den Produktionskosten von Opus-Tokens fragt, bekommt man als Antwort 0,216 Dollar pro Million Tokens inklusive Hardware, Strom, Kühlung und Hosting
      Laut den hier verlinkten Quellen entfallen etwa 30 % der Anthropic-Ausgaben auf Inferenz, die übrigen 70 % auf Forschung und Entwicklung wie das nächste Modell
      Wenn man das berücksichtigt, Gewinn aufschlägt und die Zahlen vereinfacht, müsste man für etwa 1 Dollar pro Million Tokens verkaufen, um Geld zu verdienen
      Der aktuelle API-Preis liegt bei 25 Dollar pro Million Tokens, daher habe ich keinen Zweifel an der Profitabilität
      Wenn man dagegen den Max-Plan für 200 Dollar im Monat extrem ausreizt, kann man bis zu 10 Milliarden Tokens pro Monat verbrauchen; das entspricht 0,02 Dollar pro Million Tokens, also einer gewaltigen Verlustübernahme, und das wird irgendwann verschwinden
      Bei etwa 100 Millionen Tokens pro Monat im Anthropic-Plan für 100 Dollar verdient das Unternehmen allerdings Geld
      Um 10 Milliarden Tokens pro Monat zu verbrauchen, muss man extrem lange arbeiten und wirklich sehr gut im Umgang mit AI sein; solche Leute nutzen AI wahrscheinlich schon seit Jahren und konnten auch schon vor Opus Nutzen daraus ziehen
      Sie wären enttäuscht, wenn sie Opus verlieren, aber gerade diese Nutzer können in der Regel auch schwächere Modelle gut einsetzen, sodass sie in ein paar Jahren auf intern gehostete Open-Source-Modelle umsteigen und dennoch auf ein heutiges Niveau von 0,02 Dollar pro Million Tokens kommen könnten
      Deshalb überzeugt mich die pessimistische Stimmung des Artikels nicht. Die Lage wird sich ändern, aber das bedeutet nicht das Ende der AI-Nutzung
  • Ich stimme der Grundstimmung des Textes zu, aber der Stil wirkt zu LLM-mäßig
    Vor allem die Abschnittsstruktur und Punchlines wie „That is not a rounding error. That is a line item that needs its own budget code.“

    • Claude erzeugt solche Sätze wirklich sehr oft
      Das ist ziemlich nervig, und bei Gemini habe ich das mit demselben Prompt nicht so oft gesehen
    • Ich weiß nicht einmal, wer diesen Text überhaupt geschrieben hat
      Im Artikel steht kein Autorenname
    • Pangram markiert diesen Text mit hoher Sicherheit als 100 % AI-generiert
  • Brad Gerstner hat bestätigt, dass Tokens nicht mit Verlust verkauft werden
    Unabhängig davon, wie die Formel API und Abos aufteilt, machen die Unternehmen beim reinen Tokenverkauf Gewinn
    Wenn man Gehälter und Aktienvergütung einrechnet, kann es Verluste geben, aber die Tokens selbst sind derzeit profitabel

    • Es ist, als würde man eine Rakete mit dem stärksten Triebwerk der Welt sehen, die nach dem Erreichen der Umlaufbahn den Motor abstellt und sagt: „Sie fliegt jetzt ohne Antrieb“
      Im Moment mag das stimmen, aber so ist sie nicht hierhergekommen
      Die Investitionen, die wieder eingespielt werden müssen, liegen bei Billionen Dollar, während die Umsätze bestenfalls im Milliardenbereich liegen; deshalb geht die Rechnung, dass Tokens in naher Zukunft Gewinn abwerfen, nicht auf
    • Tokens können zwar mit Gewinn verkauft werden, aber 70 % der Ausgaben für Rechenleistung gehen in Forschung, Entwicklung und Modelltraining[0]
      Inferenz muss nicht nur für sich genommen profitabel sein, sondern auch diese Kosten mittragen
      [0] https://epoch.ai/data-insights/openai-compute-spend
    • Sie verkaufen nicht mit Verlust, aber auch nicht teuer genug, um die aktuellen Verluste und Kosten zu decken
      Die Verluste werden in einer merkwürdigen zirkulären Finanzierungsstruktur weitergereicht, und irgendwann könnte das in einer Schuldenkrise zusammenbrechen
    • Anders gesagt: AI-Unternehmen haben vor Kostenabzug positive Gewinne
    • Ob das auch für Claude-Code- oder Codex-Tokens gilt, weiß ich nicht
      Ich vermute, dass dort stark subventioniert wird, aber das sind die einzigen Dinge, bei denen ich tatsächlich Wert spüre
  • Das Problem mit „AI“ insgesamt ist, dass es leicht ist, ohne sie zu leben
    Die AI-Unternehmen wissen das, die Nutzer wissen das, und selbst der AI-freundlichste Manager weiß das
    Wenn man sich vorstellt, dass weltweit sofort jede AI entfernt würde, wäre das Ergebnis einfach normales Arbeiten wie bisher
    Der Artikel betont diesen Punkt nicht genug. Geht es darum, dass man Angst vor dem Tag haben soll, an dem PR-Reviews wieder von echten Ingenieuren gemacht werden müssen?

    • Ich glaube, am Anfang jeder neuen Technologie ist das immer so
      Je tiefer die Technologie integriert wird, desto weniger stimmt das
      Dasselbe hätte man auch ein paar Jahre nach dem Aufkommen des Elektromotors sagen können, man hätte eben weiter mit Dampf gearbeitet
      Aber heute würde die Gesellschaft zusammenbrechen, wenn man ohne Elektromotoren leben müsste
      Die Frage ist nicht, ob man jetzt ohne sie auskommt, sondern ob das auch in 5–10 Jahren noch gilt, nachdem sie vollständig integriert ist
    • Wahrscheinlich deshalb wird noch stärker gedrückt
      Nicht um ehrliche Umsätze zu erzeugen, sondern um AI-Produkte so tief einzubetten, dass „wir entfernen die AI einfach“ nicht mehr wie eine Option wirkt
      Selbst wenn die laufenden Kosten weiter steigen und irgendwann das Niveau von staatlichen Rettungsaktionen für Fluggesellschaften übertreffen
      Es ist eine neue vermittelnde Schicht zur Wohlstandsabschöpfung, verkauft mit falschen Versprechen
    • Wer JavaScript nutzt, wird das natürlich so sehen
      Zumindest zum Schreiben von JavaScript kann ich ohne AI nicht mehr leben
    • Es wirkt immer seltsam, wenn empfohlen wird, AI-Tools selbst für ganz gewöhnliche und allgemeine Aufgaben zu verwenden
      Als wären sie ein Haustier, das stirbt, wenn man es nicht ab und zu benutzt
  • Der Artikel liegt falsch. Solche Abos werden Unternehmen sehr wohl angeboten
    Firmen zahlen Beträge, die viel näher an den API-Preisen liegen
    Die Strategie besteht darin, Privatnutzer an unbegrenzte Tokens zu gewöhnen und dann zu hoffen, dass sich dieses Verhalten in den Arbeitsplatz überträgt

    • Werden sie
      Team- oder Enterprise-Sitze sind teurer als Verbraucherpreise, aber es sind Festpreise mit zurückgesetzten Nutzungslimits
      Man kann Mitgliedern Sitze zuweisen, die den Plänen für 20/100/200 Dollar pro Monat entsprechen, oder alles komplett nutzungsbasiert abrechnen
      Es gibt viele Arten zu kaufen
    • Abos werden Unternehmen definitiv angeboten
      Es gibt auch nutzungsbasierte Pläne, die den entsprechenden Verbraucherplänen gleichkommen
    • Ich war verwirrt, warum hier von Enterprise-Abos gesprochen wird
      In meinem Unternehmen wird nach API-Nutzung abgerechnet
    • Solche Absätze wirken eher wie etwas, das AI ausgespuckt hat
      „Im Großen und Ganzen ist das Muster dasselbe. Preisgestaltung für Einführung, nicht für Wirtschaftlichkeit. Organisationen binden. AI zum tragenden Teil der täglichen Arbeit jedes Teams machen. Sich um die Rechnung später kümmern.“
    • Außerdem ist selbst die im Text dramatisierte Größenordnung der API-Kosten weiterhin relativ gering
      10.000 Dollar im Monat sind nicht nichts, aber wenn man damit ein Team aus 10–20 Ingenieuren unterstützt, ist das ein ziemlich guter Hebel
  • Ich habe das Original nicht bis zum Ende gelesen, aber ich konnte erkennen, dass es von AI geschrieben wurde
    OpenRouter könnte vielleicht als Referenzpunkt für die Bereitstellungskosten von AI-Anbietern dienen
    Ich höre ständig, dass es ein besseres Preis-Leistungs-Verhältnis als Claude habe; wenn das stimmt, scheint Anthropic entweder aus irgendeinem Grund besonders ineffizient zu sein oder bei Inferenz Gewinn zu machen
    Beim Training könnten sie Geld verlieren, aber das ist möglicherweise einfach die Kostenstruktur, um ein führendes Forschungslabor zu bleiben
    Wenn ein einzelnes Unternehmen wegen Schulden oder Ähnlichem zusammenbricht, könnten Unternehmen doch einfach wechseln, oder?

  • Wenn ich noch einmal Formulierungen wie „It’s not X. It’s Y.“ oder „load-bearing“ als Metapher sehe, muss ich mich übergeben

    • Ich habe ziemlich viele solcher Ausdrücke generiert, und die Liste ist nicht kurz
      „Das Zeitalter der Subventionen endet nicht elegant. Es zeigt überall Risse.“
      „Die Frage ist nicht, ob es ein guter Deal war. Die Frage ist, wie lange der Deal hält.“
      „Ein Entwickler, der gleichzeitig drei oder vier Coding-Agenten laufen lässt, verbraucht nicht drei- oder viermal so viele Tokens wie bei einem Chat-Gespräch. Nicht um eine einstellige Größenordnung mehr, sondern um mehr als eine Größenordnung.“
      „Das sind keine Experimente mehr. Das sind tragende Workflows.“
      „Das ist kein Rundungsfehler. Das ist ein Posten, der einen eigenen Budgetcode braucht.“
    • Wenn es zu einer großen Preisanpassung kommt, könnten viele Leute, die mit kostenlosen oder 20-Dollar-Abos Social-Media-Kommentare generiert haben, nach Sicht der tatsächlichen Kosten wieder selbst schreiben
      Zumindest darf man das hoffen
    • Ich mag auch die Formulierung „the unlock“ überhaupt nicht
    • Dieser Text war am Anfang noch okay
      Es gab Daten, und die Logik war plausibel, aber ungefähr zur Mitte hin kam dann Trendbeispiel, noch ein Beispiel, ein drittes Beispiel und „es ist nicht einfach X, sondern Y“
      Es nervt ungefähr so sehr, wie einen gut geschriebenen Text zu lesen, dann auf den Quellenlink zu klicken und einen Rickroll zu bekommen
  • Enterprise-Kunden nutzen kein Claude-Pro-Abo für 20 Dollar im Monat
    Unser Unternehmen stellt Entwicklern ein Nutzungslimit im Wert von etwa 1.000 Dollar pro Monat bereit, und soweit ich sehe, liegt die Ersparnis gegenüber API-Kosten höchstens bei 30 %
    Das ist keine verrückte Subventionshöhe
    Für andere Rollen sind oft nur 50 Dollar pro Monat erlaubt, und diese Leute schöpfen ihr Limit trotzdem ständig aus
    GitHub Copilot arbeitet bei Business- und Enterprise-Sitzen schon länger so, wird aber bald an Grenzen stoßen
    Ich denke, nach der Neuordnung der Verbraucher-Accounts Pro und Pro+ ab Juni wird das schnell nachziehen
    Bei OpenAI beunruhigt mich am meisten, dass sie Tokens herausblasen, um Kunden zu binden; deshalb fürchte ich nach einem IPO dort starke und plötzliche Änderungen bei Preisen und Bedingungen
    Anthropic handelt in diesem Punkt bereits verantwortungsvoll, und auch GitHub Copilot versucht in den kommenden Monaten offenbar, übermäßige Subventionen zu korrigieren

    • Eigentlich hat nur GitHub Copilot wirklich absurde Subventionen gegeben
      Weil dort nicht nach Tokens, sondern pro „Request“ abgerechnet wurde
      Eine einzelne Anfrage im Wert von 3 Cent konnte gemessen an Tokens mehr als 20 Dollar verbrennen, und dieses Modell endet in diesem Monat
      Ich war auch besorgt, weil ich GHCP für große Arbeitsblöcke genutzt habe, aber der neue Kostenschätzer zeigte nach API-Preisen etwa 150–200 Dollar pro Monat
      Das ist zwar eine Subvention gegenüber einem 20-Dollar-Abo, aber keine völlig verrückte
      Wer agentenartige Coding-Tools intensiv und verantwortungsvoll nutzt, landet nach API-Preisen wahrscheinlich grob bei 200 Dollar im Monat
      Wenn der Anbieter selbst bei diesem Preis noch Geld verdient, ist das für Unternehmen im Westen angesichts der eingesparten Entwicklerzeit nicht schwer zu akzeptieren
      Das eigentliche Risiko liegt bei Vibe-Codern mit privaten Projekten
      Die Zeit, in der man mit subventionierten Plänen riesige Apps missbrauchen konnte, geht zu Ende
  • Wenn sie Entwickler ersetzen, ist ein Preis über 20 oder 100 Dollar im Monat plausibel
    Das eigentliche Problem der LLM-Unternehmen ist, dass sie außerhalb des Codings noch keinen Wert gezeigt haben
    Ohne das würden sie einfach zu Coding-Tools herabgestuft
    Deshalb eilen sie jetzt, und entscheidend ist, welche Workflows sich noch stärker automatisieren lassen
    Papierkram ließe sich vielleicht vollständig automatisieren
    Wenn andere Bereiche ausgebaut werden, werden sie ihr Preismodell ändern

    • Es gibt auch einige Versuche, Figma zu ersetzen
      Das könnte durchaus Wert haben