- Microsoft senkt die Kosten interner KI-Tools, indem das Unternehmen die meisten direkten Lizenzen für Claude Code kündigt und Ingenieure zu GitHub Copilot CLI verlagert
- Claude Code wurde Tausenden Mitarbeitern für Coding-Experimente zur Verfügung gestellt und gewann schnell an Beliebtheit, doch mit dem wachsenden Nutzungsumfang stieg auch die Kostenbelastung
- Uber hat das gesamte Budget für KI-Coding-Tools für 2026 bereits in nur vier Monaten aufgebraucht und fördert die Nutzung von KI-Tools durch ein internes Leaderboard nach Teams
- Je stärker Unternehmen zur Steigerung der Produktivität den Token-Verbrauch erhöhen, desto größer kann die Gesamtrechnung werden, selbst wenn der Preis pro Token sinkt
- Goldman Sachs geht davon aus, dass agentische KI den Token-Verbrauch bis 2030 um das 24-Fache erhöhen könnte, und Gartner erwartet ebenfalls, dass das Verbrauchswachstum den Preisrückgang übersteigen könnte
Ausweitung der internen KI-Nutzung in Unternehmen und die Kostenbelastung
- Microsoft begann nach einem Bericht von The Verge, die meisten direkten Lizenzen für Claude Code zu kündigen, und verlagert Ingenieure zu GitHub Copilot CLI
- Der Zugang zu Claude Code wurde vor sechs Monaten Tausenden Mitarbeitern wie Entwicklern, Projektmanagern und Designern für Coding-Experimente bereitgestellt und gewann schnell an Beliebtheit, doch mit wachsender Nutzung traten Kostenprobleme in den Vordergrund
- Die Kündigung der Claude-Code-Lizenzen hat keine Auswirkungen auf Microsofts Foundry-Vertrag
- Dieser Vertrag umfasst eine Investition von bis zu 5 Milliarden US-Dollar in Anthropic, Zugang zu Claude-Modellen für Foundry-Kunden und eine Kaufzusage von Anthropic über Azure-Compute-Kapazität im Wert von 30 Milliarden US-Dollar
- Uber-CTO Praveen Neppalli Naga sagte gegenüber The Information, Uber habe das gesamte Budget für KI-Coding-Tools für 2026 bereits in nur vier Monaten ausgeschöpft
- Uber fördert die Einführung aktiv durch ein internes Leaderboard, das die Nutzung von KI-Tools nach Teams ranglistet
- Nvidias VP of Applied Deep Learning Bryan Catanzaro sagte in einem Interview mit Axios: „In meinem Team übersteigen die Compute-Kosten die Personalkosten bei Weitem.“
- Anthropic reagierte nicht sofort auf eine Bitte von Fortune um Stellungnahme, und Microsoft äußerte sich ebenfalls nicht
Warum günstigere Token zu höheren Rechnungen führen können
- Unternehmen treiben die Ausweitung der KI-Nutzung ihrer Mitarbeiter zur Steigerung der Produktivität voran, doch bei tokenbasierter Abrechnung steigen mit der Nutzung auch die Gesamtkosten
- Ein Mitarbeiter von Meta erstellte ein Leaderboard namens „Claudeonomics“, benannt nach dem Anthropic-Modell, um die KI-Nutzung einzelner Mitarbeiter zu verfolgen
- Amazon ermutigt Mitarbeiter zu „tokenmaxxing“, also dazu, möglichst viele Token zu verbrauchen, der grundlegenden Einheit von KI-Compute
- Goldman Sachs prognostiziert, dass agentische KI durch die Einführung von KI-Agenten bei Verbrauchern und Unternehmen den Token-Verbrauch bis 2030 um das 24-Fache auf monatlich 120 Trillionen Token erhöhen könnte
- Gartner erwartet, dass die Inferenzkosten eines LLM mit 1 Billion Parametern bis 2030 im Vergleich zu 2025 um fast 90 % sinken werden, prognostiziert aber zugleich, dass günstigere Token nicht automatisch zu niedrigeren KI-Kosten in Unternehmen führen
- Agentische Modelle benötigen pro Aufgabe deutlich mehr Token als Standardmodelle
- Das Verbrauchswachstum könnte den Preisrückgang übersteigen
- KI-Anbieter geben die gesunkenen Kosten möglicherweise nicht vollständig an die Kunden weiter
- Gartner Senior Director Analyst Will Sommer warnte: „CPOs sollten die Deflation bei General-Purpose-Token nicht mit der Demokratisierung von Frontier-Inferenz verwechseln.“
- Nvidia-CEO Jensen Huang sagte, dass eines Tages 100 KI-Agenten pro Mitarbeiter zusammenarbeiten werden, doch wenn der Token-Verbrauch schneller steigt als die Stückpreise fallen, könnte diese agentische Zukunft mit weit höheren Kosten einhergehen, als Führungskräfte erwarten
1 Kommentare
Hacker-News-Kommentare
Die lebhafte Diskussion auf Basis des Originals findet sich hier: https://news.ycombinator.com/item?id=48238896
Im Artikel steht: „The Verge berichtete, dass Microsoft begonnen habe, den Großteil der direkten Lizenzen für Claude Code zu kündigen.“
Auch die Passage „Bei tokenbasierter Abrechnung wird es umso teurer, je mehr man es nutzt und je effizienter es wird“ ist seltsam. Ich verstehe nicht, warum bessere Effizienz zu höheren Kosten führen soll
Die Überschrift scheint irreführend zu sein, und wenn man den Artikel liest, wird der Grund noch klarer. Diese Firmen haben absurde OKRs und Ziele, nach denen man möglichst viele Token verbrennen soll
Wenn man Token-Nutzung zur Kennzahl macht, ist es nur natürlich, dass am Ende extrem hohe Kosten herauskommen
Die Inferenzkosten selbst sind beherrschbar, und um diese Technologie sinnvoll zu nutzen, braucht man nicht zwingend die neuesten proprietären Modelle. Menschliche Ingenieure werden noch ziemlich lange nötig sein, aber ich stimme nicht zu, dass „einige Menschen + LLM“ teurer werden oder dauerhaft teurer bleiben werden als einfach mehr Menschen einzustellen
Im Moment scheint Vibe-Leadership ein größeres Problem zu sein als Vibe-Coding, und Vibe-Leadership hat im Kern nichts mit KI zu tun. Es sind Leute, die sich an einer vagen Intuition festbeißen und sie unabhängig von Kosten oder Ergebnissen bis zu unlogischen Schlussfolgerungen weiterverfolgen
Die Grundannahme dieses Artikels ist falsch. Dass Microsoft die interne Nutzung von Claude Code beendet, liegt nicht daran, dass KI-Kosten zu hoch sind, sondern daran, dass man mit GitHub Copilot ein Konkurrenzprodukt besitzt und die Mitarbeiter dazu bringen will, das eigene Produkt zu verwenden
Aus demselben Grund bekam Teams während des Lockdowns so viel Aufmerksamkeit
Aber dieses Team nutzt keine LLMs für Softwareentwicklung, sondern ist buchstäblich ein Deep-Learning-Team, das nach Deep-Learning-Art Compute verbrennt
Schon mit etwas Überschlagsrechnung sieht man, dass Microsoft unmöglich mehr Geld für KI als für Entwickler ausgeben kann. Es gibt etwa 80.000 Beschäftigte in der Produktentwicklung, und die Gesamtkosten pro Senior-Entwickler liegen wahrscheinlich bei rund 400.000 Dollar
Hat Microsoft eine Claude-Rechnung über 32 Milliarden Dollar? Wohl kaum
Allerdings ist mir nicht ganz klar, wie das Beispiel mit Teams während des Lockdowns parallel zu der vorherigen Behauptung laufen soll
Nirgendwo im Artikel steht, dass Microsoft berichtet habe, KI sei teurer als menschliche Mitarbeiter
Selbst wenn Microsoft es nicht ausdrücklich gesagt hat, zeigt sich doch, dass KI teurer ist
Der tokenmaxxing-Trend ist wohl eine der dümmsten Ideen, die aus dieser KI-Welle hervorgegangen sind. Er läuft dem Ziel maximaler Effizienz und Produktivität völlig zuwider und wird trotzdem breit akzeptiert
http://archive.today/l3EEo
Microsoft hat Claude gestrichen, weil Copilot nicht besonders gut ist und man Copilot deshalb selbst benutzen muss. Das ist intern anerkannt und kein Geheimnis
Da Anthropic-Token derzeit subventioniert waren, könnte es für Microsoft inzwischen sogar teurer geworden sein
Um die Kosten der KI-Nutzung zu analysieren, muss man den Nutzungskontext betrachten
Viele Menschen nutzen KI, um Dokumente, Slack-Unterhaltungen und E-Mails hübsch zu glätten oder aus kurzen Prompts unnötig große Dokumente zu erzeugen. Es gab nie einen Grund, warum man für das Versenden von Slack-Nachrichten oder E-Mails innerhalb eines Unternehmens KI gebraucht hätte. Das ist eine Verschwendung von Ressourcen und Zeit, um Dinge glaubwürdiger wirken zu lassen, ohne die Bedeutung wesentlich zu verändern
Token zu verbrennen ist ungefähr so einfach, wie Geld in einen Ofen zu werfen
Token-Nutzung ist keine gute Kennzahl für Produktivität. Das Problem ist, dass noch niemand wirklich herausgefunden hat, wie man produktive KI-Nutzung messen soll. Es ist schwer zu unterscheiden, ob Entwickler ihre Produktivität maximieren, nur Token verbrennen oder sich gegen Veränderungen sträuben
KI ist nicht teurer, als menschlichen Mitarbeitern Lohn zu zahlen. KI kann menschliche Mitarbeiter noch nicht ersetzen, also ist die Grundannahme der Überschrift falsch