1 Punkte von GN⁺ 4 시간 전 | 1 Kommentare | Auf WhatsApp teilen
  • Microsoft senkt die Kosten interner KI-Tools, indem das Unternehmen die meisten direkten Lizenzen für Claude Code kündigt und Ingenieure zu GitHub Copilot CLI verlagert
  • Claude Code wurde Tausenden Mitarbeitern für Coding-Experimente zur Verfügung gestellt und gewann schnell an Beliebtheit, doch mit dem wachsenden Nutzungsumfang stieg auch die Kostenbelastung
  • Uber hat das gesamte Budget für KI-Coding-Tools für 2026 bereits in nur vier Monaten aufgebraucht und fördert die Nutzung von KI-Tools durch ein internes Leaderboard nach Teams
  • Je stärker Unternehmen zur Steigerung der Produktivität den Token-Verbrauch erhöhen, desto größer kann die Gesamtrechnung werden, selbst wenn der Preis pro Token sinkt
  • Goldman Sachs geht davon aus, dass agentische KI den Token-Verbrauch bis 2030 um das 24-Fache erhöhen könnte, und Gartner erwartet ebenfalls, dass das Verbrauchswachstum den Preisrückgang übersteigen könnte

Ausweitung der internen KI-Nutzung in Unternehmen und die Kostenbelastung

  • Microsoft begann nach einem Bericht von The Verge, die meisten direkten Lizenzen für Claude Code zu kündigen, und verlagert Ingenieure zu GitHub Copilot CLI
  • Der Zugang zu Claude Code wurde vor sechs Monaten Tausenden Mitarbeitern wie Entwicklern, Projektmanagern und Designern für Coding-Experimente bereitgestellt und gewann schnell an Beliebtheit, doch mit wachsender Nutzung traten Kostenprobleme in den Vordergrund
  • Die Kündigung der Claude-Code-Lizenzen hat keine Auswirkungen auf Microsofts Foundry-Vertrag
    • Dieser Vertrag umfasst eine Investition von bis zu 5 Milliarden US-Dollar in Anthropic, Zugang zu Claude-Modellen für Foundry-Kunden und eine Kaufzusage von Anthropic über Azure-Compute-Kapazität im Wert von 30 Milliarden US-Dollar
  • Uber-CTO Praveen Neppalli Naga sagte gegenüber The Information, Uber habe das gesamte Budget für KI-Coding-Tools für 2026 bereits in nur vier Monaten ausgeschöpft
  • Uber fördert die Einführung aktiv durch ein internes Leaderboard, das die Nutzung von KI-Tools nach Teams ranglistet
  • Nvidias VP of Applied Deep Learning Bryan Catanzaro sagte in einem Interview mit Axios: „In meinem Team übersteigen die Compute-Kosten die Personalkosten bei Weitem.“
  • Anthropic reagierte nicht sofort auf eine Bitte von Fortune um Stellungnahme, und Microsoft äußerte sich ebenfalls nicht

Warum günstigere Token zu höheren Rechnungen führen können

  • Unternehmen treiben die Ausweitung der KI-Nutzung ihrer Mitarbeiter zur Steigerung der Produktivität voran, doch bei tokenbasierter Abrechnung steigen mit der Nutzung auch die Gesamtkosten
  • Ein Mitarbeiter von Meta erstellte ein Leaderboard namens „Claudeonomics“, benannt nach dem Anthropic-Modell, um die KI-Nutzung einzelner Mitarbeiter zu verfolgen
  • Amazon ermutigt Mitarbeiter zu „tokenmaxxing“, also dazu, möglichst viele Token zu verbrauchen, der grundlegenden Einheit von KI-Compute
  • Goldman Sachs prognostiziert, dass agentische KI durch die Einführung von KI-Agenten bei Verbrauchern und Unternehmen den Token-Verbrauch bis 2030 um das 24-Fache auf monatlich 120 Trillionen Token erhöhen könnte
  • Gartner erwartet, dass die Inferenzkosten eines LLM mit 1 Billion Parametern bis 2030 im Vergleich zu 2025 um fast 90 % sinken werden, prognostiziert aber zugleich, dass günstigere Token nicht automatisch zu niedrigeren KI-Kosten in Unternehmen führen
    • Agentische Modelle benötigen pro Aufgabe deutlich mehr Token als Standardmodelle
    • Das Verbrauchswachstum könnte den Preisrückgang übersteigen
    • KI-Anbieter geben die gesunkenen Kosten möglicherweise nicht vollständig an die Kunden weiter
  • Gartner Senior Director Analyst Will Sommer warnte: „CPOs sollten die Deflation bei General-Purpose-Token nicht mit der Demokratisierung von Frontier-Inferenz verwechseln.“
  • Nvidia-CEO Jensen Huang sagte, dass eines Tages 100 KI-Agenten pro Mitarbeiter zusammenarbeiten werden, doch wenn der Token-Verbrauch schneller steigt als die Stückpreise fallen, könnte diese agentische Zukunft mit weit höheren Kosten einhergehen, als Führungskräfte erwarten

1 Kommentare

 
GN⁺ 4 시간 전
Hacker-News-Kommentare
  • Die lebhafte Diskussion auf Basis des Originals findet sich hier: https://news.ycombinator.com/item?id=48238896
    Im Artikel steht: „The Verge berichtete, dass Microsoft begonnen habe, den Großteil der direkten Lizenzen für Claude Code zu kündigen.“

    • Dieser Artikel wirkt ziemlich schlampig geschrieben
      1. Es gibt kein Zitat, in dem Microsoft sagt, dass KI teurer ist als Mitarbeiter
      2. Das Deep-Learning-Team von Nvidia gibt zwar mehr für KI als für Mitarbeiter aus, aber das ergibt Sinn, weil der Zweck dieses Teams nicht agentisches Coding ist, sondern tiefgehender und intensiver KI-Einsatz
        Auch die Passage „Bei tokenbasierter Abrechnung wird es umso teurer, je mehr man es nutzt und je effizienter es wird“ ist seltsam. Ich verstehe nicht, warum bessere Effizienz zu höheren Kosten führen soll
  • Die Überschrift scheint irreführend zu sein, und wenn man den Artikel liest, wird der Grund noch klarer. Diese Firmen haben absurde OKRs und Ziele, nach denen man möglichst viele Token verbrennen soll
    Wenn man Token-Nutzung zur Kennzahl macht, ist es nur natürlich, dass am Ende extrem hohe Kosten herauskommen
    Die Inferenzkosten selbst sind beherrschbar, und um diese Technologie sinnvoll zu nutzen, braucht man nicht zwingend die neuesten proprietären Modelle. Menschliche Ingenieure werden noch ziemlich lange nötig sein, aber ich stimme nicht zu, dass „einige Menschen + LLM“ teurer werden oder dauerhaft teurer bleiben werden als einfach mehr Menschen einzustellen

    • Man hätte es auch einfach so sagen können: Das Unternehmen führte ein OKR ein, nach dem die IT-Abteilung mehr als 1000 Dollar pro Tag und Entwickler ausgeben sollte. Das Unternehmen war überrascht, dass die IT-Kosten viel höher waren als zuvor. Dann erhöhte es das auf 1500 Dollar pro Tag und Entwickler mit der Begründung, ein System bauen zu wollen, das herausfindet, warum das passiert ist
      Im Moment scheint Vibe-Leadership ein größeres Problem zu sein als Vibe-Coding, und Vibe-Leadership hat im Kern nichts mit KI zu tun. Es sind Leute, die sich an einer vagen Intuition festbeißen und sie unabhängig von Kosten oder Ergebnissen bis zu unlogischen Schlussfolgerungen weiterverfolgen
    • Aus dem Artikel liest es sich eher so, als hätte man nicht „KI“ aufgegeben, sondern nur das LLM von Claude Code zu GitHub Copilot gewechselt
    • Goodharts Gesetz: In dem Moment, in dem eine Kennzahl zum Ziel wird, ist sie keine gute Kennzahl mehr
    • Ich vermute, die Umsatzzahlen, die Investoren begeistern, basieren genau auf dieser Welt, in der Token die Kennzahl sind. Ein Geschäft kann nicht zugleich explosionsartig wachsen und gleichzeitig nur dann Rendite liefern, wenn strenger gespart wird
    • Es wirkt, als hätten die Medien beschlossen, KI niederzubrennen. Der Newsfeed besteht nur aus Artikeln über die Übel von Rechenzentren, die Nutzlosigkeit von KI und dass alle KI hassen
  • Die Grundannahme dieses Artikels ist falsch. Dass Microsoft die interne Nutzung von Claude Code beendet, liegt nicht daran, dass KI-Kosten zu hoch sind, sondern daran, dass man mit GitHub Copilot ein Konkurrenzprodukt besitzt und die Mitarbeiter dazu bringen will, das eigene Produkt zu verwenden
    Aus demselben Grund bekam Teams während des Lockdowns so viel Aufmerksamkeit

    • Genau. Der Artikel vermischt Microsofts Verhalten mit einer Kostenfrage, obwohl es in Wirklichkeit nicht um Kosten geht. Dazu wird ein beliebiges Zitat des „VP of Applied Deep Learning“ bei Nvidia angehängt, der sagt, dass in seinem Team die Rechenkosten höher sind als die Personalkosten
      Aber dieses Team nutzt keine LLMs für Softwareentwicklung, sondern ist buchstäblich ein Deep-Learning-Team, das nach Deep-Learning-Art Compute verbrennt
      Schon mit etwas Überschlagsrechnung sieht man, dass Microsoft unmöglich mehr Geld für KI als für Entwickler ausgeben kann. Es gibt etwa 80.000 Beschäftigte in der Produktentwicklung, und die Gesamtkosten pro Senior-Entwickler liegen wahrscheinlich bei rund 400.000 Dollar
      Hat Microsoft eine Claude-Rechnung über 32 Milliarden Dollar? Wohl kaum
    • Beides kann zutreffen. Claude kann zu teuer sein, und gleichzeitig kann man die Mitarbeiter zu Copilot umziehen wollen. Da es das eigene Produkt ist, sinken die Kosten, und man kann hoffen, dass dadurch Nutzung und Feedback steigen
      Allerdings ist mir nicht ganz klar, wie das Beispiel mit Teams während des Lockdowns parallel zu der vorherigen Behauptung laufen soll
  • Nirgendwo im Artikel steht, dass Microsoft berichtet habe, KI sei teurer als menschliche Mitarbeiter

    • Wow … was ist mit Fortune passiert? Ich hielt das für ein deutlich besseres Medium als solchen Clickbait
    • Im Titel des Beitrags fehlt vielleicht ein Wort. Es sollte wohl heißen: „Microsoft reports show AI is more expensive…“
      Selbst wenn Microsoft es nicht ausdrücklich gesagt hat, zeigt sich doch, dass KI teurer ist
  • Der tokenmaxxing-Trend ist wohl eine der dümmsten Ideen, die aus dieser KI-Welle hervorgegangen sind. Er läuft dem Ziel maximaler Effizienz und Produktivität völlig zuwider und wird trotzdem breit akzeptiert

  • http://archive.today/l3EEo

  • Microsoft hat Claude gestrichen, weil Copilot nicht besonders gut ist und man Copilot deshalb selbst benutzen muss. Das ist intern anerkannt und kein Geheimnis
    Da Anthropic-Token derzeit subventioniert waren, könnte es für Microsoft inzwischen sogar teurer geworden sein

  • Um die Kosten der KI-Nutzung zu analysieren, muss man den Nutzungskontext betrachten
    Viele Menschen nutzen KI, um Dokumente, Slack-Unterhaltungen und E-Mails hübsch zu glätten oder aus kurzen Prompts unnötig große Dokumente zu erzeugen. Es gab nie einen Grund, warum man für das Versenden von Slack-Nachrichten oder E-Mails innerhalb eines Unternehmens KI gebraucht hätte. Das ist eine Verschwendung von Ressourcen und Zeit, um Dinge glaubwürdiger wirken zu lassen, ohne die Bedeutung wesentlich zu verändern

    • Für solche Zwecke sind die Kosten allerdings eher niedrig
  • Token zu verbrennen ist ungefähr so einfach, wie Geld in einen Ofen zu werfen
    Token-Nutzung ist keine gute Kennzahl für Produktivität. Das Problem ist, dass noch niemand wirklich herausgefunden hat, wie man produktive KI-Nutzung messen soll. Es ist schwer zu unterscheiden, ob Entwickler ihre Produktivität maximieren, nur Token verbrennen oder sich gegen Veränderungen sträuben

    • Die neue Kennzahl Anzahl der Codezeilen
  • KI ist nicht teurer, als menschlichen Mitarbeitern Lohn zu zahlen. KI kann menschliche Mitarbeiter noch nicht ersetzen, also ist die Grundannahme der Überschrift falsch