Microsoft beginnt mit dem Entzug von Claude-Code-Lizenzen
(theverge.com)- Microsoft hat seit Dezember Tausenden internen Entwicklern Zugang zu Claude Code gegeben, nimmt diese Ausweitung aber nach nur sechs Monaten wieder zurück
- Claude Code gewann an Beliebtheit und wurde auch für Coding-Experimente von Projektmanagern, Designern und anderen Mitarbeitern genutzt, geriet damit jedoch in Konkurrenz zu GitHub Copilot CLI
- Microsoft will den Großteil der Claude-Code-Lizenzen entfernen und viele Entwickler zu Copilot CLI verlagern, um sich auf ein zentrales agentisches Kommandozeilen-Tool zu konzentrieren
- Das Team Experiences + Devices reduziert die Nutzung bis Ende Juni; dazu gehören Ingenieure für Windows, Microsoft 365, Outlook, Teams und Surface
- Die Entscheidung fällt mit dem Ende des Geschäftsjahres am 30. Juni zusammen; der Lizenzentzug erleichtert Kostensenkungen zum Beginn des neuen Geschäftsjahres im Juli
Rückbau der Claude-Code-Lizenzen
- Microsoft hat seit Dezember Tausenden internen Entwicklern Zugang zu Claude Code gegeben, damit sie das AI-Coding-Tool von Anthropic täglich nutzen
- Dies war Teil eines Versuchs, Projektmanagern, Designern und anderen Mitarbeitern erstmals Coding-Experimente zu ermöglichen
- Claude Code hat in den vergangenen sechs Monaten innerhalb von Microsoft an Beliebtheit gewonnen, doch Microsoft bereitet nun eine Rücknahme der Ausweitung vor
Wechsel zu Copilot CLI
- Microsoft will den Großteil der Claude-Code-Lizenzen entfernen und viele Entwickler zu GitHub Copilot CLI verlagern
- Die Beliebtheit von Claude Code kollidierte mit GitHub Copilot CLI, der Kommandozeilenversion von GitHub Copilot, die außerhalb von Entwickler-Apps wie Visual Studio Code läuft
- Das Team Experiences + Devices reduziert die Nutzung von Claude Code bis Ende Juni
- Dazu gehören Ingenieure für Windows, Microsoft 365, Outlook, Microsoft Teams und Surface
- Den Ingenieuren wird empfohlen, ihre Workflows in den kommenden Wochen vor dem Stichtag auf GitHub Copilot CLI umzustellen
Hintergrund und Zeitplan der Entscheidung
- Microsoft will Copilot CLI konzernweit innerhalb von Experiences + Devices als zentrales agentisches Kommandozeilen-Interface-Tool etablieren
- Auch finanzielle Gründe spielen eine Rolle
- Der 30. Juni ist der letzte Tag des aktuellen Geschäftsjahres von Microsoft
- Durch den Entzug der Claude-Code-Lizenzen lassen sich die Betriebskosten zum Start des neuen Geschäftsjahres im Juli leichter senken
- Rajesh Jha, Executive Vice President der Microsoft-Gruppe Experiences and Devices, erklärte in einem internen Memo, dass das Ziel des gleichzeitigen Angebots von Copilot CLI und Claude Code darin bestanden habe, die Tools in realen Engineering-Workflows schnell kennenzulernen und zu benchmarken, um zu verstehen, was am besten zu den Teams passt
1 Kommentare
Hacker-News-Kommentare
Mehr Details stehen im Fortune-Artikel Microsoft reports are exposing AI's real cost problem: Using the tech is more expensive than paying human employees – https://fortune.com/2026/05/22/microsoft-ai-cost-problem-tok...
Der Ratschlag, selektiv billigere Modelle zu verwenden, passt nicht zur Realität in der Branche. Es gibt ständig den Druck, schnell genug Code zu produzieren, sonst riskiert man eine Entlassung, daher ist es schwer, mit dem Lebensunterhalt auf weniger effektive Modelle zu wetten.
Token-Kosten zu sparen wird in Leistungsbeurteilungen kaum belohnt, und es ist auch schwer zu quantifizieren, wie viel man im Vergleich zum Einsatz teurer Modelle tatsächlich eingespart hat.
Das Problem, nützlichen Code schnell zu erzeugen, wird nicht dadurch gelöst, dass man pro Stunde mehr Tokens verbraucht. Selbst nichttechnische Führungskräfte können das verstehen, und sie interessieren sich womöglich eher für die spieltheoretische Struktur, in der implizite Erwartungen an den Token-Verbrauch den Wettbewerb unter Entwicklern erzwingen.
Wenn nur das Vergütungspaket zählt und man möglichst lange durchhalten will, muss man sich diesem neuen Spiel zumindest grob anpassen. Am besten hält man den Token-Verbrauch irgendwo zwischen den bereits entstandenen Extremen, damit man in allen AI-Berichten, die das Management erstellen kann, beim statistischen Mittelpunkt landet.
Am Ende werden Unternehmen hohe Kosten für einen großen Reality-Check zahlen, denn Kreativität und Qualität lassen sich auch mit AI nicht erzwingen. Echte Intelligenz liegt heute wie auch in absehbarer Zukunft immer noch bei uns.
Aber wenn die Schnur reißt, fallen Führungskräfte bestenfalls mit fetten Abfindungsboni und einer „Liste ihrer Beiträge“, für die wir dankbar sein sollen, nach oben, während wir den Schmerz der nächsten Massenentlassung tragen.
Nach Kosten pro Codezeile hat sich immer wieder gezeigt, dass das ein Fehler ist, solange Menschenzeit nicht billiger ist als Maschinenzeit. Das gilt fast immer, außer man bewertet die eigene Zeit nicht nach Stundenlohn, sondern mit Kosten gleich null.
Am schlimmsten für die Produktivität war, wenn Claude Code oder Claude Cowork komplexe Probleme übernahmen, schlechte Anweisungen für dumme Modell-Agenten schrieben und deren dumme Antworten zu einer Orchestrierung schlechter Ergebnisse zusammenfügten.
Die beste Verbesserung beim Verhältnis von Gesamtkosten zu Ergebnis besteht darin, das gesamte Material lesen und durchdenken zu lassen und das Denken dem klügsten Modell zu überlassen, nicht Agenten.
Agenten sollten Wiederholungsarbeit erledigen. Agenten sollten nicht denken und auch nicht entscheiden, worüber gedacht werden soll. Das ist selbst schon Denken.
Wenn Agenten „denken“ müssen, dann wie Ameisen, Bienen oder Biber. Menschenähnliches Denken, besonders etwas in Richtung Intuition, sollte nach Möglichkeit das beste verfügbare Modell übernehmen.
Niemand sollte Code „herauspumpen“. In der Hierarchie aus Codern, die detaillierte Spezifikationen in irgendeine Computersprache übersetzen, Entwicklern, die Software termingerecht zum Projektplan liefern, und Ingenieuren, die Geschäftsziele erreichen, sollten Ingenieure die Motorarchitektur für Geschäftsergebnisse bauen.
So betrachtet werden Maschinen zu einem Hebel, der verschiedene Kosten senkt. Gleichzeitig verstehen die meisten Trainingsdaten das nicht, deshalb verstehen es die Maschinen ebenfalls nicht, und deshalb muss ein Mensch die Form dieser Wiederholungsarbeit vorgeben.
Das wäre für ein paar Cents pro Dollar möglich gewesen, und Microsoft hätte Kosten über wenig ausgelastete GPUs senken oder überschüssige GPU-Rechenleistung puffern können. Serverless ist schließlich auch irgendwo aus ungenutzten Ressourcen von Webservern entstanden.
Wenn schon das alte Rechenzentrum von xAI gereicht hätte, um Anthropic wieder zu überholen, dann hätte Microsoft wohl auch auf GPUs der vorherigen Generation, die nur Serverraum belegen und untätig herumstehen, selbst hosten können.
Wenn man den Artikel liest, hatte Microsoft Entwicklern sowohl Claude Code als auch Copilot angeboten.
Gewollt war, dass sie beides ausprobieren und Rückmeldung geben, was besser ist.
Die Entwickler haben mit den Füßen abgestimmt und Copilot nicht genutzt.
Vermutlich hatte Microsoft genau das Gegenteil gehofft.
Anders als „echtes“ Claude Code oder Cowork kann es nur auf Dateien in bestimmten OneDrive-Ordnern innerhalb persönlicher SharePoint-Container zugreifen und passt dadurch viel besser zu Compliance-Anforderungen wie NIS2.
Technisch nutzen wir Copilot und bezahlen über Microsoft-Lizenzen, intern läuft aber Opus 4.7. Schon davor waren die meisten Custom Agents in m365 copilot eines der GPT-Modelle.
Oder sie wollen Entwickler wirklich dazu bringen, Copilot-Modelle zu verwenden.
Bei der Wahl des Basismodells gibt es weiterhin keine Beschränkungen. Opus 4.6 ist mit großem Abstand am beliebtesten, und es fließen weiterhin hohe Kosten zu Anthropic.
Ehrlich gesagt halte ich GitHub Copilot CLI und die neue GitHub-Copilot-App für ziemlich gut. Ich nutze meist Opus 4.7, gelegentlich GPT-5.5. Die VSCode-Erweiterung ist okay, aber CLI oder App sind für mich die bessere Erfahrung.
Natürlich sollte man auch andere Optionen am Markt kennen und das richtige Werkzeug für die Aufgabe einsetzen, aber wenn es ein direkt konkurrierendes Produkt gibt, möchte die Organisation vermutlich lieber, dass ihre Telemetrie und ihre Vorschläge in die Verbesserung der eigenen Software fließen statt in die der Konkurrenz.
Es gibt definitiv Möglichkeiten, Claude Code tokenbewusst zu nutzen.
Ich habe unbeaufsichtigte agentische Softwarefabrik-Workflows ausprobiert; dabei wurden massiv Tokens verbrannt, aber es kam kaum etwas dabei heraus.
Ein Prozess, in dem Menschen zwischendurch eingreifen und beaufsichtigen, war dagegen viel produktiver und verbrauchte deutlich weniger. Vielleicht ist das genau der Grund, warum alle den agentischen Ansatz so stark pushen.
Deshalb habe ich das Problem mit einer agentischen parallelen Code-Review-Fähigkeit gelöst. Im Grunde ist das ein Generator für unendliche TODO-Listen. Jetzt nutze ich sicher 100 % dessen aus, wofür ich bezahle.
Es verbrennt Unmengen an Tokens, findet dabei aber auch viele Probleme. Ich wiederhole diesen Review-/Fix-Prozess jede Woche, und die Menge, auf die Menschen beim Review achten müssen, ist stark gesunken.
Zum Vergleich: Ein Mistral-Abo kostet etwa 20 Euro im Monat und war bei Tests für ähnliche Aufgaben okay; pro Tag wurden dabei ungefähr 10 % des Monatslimits verbraucht. Auch der Max-5x-Plan von Anthropic bietet deutlich mehr frei nutzbare Tokens.
Das Optimum scheint zu sein, bei irgendeinem Anbieter ein Monatsabo zu nutzen. Das ist erheblich subventioniert. Wenn ich aber pro Token zahlen müsste, würde ich inzwischen zuerst prüfen, welche Aufgaben sich mit DeepSeek erledigen lassen. Leider passt das vermutlich nicht auf das oben genannte Szenario, aber für ein Startup könnte es anders sein.
Andererseits wirkt es etwas heuchlerisch. Das Ganze war Teil eines Versuchs, Projektmanagern, Designern und anderen Mitarbeitern erstmals das Experimentieren mit Coding zu ermöglichen, und zugleich heißt es, Claude Code sei in den letzten sechs Monaten intern bei Microsoft enorm beliebt gewesen.
Wenn man sagt, die Zukunft sei komplett AI, aber dann die Rechnung bekommt, ändert sich offenbar die Haltung.
In Teilen des Artikels steht, Microsoft wolle die meisten Claude-Code-Lizenzen entfernen und viele Entwickler zu Copilot CLI verschieben.
Claude Code sei zwar beliebt gewesen, habe aber auch Microsofts neues GitHub Copilot CLI-Coding-Tool geschwächt, also die Kommandozeilenversion von GitHub Copilot, die außerhalb von Entwickler-Apps wie Visual Studio Code läuft.
Hier wird das aber vor allem so interpretiert, als sei das Problem, dass Claude zu schnell Tokens verbrennt, und Microsoft solle stattdessen SomeOtherLLM© verwenden.
Ich weiß nicht, ob das hier Hacker News ist oder ein Marketing-Schlachtfeld.
[1] Internet Rule #48
Unsere Organisation wird dazu gezwungen, Copilot in einer Government-Cloud zu nutzen, und es ist so nutzlos, dass wir meist einfach direkt selbst coden.
Die Syntax ist schlampig, Zeilen werden zufällig zusammengezogen, die Reihenfolge wird umgedreht, oder mitten in eine Zeile fällt plötzlich eine Ausgabe mit ein paar Tokens, und merkwürdigerweise fehlt ständig die letzte Zeile jedes Codeblocks. Intern scheint man irgendeine GPT-Version von vor mehreren Releases zu verwenden.
Trotzdem zeigt es gut, dass die Modelle der letzten etwa zwölf Monate die Schwelle von „interessant“ zu echter Produktivitätssteigerung überschritten haben.
Von Copilot, Claude und Gemini bevorzuge ich in der Praxis immer noch Gemini. Ich schreibe nicht nur Code, sondern auch viel wissenschaftliche Texte, und Gemini ist das einzige Modell, bei dem ich darauf vertrauen kann, dass es „einfach stimmt“. Dieses Vertrauen überträgt sich auch auf die Codeausgabe.
Fühlt sich insgesamt ziemlich zutreffend an.
Am selben Tag wurden intern für Demos Claude Code und DeepSeek eingeführt; Claude hatte sein Monatskontingent nach etwas mehr als einer Woche verbraucht, und mehr als die Hälfte dieses Budgets war an einem einzigen Tag weg. Bei DeepSeek schaffen es die Leute überhaupt nicht, in einem Monat so viel Geld auszugeben.
Deshalb wirkt Claude wie ein teures Spielzeug und DeepSeek wie eine Schaufel. Entwickler haben nicht das Gefühl, beim Nutzen an einer kostbaren Ressource zu nagen.
Der Fähigkeitsunterschied zwischen Claude und DS-pro scheint auch gar nicht so groß zu sein. Der Abstand zwischen DS-pro und flash fühlt sich an wie zwischen sonnet/opus und haiku, aber auch flash ist noch sehr leistungsfähig.
Zwei Wochen lang wurde Claude immer schlechter, und heute war die letzte Grenze erreicht.
Ob es eine Handy-App gibt oder nicht, ist mir egal. Das Modell, nachdem es glaubt, einen nach langer Abodauer „eingefangen“ zu haben, ist völliger Müll.
Wenn sich das Modell in die entgegengesetzte Richtung dessen bewegt, was es gesagt hat, und gegen Anweisungen handelt, kann man auf dem Handy nicht coden. Wenn ich Code verschlechtern will, kann ich auch einfach irgendeinen Müll committen. Dafür brauche ich keine mobile App.
Das erinnert mich daran, wie Steve Ballmer seinen Kindern verboten hat, einen iPod zu benutzen, und sie stattdessen einen Zune verwenden mussten.
Ich bin ziemlich zufrieden mit dem 10-Dollar-Monatsplan von CoPilot. Der Zugriff auf Claude-Modelle ist weiterhin enthalten, und die Tokens sind zwar begrenzt, aber es gibt keine Zeitlimits wie beim 20-Dollar-Plan von Claude, sodass mein Arbeitsfluss nicht unterbrochen wird.
Für normale Aufgaben nutze ich eines der kostenlosen Modelle, und bei besonders kniffligen Problemen schalte ich Claude dazu. Für mich funktioniert das sehr gut.
GitHub Copilot war wahrscheinlich das beste Preis-Leistungs-Verhältnis und meiner Meinung nach lange unterbewertet. Ich war seit dem ersten Tag Jahresabonnent.
Die vor ein paar Tagen angekündigten Änderungen haben dieses Wertversprechen komplett zerstört, und ich bin unsicher, ob ich weiter abonniert bleibe.
Das neue Preismodell hat das geändert. Trotzdem werde ich es wohl für die Autovervollständigung behalten, für die Fälle, in denen ich gelegentlich den Editor öffne.
Wenn Entwickler mit der Begründung entlassen werden, AI sei besser, schneller und billiger oder mache Menschen 10x produktiver, frage ich mich, was passiert, wenn die nötigen Werkzeuge am Ende teurer werden.
Ist aus Investorensicht die Belastung durch Personalkosten schlimmer oder ein ausufernder Kostenposten?
Wenn der Aktienmarkt rational wäre, würde das nicht funktionieren, aber der Aktienmarkt ist niemals rational.
Hinweise auf Verdrängung von Arbeit sieht man nur bei Junior-Einstellungen. Nicht, weil Leute entlassen werden, sondern weil Einstiegsjobs verdrängt werden.
Außerdem arbeiten große Sprachmodelle 24/7/365 und lassen sich bei Bedarf hoch- oder herunterskalieren. Besonders in Europa ist es schneller, große Sprachmodelle abzuschalten, als Mitarbeiter zu entlassen.
Deshalb kann AI selbst dann geschäftlich sinnvoll sein, wenn sie teurer ist als Entwickler – jedenfalls aus Sicht von Total Cost of Ownership und Return on Investment.
Solche Technologien enden meist bestenfalls in einem Oligopol, und dann haben die Player breite Burggräben. Außerdem werden die von diesen Modellen erzeugten Artefakte so angepasst sein, dass andere Modelle oder Menschen realistisch nicht mehr damit arbeiten können, und danach kann man die Preise erhöhen und alle bis an die Profitabilitätsgrenze treiben.
Rechnet man Zusatzleistungen, bezahlten Urlaub und andere Gemeinkosten der Beschäftigung hinzu, landet man bei Kosten von ungefähr 1,5 Entwicklern. Man bekommt also zwei Entwickler zum Preis von anderthalb.
Skaliert man das in einem Großunternehmen auf 500 Entwickler, spart man bei den Gehältern viel Geld.
Verglichen mit dem Halten von Personal oder dem Einstellen von Ersatz müsste AI wohl über 15.000 Dollar pro Entwickler und Monat kosten, bevor sie teurer wird. Damit Menschen den Break-even erreichen oder billiger werden, müsste man auf etwa 4 Milliarden Tokens pro Monat kommen.