1 Punkte von GN⁺ 3 시간 전 | 1 Kommentare | Auf WhatsApp teilen
  • Microsoft hat seit Dezember Tausenden internen Entwicklern Zugang zu Claude Code gegeben, nimmt diese Ausweitung aber nach nur sechs Monaten wieder zurück
  • Claude Code gewann an Beliebtheit und wurde auch für Coding-Experimente von Projektmanagern, Designern und anderen Mitarbeitern genutzt, geriet damit jedoch in Konkurrenz zu GitHub Copilot CLI
  • Microsoft will den Großteil der Claude-Code-Lizenzen entfernen und viele Entwickler zu Copilot CLI verlagern, um sich auf ein zentrales agentisches Kommandozeilen-Tool zu konzentrieren
  • Das Team Experiences + Devices reduziert die Nutzung bis Ende Juni; dazu gehören Ingenieure für Windows, Microsoft 365, Outlook, Teams und Surface
  • Die Entscheidung fällt mit dem Ende des Geschäftsjahres am 30. Juni zusammen; der Lizenzentzug erleichtert Kostensenkungen zum Beginn des neuen Geschäftsjahres im Juli

Rückbau der Claude-Code-Lizenzen

  • Microsoft hat seit Dezember Tausenden internen Entwicklern Zugang zu Claude Code gegeben, damit sie das AI-Coding-Tool von Anthropic täglich nutzen
  • Dies war Teil eines Versuchs, Projektmanagern, Designern und anderen Mitarbeitern erstmals Coding-Experimente zu ermöglichen
  • Claude Code hat in den vergangenen sechs Monaten innerhalb von Microsoft an Beliebtheit gewonnen, doch Microsoft bereitet nun eine Rücknahme der Ausweitung vor

Wechsel zu Copilot CLI

  • Microsoft will den Großteil der Claude-Code-Lizenzen entfernen und viele Entwickler zu GitHub Copilot CLI verlagern
  • Die Beliebtheit von Claude Code kollidierte mit GitHub Copilot CLI, der Kommandozeilenversion von GitHub Copilot, die außerhalb von Entwickler-Apps wie Visual Studio Code läuft
  • Das Team Experiences + Devices reduziert die Nutzung von Claude Code bis Ende Juni
    • Dazu gehören Ingenieure für Windows, Microsoft 365, Outlook, Microsoft Teams und Surface
    • Den Ingenieuren wird empfohlen, ihre Workflows in den kommenden Wochen vor dem Stichtag auf GitHub Copilot CLI umzustellen

Hintergrund und Zeitplan der Entscheidung

  • Microsoft will Copilot CLI konzernweit innerhalb von Experiences + Devices als zentrales agentisches Kommandozeilen-Interface-Tool etablieren
  • Auch finanzielle Gründe spielen eine Rolle
    • Der 30. Juni ist der letzte Tag des aktuellen Geschäftsjahres von Microsoft
    • Durch den Entzug der Claude-Code-Lizenzen lassen sich die Betriebskosten zum Start des neuen Geschäftsjahres im Juli leichter senken
  • Rajesh Jha, Executive Vice President der Microsoft-Gruppe Experiences and Devices, erklärte in einem internen Memo, dass das Ziel des gleichzeitigen Angebots von Copilot CLI und Claude Code darin bestanden habe, die Tools in realen Engineering-Workflows schnell kennenzulernen und zu benchmarken, um zu verstehen, was am besten zu den Teams passt

1 Kommentare

 
GN⁺ 3 시간 전
Hacker-News-Kommentare
  • Mehr Details stehen im Fortune-Artikel Microsoft reports are exposing AI's real cost problem: Using the tech is more expensive than paying human employeeshttps://fortune.com/2026/05/22/microsoft-ai-cost-problem-tok...

  • Der Ratschlag, selektiv billigere Modelle zu verwenden, passt nicht zur Realität in der Branche. Es gibt ständig den Druck, schnell genug Code zu produzieren, sonst riskiert man eine Entlassung, daher ist es schwer, mit dem Lebensunterhalt auf weniger effektive Modelle zu wetten.
    Token-Kosten zu sparen wird in Leistungsbeurteilungen kaum belohnt, und es ist auch schwer zu quantifizieren, wie viel man im Vergleich zum Einsatz teurer Modelle tatsächlich eingespart hat.

    • Das Messen des Token-Verbrauchs ist aus meiner Sicht so, als würde man auf einer Baustelle die Menge an Sägemehl messen.
      Das Problem, nützlichen Code schnell zu erzeugen, wird nicht dadurch gelöst, dass man pro Stunde mehr Tokens verbraucht. Selbst nichttechnische Führungskräfte können das verstehen, und sie interessieren sich womöglich eher für die spieltheoretische Struktur, in der implizite Erwartungen an den Token-Verbrauch den Wettbewerb unter Entwicklern erzwingen.
      Wenn nur das Vergütungspaket zählt und man möglichst lange durchhalten will, muss man sich diesem neuen Spiel zumindest grob anpassen. Am besten hält man den Token-Verbrauch irgendwo zwischen den bereits entstandenen Extremen, damit man in allen AI-Berichten, die das Management erstellen kann, beim statistischen Mittelpunkt landet.
    • Die Tragik des Drucks, Code schnell herauszupressen, liegt darin, dass das nicht nachhaltig ist. Jeder, der sich tief mit Technik beschäftigt hat, weiß das.
      Am Ende werden Unternehmen hohe Kosten für einen großen Reality-Check zahlen, denn Kreativität und Qualität lassen sich auch mit AI nicht erzwingen. Echte Intelligenz liegt heute wie auch in absehbarer Zukunft immer noch bei uns.
      Aber wenn die Schnur reißt, fallen Führungskräfte bestenfalls mit fetten Abfindungsboni und einer „Liste ihrer Beiträge“, für die wir dankbar sein sollen, nach oben, während wir den Schmerz der nächsten Massenentlassung tragen.
    • Leuten einschließlich ANTHROP\C zu sagen, sie sollen „selektiv billigere Modelle verwenden“, ist ein schlechter Tausch, weil man dabei immer teurere Menschenzeit einsetzt, um Maschinen zu reparieren, die mit der Zeit billiger werden.
      Nach Kosten pro Codezeile hat sich immer wieder gezeigt, dass das ein Fehler ist, solange Menschenzeit nicht billiger ist als Maschinenzeit. Das gilt fast immer, außer man bewertet die eigene Zeit nicht nach Stundenlohn, sondern mit Kosten gleich null.
      Am schlimmsten für die Produktivität war, wenn Claude Code oder Claude Cowork komplexe Probleme übernahmen, schlechte Anweisungen für dumme Modell-Agenten schrieben und deren dumme Antworten zu einer Orchestrierung schlechter Ergebnisse zusammenfügten.
      Die beste Verbesserung beim Verhältnis von Gesamtkosten zu Ergebnis besteht darin, das gesamte Material lesen und durchdenken zu lassen und das Denken dem klügsten Modell zu überlassen, nicht Agenten.
      Agenten sollten Wiederholungsarbeit erledigen. Agenten sollten nicht denken und auch nicht entscheiden, worüber gedacht werden soll. Das ist selbst schon Denken.
      Wenn Agenten „denken“ müssen, dann wie Ameisen, Bienen oder Biber. Menschenähnliches Denken, besonders etwas in Richtung Intuition, sollte nach Möglichkeit das beste verfügbare Modell übernehmen.
      Niemand sollte Code „herauspumpen“. In der Hierarchie aus Codern, die detaillierte Spezifikationen in irgendeine Computersprache übersetzen, Entwicklern, die Software termingerecht zum Projektplan liefern, und Ingenieuren, die Geschäftsziele erreichen, sollten Ingenieure die Motorarchitektur für Geschäftsergebnisse bauen.
      So betrachtet werden Maschinen zu einem Hebel, der verschiedene Kosten senkt. Gleichzeitig verstehen die meisten Trainingsdaten das nicht, deshalb verstehen es die Maschinen ebenfalls nicht, und deshalb muss ein Mensch die Form dieser Wiederholungsarbeit vorgeben.
    • Ich habe in einem Projekt selbst gern Opus 4.6 fast mode verwendet und dabei etwa 5.000 Dollar ausgegeben. Die Projektlieferung hat diese 5.000 Dollar gerechtfertigt; hätte ich nur 500 Dollar ausgegeben und einen Monat später geliefert, wäre das ein großes Problem gewesen.
    • Was ich mich wirklich frage, ist, warum man keine selbst gehostete Kopie verwendet hat. Wenn es über Azure läuft, zahlt man dann nochmal an Anthropic? Man hätte verhandeln können, damit Anthropic Modelle viel billiger bereitstellt, und Anthropic hätte Claude Code für Microsoft-Mitarbeiter direkt mit Azure integrieren können.
      Das wäre für ein paar Cents pro Dollar möglich gewesen, und Microsoft hätte Kosten über wenig ausgelastete GPUs senken oder überschüssige GPU-Rechenleistung puffern können. Serverless ist schließlich auch irgendwo aus ungenutzten Ressourcen von Webservern entstanden.
      Wenn schon das alte Rechenzentrum von xAI gereicht hätte, um Anthropic wieder zu überholen, dann hätte Microsoft wohl auch auf GPUs der vorherigen Generation, die nur Serverraum belegen und untätig herumstehen, selbst hosten können.
  • Wenn man den Artikel liest, hatte Microsoft Entwicklern sowohl Claude Code als auch Copilot angeboten.
    Gewollt war, dass sie beides ausprobieren und Rückmeldung geben, was besser ist.
    Die Entwickler haben mit den Füßen abgestimmt und Copilot nicht genutzt.
    Vermutlich hatte Microsoft genau das Gegenteil gehofft.

    • Möglicherweise geht Microsoft in Copilot zu modellunabhängigerer Technik über. Das Unternehmen hat kürzlich Cowork auf Basis von Opus 4.7 hinzugefügt und setzt jetzt Microsoft 365 Copilot ein; das war besser als die Alternativen, die wir verwenden konnten.
      Anders als „echtes“ Claude Code oder Cowork kann es nur auf Dateien in bestimmten OneDrive-Ordnern innerhalb persönlicher SharePoint-Container zugreifen und passt dadurch viel besser zu Compliance-Anforderungen wie NIS2.
      Technisch nutzen wir Copilot und bezahlen über Microsoft-Lizenzen, intern läuft aber Opus 4.7. Schon davor waren die meisten Custom Agents in m365 copilot eines der GPT-Modelle.
      Oder sie wollen Entwickler wirklich dazu bringen, Copilot-Modelle zu verwenden.
    • Einige Monate lang konnten Mitarbeiter zwischen Claude Code und Copilot wählen, jetzt aber nicht mehr.
      Bei der Wahl des Basismodells gibt es weiterhin keine Beschränkungen. Opus 4.6 ist mit großem Abstand am beliebtesten, und es fließen weiterhin hohe Kosten zu Anthropic.
    • Die meisten von uns hatten gar nicht die Möglichkeit, Claude Code auf Firmenkosten zu nutzen; das konnten nur einige interne Organisationen. Ich selbst hatte allerdings kurz privat ein Claude-Code-Abo.
      Ehrlich gesagt halte ich GitHub Copilot CLI und die neue GitHub-Copilot-App für ziemlich gut. Ich nutze meist Opus 4.7, gelegentlich GPT-5.5. Die VSCode-Erweiterung ist okay, aber CLI oder App sind für mich die bessere Erfahrung.
    • Ich würde gern verstehen, was an Claude Code in VSCode gegenüber Copilot so attraktiv ist. Es fühlt sich an, als würde ich etwas Offensichtliches übersehen.
    • Microsoft hatte historisch die Tendenz, seine eigenen Produkte intern zu verwenden.
      Natürlich sollte man auch andere Optionen am Markt kennen und das richtige Werkzeug für die Aufgabe einsetzen, aber wenn es ein direkt konkurrierendes Produkt gibt, möchte die Organisation vermutlich lieber, dass ihre Telemetrie und ihre Vorschläge in die Verbesserung der eigenen Software fließen statt in die der Konkurrenz.
  • Es gibt definitiv Möglichkeiten, Claude Code tokenbewusst zu nutzen.
    Ich habe unbeaufsichtigte agentische Softwarefabrik-Workflows ausprobiert; dabei wurden massiv Tokens verbrannt, aber es kam kaum etwas dabei heraus.
    Ein Prozess, in dem Menschen zwischendurch eingreifen und beaufsichtigen, war dagegen viel produktiver und verbrauchte deutlich weniger. Vielleicht ist das genau der Grund, warum alle den agentischen Ansatz so stark pushen.

    • Ja. Claude erledigt die Arbeit gut, aber die Ergebnisse ordentlich zu prüfen kostet ziemlich viel Zeit. Irgendwann wurde es schwer, das Wochenkontingent überhaupt aufzubrauchen.
      Deshalb habe ich das Problem mit einer agentischen parallelen Code-Review-Fähigkeit gelöst. Im Grunde ist das ein Generator für unendliche TODO-Listen. Jetzt nutze ich sicher 100 % dessen aus, wofür ich bezahle.
      Es verbrennt Unmengen an Tokens, findet dabei aber auch viele Probleme. Ich wiederhole diesen Review-/Fix-Prozess jede Woche, und die Menge, auf die Menschen beim Review achten müssen, ist stark gesunken.
    • Der aktuelle Gedanke in der Branche ist, dass Automatisierungsagenten diesen Markt von einigen zehn Milliarden Dollar auf Billionen-Dollar-Größe bringen. Das ist korrekt gesehen. Agenten stimulieren die Nachfrage nach dem, was diese Firmen gebaut haben.
    • Ich finde es gut, dass viele Menschen dadurch Ressourcenmanagement direkt erleben. Verglichen damit, Menschen zu managen und dabei zu lernen, ist das ziemlich günstig, und von diesem Kompetenztransfer profitieren alle.
    • Auf Unternehmensebene dürften die Kosten zu unvorhersehbar sein, und man wird ungern einen Dienst einsetzen wollen, dessen Kostenkontrolle Schulungen für Mitarbeiter erfordert.
    • Ein Kollege hat über AWS Bedrock mit Sonnet 4.6 ziemlich normale agentische Coding-Arbeit gemacht, um die Daten in der EU zu halten, und an nur einem Tag 100 Euro ausgegeben.
      Zum Vergleich: Ein Mistral-Abo kostet etwa 20 Euro im Monat und war bei Tests für ähnliche Aufgaben okay; pro Tag wurden dabei ungefähr 10 % des Monatslimits verbraucht. Auch der Max-5x-Plan von Anthropic bietet deutlich mehr frei nutzbare Tokens.
      Das Optimum scheint zu sein, bei irgendeinem Anbieter ein Monatsabo zu nutzen. Das ist erheblich subventioniert. Wenn ich aber pro Token zahlen müsste, würde ich inzwischen zuerst prüfen, welche Aufgaben sich mit DeepSeek erledigen lassen. Leider passt das vermutlich nicht auf das oben genannte Szenario, aber für ein Startup könnte es anders sein.
      Andererseits wirkt es etwas heuchlerisch. Das Ganze war Teil eines Versuchs, Projektmanagern, Designern und anderen Mitarbeitern erstmals das Experimentieren mit Coding zu ermöglichen, und zugleich heißt es, Claude Code sei in den letzten sechs Monaten intern bei Microsoft enorm beliebt gewesen.
      Wenn man sagt, die Zukunft sei komplett AI, aber dann die Rechnung bekommt, ändert sich offenbar die Haltung.
  • In Teilen des Artikels steht, Microsoft wolle die meisten Claude-Code-Lizenzen entfernen und viele Entwickler zu Copilot CLI verschieben.
    Claude Code sei zwar beliebt gewesen, habe aber auch Microsofts neues GitHub Copilot CLI-Coding-Tool geschwächt, also die Kommandozeilenversion von GitHub Copilot, die außerhalb von Entwickler-Apps wie Visual Studio Code läuft.
    Hier wird das aber vor allem so interpretiert, als sei das Problem, dass Claude zu schnell Tokens verbrennt, und Microsoft solle stattdessen SomeOtherLLM© verwenden.
    Ich weiß nicht, ob das hier Hacker News ist oder ein Marketing-Schlachtfeld.

    • Kein öffentliches Forum ist von Natur aus gegen die Ausbreitung von Guerilla-Marketing immun. [1]
      [1] Internet Rule #48
    • „Microsoft hat beschlossen, sein eigenes Hundefutter zu essen“ wäre wohl der treffendere Titel.
    • Das Forum namens Hacker News wurde gehackt und heimlich zu Marketing Wars refaktoriert. Wobei das Hauptziel ohnehin darin besteht, einen Raum zu schaffen, der Marketingprojekte und Startups anzieht.
    • Es scheint viele Leute zu geben, die den Artikel nicht gelesen haben. Ich selbst auch nicht, bis ich diesen Kommentar gesehen habe. Ehrlich gesagt wirkt der Artikel wie Clickbait.
  • Unsere Organisation wird dazu gezwungen, Copilot in einer Government-Cloud zu nutzen, und es ist so nutzlos, dass wir meist einfach direkt selbst coden.
    Die Syntax ist schlampig, Zeilen werden zufällig zusammengezogen, die Reihenfolge wird umgedreht, oder mitten in eine Zeile fällt plötzlich eine Ausgabe mit ein paar Tokens, und merkwürdigerweise fehlt ständig die letzte Zeile jedes Codeblocks. Intern scheint man irgendeine GPT-Version von vor mehreren Releases zu verwenden.
    Trotzdem zeigt es gut, dass die Modelle der letzten etwa zwölf Monate die Schwelle von „interessant“ zu echter Produktivitätssteigerung überschritten haben.
    Von Copilot, Claude und Gemini bevorzuge ich in der Praxis immer noch Gemini. Ich schreibe nicht nur Code, sondern auch viel wissenschaftliche Texte, und Gemini ist das einzige Modell, bei dem ich darauf vertrauen kann, dass es „einfach stimmt“. Dieses Vertrauen überträgt sich auch auf die Codeausgabe.

    • Falls du das in VS Code integrierte Copilot meinst: Meine jüngste Erfahrung ist überhaupt nicht so. Seit gpt 5.4 herauskam, ist es im Agent-Modus sehr kompetent geworden.
  • Fühlt sich insgesamt ziemlich zutreffend an.
    Am selben Tag wurden intern für Demos Claude Code und DeepSeek eingeführt; Claude hatte sein Monatskontingent nach etwas mehr als einer Woche verbraucht, und mehr als die Hälfte dieses Budgets war an einem einzigen Tag weg. Bei DeepSeek schaffen es die Leute überhaupt nicht, in einem Monat so viel Geld auszugeben.
    Deshalb wirkt Claude wie ein teures Spielzeug und DeepSeek wie eine Schaufel. Entwickler haben nicht das Gefühl, beim Nutzen an einer kostbaren Ressource zu nagen.
    Der Fähigkeitsunterschied zwischen Claude und DS-pro scheint auch gar nicht so groß zu sein. Der Abstand zwischen DS-pro und flash fühlt sich an wie zwischen sonnet/opus und haiku, aber auch flash ist noch sehr leistungsfähig.

    • Ich habe Claude heute aus Frust gekündigt.
      Zwei Wochen lang wurde Claude immer schlechter, und heute war die letzte Grenze erreicht.
      Ob es eine Handy-App gibt oder nicht, ist mir egal. Das Modell, nachdem es glaubt, einen nach langer Abodauer „eingefangen“ zu haben, ist völliger Müll.
      Wenn sich das Modell in die entgegengesetzte Richtung dessen bewegt, was es gesagt hat, und gegen Anweisungen handelt, kann man auf dem Handy nicht coden. Wenn ich Code verschlechtern will, kann ich auch einfach irgendeinen Müll committen. Dafür brauche ich keine mobile App.
    • Hast du auch Gemini in Betracht gezogen?
  • Das erinnert mich daran, wie Steve Ballmer seinen Kindern verboten hat, einen iPod zu benutzen, und sie stattdessen einen Zune verwenden mussten.

  • Ich bin ziemlich zufrieden mit dem 10-Dollar-Monatsplan von CoPilot. Der Zugriff auf Claude-Modelle ist weiterhin enthalten, und die Tokens sind zwar begrenzt, aber es gibt keine Zeitlimits wie beim 20-Dollar-Plan von Claude, sodass mein Arbeitsfluss nicht unterbrochen wird.
    Für normale Aufgaben nutze ich eines der kostenlosen Modelle, und bei besonders kniffligen Problemen schalte ich Claude dazu. Für mich funktioniert das sehr gut.

    • Ich weiß nicht genau, ob du den alten oder den neuen Plan meinst.
      GitHub Copilot war wahrscheinlich das beste Preis-Leistungs-Verhältnis und meiner Meinung nach lange unterbewertet. Ich war seit dem ersten Tag Jahresabonnent.
      Die vor ein paar Tagen angekündigten Änderungen haben dieses Wertversprechen komplett zerstört, und ich bin unsicher, ob ich weiter abonniert bleibe.
    • Copilot war für einige Wochen das beste Angebot unter den AI-Tools.
      Das neue Preismodell hat das geändert. Trotzdem werde ich es wohl für die Autovervollständigung behalten, für die Fälle, in denen ich gelegentlich den Editor öffne.
    • Man kann auch zusätzliche Premium-Tokens kaufen, um mehr Claude zu nutzen, und ich habe das tatsächlich einmal getan. In den meisten Fällen reichen aber die im Plan enthaltenen Tokens aus.
  • Wenn Entwickler mit der Begründung entlassen werden, AI sei besser, schneller und billiger oder mache Menschen 10x produktiver, frage ich mich, was passiert, wenn die nötigen Werkzeuge am Ende teurer werden.
    Ist aus Investorensicht die Belastung durch Personalkosten schlimmer oder ein ausufernder Kostenposten?

    • Menschen entlassen und vor Investoren gut aussehen. Dann wieder Menschen einstellen und mit „Wachstum“ erneut vor Investoren gut aussehen.
      Wenn der Aktienmarkt rational wäre, würde das nicht funktionieren, aber der Aktienmarkt ist niemals rational.
    • Dass Entwickler entlassen werden, weil AI besser, schneller und billiger sei, halte ich für Unsinn. Softwareingenieure werden wegen der Überrekrutierung nach Corona entlassen.
      Hinweise auf Verdrängung von Arbeit sieht man nur bei Junior-Einstellungen. Nicht, weil Leute entlassen werden, sondern weil Einstiegsjobs verdrängt werden.
    • Ob es teurer ist, ist schwer zu berechnen. Wenn es schneller ist und dadurch das Time-to-Market verbessert, können höhere Kosten gerechtfertigt sein.
      Außerdem arbeiten große Sprachmodelle 24/7/365 und lassen sich bei Bedarf hoch- oder herunterskalieren. Besonders in Europa ist es schneller, große Sprachmodelle abzuschalten, als Mitarbeiter zu entlassen.
      Deshalb kann AI selbst dann geschäftlich sinnvoll sein, wenn sie teurer ist als Entwickler – jedenfalls aus Sicht von Total Cost of Ownership und Return on Investment.
    • Wenn alles wie beabsichtigt läuft, werden die Modelle am Ende wohl viel teurer sein als die Mitarbeiter, die sie ersetzt haben.
      Solche Technologien enden meist bestenfalls in einem Oligopol, und dann haben die Player breite Burggräben. Außerdem werden die von diesen Modellen erzeugten Artefakte so angepasst sein, dass andere Modelle oder Menschen realistisch nicht mehr damit arbeiten können, und danach kann man die Preise erhöhen und alle bis an die Profitabilitätsgrenze treiben.
    • Es ist schwer vorstellbar, dass es schlechter aussieht als Gehälter, bevor AI drastisch teurer wird. Wenn ein Entwickler mit Claude Code effektiv zwei Entwickler ersetzen kann, lohnt es sich bei heutigen API-Preisen bereits, selbst wenn man sehr hohen Verbrauch annimmt.
      Rechnet man Zusatzleistungen, bezahlten Urlaub und andere Gemeinkosten der Beschäftigung hinzu, landet man bei Kosten von ungefähr 1,5 Entwicklern. Man bekommt also zwei Entwickler zum Preis von anderthalb.
      Skaliert man das in einem Großunternehmen auf 500 Entwickler, spart man bei den Gehältern viel Geld.
      Verglichen mit dem Halten von Personal oder dem Einstellen von Ersatz müsste AI wohl über 15.000 Dollar pro Entwickler und Monat kosten, bevor sie teurer wird. Damit Menschen den Break-even erreichen oder billiger werden, müsste man auf etwa 4 Milliarden Tokens pro Monat kommen.