Kimi K2.7 Code ist offiziell in GitHub Copilot verfügbar
(github.blog)- Kimi K2.7 Code wird zu GitHub Copilot hinzugefügt und ist damit das erste Open-Weight-Modell, das im Modellauswahlmenü gewählt werden kann
- GitHub hostet es auf Microsoft Azure und bietet damit mehr Modelloptionen und eine kostengünstigere Option für Coding-Workflows
- Die Abrechnung erfolgt im nutzungsbasierten Abrechnungsmodell nach dem Listenpreis des Anbieters; die tatsächlichen Kosten sollten in der Dokumentation zu Copilot-Modell- und Anfragepreisen geprüft werden
- Die Einführung erfolgt schrittweise zunächst für die Pläne Copilot Pro, Pro+ und Max; verfügbar ist das Modell im Modellauswahlmenü von Visual Studio Code
- Bei Copilot Business und Enterprise ist es standardmäßig deaktiviert; vor der Nutzung in Organisationen müssen Administratoren die Richtlinie aktivieren sowie Sicherheits-, Compliance- und Data-Governance-Anforderungen prüfen
Das erste Open-Weight-Modell in Copilot
- Kimi K2.7 Code ist ein Open-Weight-Modell, das offiziell in GitHub Copilot verfügbar ist
- Es wurde als erstes Open-Weight-Modell hinzugefügt, das im Copilot-Modellauswahlmenü auswählbar ist
- Es bietet mehr Modelloptionen und eine kostengünstigere Option für Coding-Workflows
- GitHub hostet das Modell auf Microsoft Azure
Nutzungsbasierte Abrechnung
- Kimi K2.7 Code wird in der nutzungsbasierten Abrechnung nach dem Listenpreis des Anbieters abgerechnet
- Die genauen Abrechnungsgrundlagen finden sich in der Dokumentation GitHub Copilot’s pricing for models and requests
Verfügbarkeit innerhalb von Copilot
- Kimi K2.7 Code wird zunächst schrittweise für die Pläne Copilot Pro, Pro+ und Max ausgerollt
- Nutzer können dieses Modell im Modellauswahlmenü von Visual Studio Code auswählen
- Die Einführung erfolgt stufenweise, und GitHub überwacht weiterhin Qualität und Leistung des Modells
- In den kommenden Wochen soll die Verfügbarkeit auf Copilot Business, Enterprise und weitere Nutzungsoberflächen ausgeweitet werden
Unterstützte Clients und Oberflächen
- Das Modellauswahlmenü ist in folgenden Umgebungen verfügbar
- Visual Studio Code 1.127.0 oder höher
- Visual Studio 17.14.6 oder höher
- Copilot CLI
- GitHub Copilot cloud agent
- GitHub Copilot App
- github.com
- GitHub Mobile für iOS und Android
- JetBrains 1.9.1-251 oder höher
- Xcode
- Eclipse
Administratoreinstellungen für Business und Enterprise
- Kimi K2.7 Code ist in Copilot Business und Copilot Enterprise standardmäßig deaktiviert
- Damit Organisationsmitglieder das Modell auswählen können, muss ein Planadministrator in den Copilot-Einstellungen die Richtlinie für Kimi K2.7 Code aktivieren
- Bleibt die Richtlinie deaktiviert, kann das Modell in der betreffenden Organisation nicht genutzt werden
- Administratoren wird empfohlen, vor der Aktivierung zu prüfen, ob das Open-Weight-Modell den eigenen Anforderungen an Sicherheit, Compliance und Data Governance entspricht
Dokumentation und Feedback-Kanäle
- Alle in GitHub Copilot verfügbaren Modelle sind in der Dokumentation zu supported models aufgeführt
- Hinweise zur Auswahl des passenden Modells für eine Aufgabe finden sich in der Dokumentation choosing the right AI model for your task
- Feedback kann in der Diskussion in der GitHub Community geteilt werden
1 Kommentare
Meinungen auf Hacker News
An Cloud-basierten AI-Produkten habe ich inzwischen fast das Interesse verloren.
Zu oft sind coole Funktionen und Workflows, auf die ich einmal gehofft hatte, aus verschiedenen Gründen kaum noch nutzbar geworden: Preiserhöhungen, gefühlt schlechtere Performance, Einstellung von Diensten, Ersatz durch anderes usw. Das macht müde.
Ich habe mir ein kleines Setup zusammengestellt und bin im Grunde bei Qwen3.6 gelandet; die Funktionen, die ich brauche, füge ich nach und nach selbst hinzu. Ob es mit Claude konkurrieren kann, weiß ich nicht, und ich habe auch aufgehört, das zu prüfen. Es liefert mir jetzt schon genug Wert und wird immer besser. Und selbst wenn das Gras anderswo grüner sein mag: Mir gefällt, dass es sich nicht direkt unter meinen Füßen verändert.
Für Leute, die nicht genug Speicher haben, um große Modelle der 32-GB-Klasse laufen zu lassen, möchte ich noch anmerken, dass geprunte Modelle ebenfalls ziemlich gute Leistung bringen. Auf einer kleineren Maschine lohnt sich ein Blick auf das geprunte unsloth-Q4-Quantisierungsmodell von GLM 4.7 Flash, das in 14 GB passt: https://huggingface.co/unsloth/GLM-4.7-Flash-REAP-23B-A3B-GG...
Normalerweise verwende ich für solche Zwecke LM Studio, aber unsloth hat auch eine eigene Studio-App, die für solche quantisierten Modelle besser passen könnte. Ich habe GLM 4.7 Flash einige Monate als Hauptmodell genutzt; es war sehr hartnäckig und sehr schnell und wirkt auf begrenzter Hardware wie eine gute Wahl.
Zum Beispiel ist der neue Claude auf agentisches Coding abgestimmt, was für nicht-agentisches Coding sogar schädlich sein kann; Fable 5 sieht gut aus, hat aber hohe Inferenzkosten, und nach dem Release sind Performance-Absenkungen oder neue Limits und Preismodelle sehr wahrscheinlich. Gemini 3.5 hat großzügigere Limits, ist aber etwas schwächer.
Neue Versionen erscheinen und die Versionsnummern steigen, aber ich frage mich, ob jede Änderung wirklich ein Fortschritt ist oder ob wir bei einer ähnlichen Leistung pro Dollar wie Anfang des Jahres nur anderes Tuning sehen. Die eigentlichen Veränderungen sieht man eher bei kleineren Modellen wie Qwen oder Gemma 4 31B, und gerade mit Blick auf die Mehrsprachigkeit wirkt das ziemlich magisch.
Gerade beim Posten habe ich den Vorher-nachher-Vergleich von Fable gesehen: Bei der wieder eingeführten Version wird offenbar weiter am Modell herumgeschraubt, und die BridgeBench-Leistung ist katastrophal eingebrochen: https://x.com/Hesamation/status/2072692225100612032
Es ist nicht so schnell wie Claude, das ich in der Firma nutze, läuft lokal aber völlig ausreichend, und ich muss mir keine Sorgen machen, dass plötzlich Credits oder Funktionen wegfallen.
Ich mag die Copilot CLI sehr. Sie fühlt sich logischer und reibungsärmer an als Claude Code.
Mir gefällt auch, dass man mehrere Modelle nach Belieben verwenden kann. Zum Beispiel: „Mit Opus 4.6 einen Plan erstellen, diesen Plan mit GPT 5.4 prüfen und Feedback einholen und anschließend mit Sonnet 4.6 implementieren.“
Wegen der Copilot-Preisänderung im Juni mussten jedoch sowohl ich persönlich als auch unsere ganze Abteilung zu Claude Code wechseln. Im April und Mai lagen wir nur etwas über den enthaltenen Credits und zahlten ein paar Dollar extra; ab Juni war das Monatsbudget alle zwei bis drei Tage aufgebraucht.
Aus Kundensicht ist das eine völlig verrückte Preiserhöhung, und ich weiß nicht, was Microsoft sich dabei gedacht hat. Selbst wenn das der Preis ist, der für Nachhaltigkeit nötig ist, hätten sie warten müssen, bis die Konkurrenz zuerst die Preise ändert. Es würde mich nicht wundern, wenn Copilot im letzten Monat über 50 % seiner Kunden verloren hätte.
Wenn sich am Ende alle großen Anbieter auf dieses Preisniveau einpendeln, muss der Staat vielleicht öffentlich zugängliche AI ähnlich wie Fernsehen betreiben: freie öffentliche Modelle nutzen, ein paar Rechenzentren über Steuern finanzieren, regionale Beschränkungen und striktes Throttling einführen, sie Studierenden und Bürgern aber frei zugänglich machen.
Wenn in ein paar Jahren alle AI-Preise auf Copilot-Niveau liegen, können nur noch Unicorns sie nutzen, und alle anderen haben keine Chance mehr, mit Unternehmen zu konkurrieren, die AI einsetzen.
Es ist buchstäblich eine Weitergabe der Kosten: https://platform.claude.com/docs/en/about-claude/pricing
Anthropic bietet zwar auch Abos an, aber Unternehmen wollen die in der Regel nicht nutzen. Denn Inhalte, die über diesen Weg eingereicht werden, können fürs Training verwendet oder Teil des Modells werden.
Wenn man das ohne ausdrückliche Erlaubnis des Arbeitgebers nutzt, kann das einen Vertragsbruch darstellen, und im Fall einer Klage könnten die Folgen ernst sein.
Gleichzeitig testen wir AWS Bedrock und Deepinfra für Modelle mit offenen Gewichten, für den Fall, dass Claude Code irgendwann an die tatsächlichen Token-Kosten angepasst wird und kein gutes Geschäft mehr ist.
Claude ist bei den Tools deutlich weiter, aber Modellzuweisung pro Sub-Agent und Zugriff auf alle Modelle sind zusammen eine bessere Funktion als alles, was Claude derzeit bietet.
Da die einzige Grenze für die Menge an AI, die ich in der Firma pro Monat verbrauchen kann, Dollar sind, ist das, was Kosten senkt, für mich das beste Modell und die beste Laufzeitumgebung. Copilot war auch besser darin, Sub-Agents automatisch passendere Modelle zuzuweisen, während Claude oft teurere Modelle verwendet.
Es gibt allerdings effiziente Modelle, die einen Plan ausführen können, den ein besseres Modell erstellt hat. Wenn man bedenkt, dass Microsofts automatische Modellauswahl in der früher verlustträchtigen Preisstruktur für Aufgaben wie das Auflösen von Dependency-Konflikten modernste Reasoning-Modelle ausgewählt hat, ist das schon etwas peinlich.
Bei der Entwicklung von VS 2026 habe ich GitHub Copilot verwendet und zwischen ChatGPT und Claude gewechselt; das war, bevor ich Claude Code und die Codex-App kannte
Copilot war für meine Zwecke in Ordnung, und 10 Dollar im Monat reichten aus
Doch als letzten Monat das neue Preismodell eingeführt wurde, waren die 10 Dollar nach ein paar Tagen aufgebraucht. Ich verstehe, dass die alte Preisgestaltung nicht nachhaltig war, aber dadurch bin ich zu Claude Code und Codex gewechselt und habe nie zurückgeschaut. Auch die Tokens von Claude Code und Codex sind stark subventioniert, aber solange es gut läuft, kann man es genießen
Zwischen der Nutzung von Claude über Copilot und der direkten Nutzung von Claude in Claude Code spürt man einen Unterschied. Was Microsoft im Hintergrund macht, weiß ich nicht
Anthropic liegt sowohl bei der Ausführungsumgebung als auch beim Modell etwas vorn und hat damit das Beste aus beiden Welten
Auf Microsoft-Seite ist es wahrscheinlich dasselbe Modell, aber die umgebenden Tools und Prompts sind schlechter, wodurch offenbar auch die Ergebnisse schlechter werden
Derzeit nutze ich die reasonix-Ausführungsumgebung für DeepSeek, und bei Cache-Treffern sind die Kosten praktisch fast null. Das gilt selbst bei unsubventionierten US-Anbietern wie Digital Ocean oder Cloudflare
Zielsprache ist C++, keine Probleme
Mir gefällt die Nutzung von Claude in VS Code über Copilot, und ich habe das Gefühl, dass es besseren Code liefert, weil ich die Codequalität besser kontrollieren kann. Es ist deutlich transparenter als Claude Code, Open Source, und die IDE-Oberfläche bietet mehr Kontrolle über Kontext und Artefakte
Der Kostenanstieg liegt nicht nur an der reinen Preiserhöhung, sondern auch daran, dass der Opus-Modell-Agent mehr Tokens verbraucht. Deshalb bin ich zu Claude Code gewechselt und nutze Opus 4.6 weiterhin zufrieden. Fable und 4.7 verzetteln sich bei größeren Aufgaben häufiger, treffen Annahmen und liefern dadurch unaufgeräumte Ergebnisse
Endlich gibt es eine Alternative eines großen Anbieters, die Unternehmen nutzen können
Viele wollten eine Möglichkeit, chinesische Modelle bei einem vertrauenswürdigen Provider auszuführen, und GitHub liefert das nun
Wenn man den Benchmarks glaubt, liegt die Leistung auf dem Niveau von Sonnet 4.6. Ob es zu GitHub-Preisen brauchbar ist, muss sich zeigen
GPT-5.4 kostete für Jahresabonnenten den Faktor 1, jetzt sind es 6x. Premium-Requests sind nach wenigen Prompts verbraucht. GitHub Copilot für 10 Dollar im Monat war früher das beste Preis-Leistungs-Verhältnis, weil man Modelle aus US-AI-Labs günstig nutzen konnte
Für Dinge, die Claude in einem Durchgang erledigt, drehte es sich im Kreis. Mein Nutzungspfad war allerdings Ollama Cloud, und ich weiß nicht, ob dort das echte Modell oder eine quantisierte Version bereitgestellt wird; die Quantisierung könnte die Leistung verschlechtert haben
Die gute Nachricht ist dennoch, dass ein Präzedenzfall geschaffen wurde. Wenn Microsoft jetzt Kimi K2.7 anbietet, kann es bald auch GLM 5.2 anbieten, und das ist tatsächlich ein sehr konkurrenzfähiges Modell
Synthetic betreibt eigene Modelle zu vernünftigen Preisen, darunter GLM5.2 und Kimi K2.7-Code
Empfehlungslink: https://synthetic.new/?referral=kwjqga9QYoUgpZV
Eingabe: 0,95 Dollar, Cache-Treffer: 0,19 Dollar, Ausgabe: 4,00 Dollar
Das ist derselbe Preis, den Moonshot verlangt, und liegt ungefähr im Bereich von GPT 5.4 mini, also keine schlechte Option
Als Beispiel für einen dummen Prompt, der Tokens für Kontext verschwendet: „Spiele allein Tic-Tac-Toe auf einem 5x5-Brett. Wer 5 in eine Reihe setzt, gewinnt.“
Bei Kimi K2.7 kostet das 0,006 Dollar, und man kann die gesamte rohe Reasoning-Spur sehen. GPT-5.4 mini kostet 0,016 Dollar und wird zusammengefasst
Falls es interessiert: Beide spielen unglaublich dämlich
Kimi:
A B C D E
1 . . . . .
2 . . . . .
3 X X X X X
4 . O O O O
5 . . . . .
GPT 5.4 mini:
1: X X X X X
2: O O . . .
3: . . O . .
4: . . . O .
5: . . . . O
Zur Info für alle, die es interessiert: GPT 5.5 spielt denselben Müll wie 5.4 mini und kostet dabei das Vierfache
Fable erzeugt für 40 Cent ein plausibles Spiel
X X O O O
O O X X X
X X X O O
X O O X O
X O X X O
Gute Idee. Ich habe Haiku in Claude Chat auf iOS dasselbe machen lassen; es hat ein interaktives React-Spiel gebaut, die Regeln implementiert und mich dann selbst spielen lassen
Cleverer Zug bei 1 Dollar Eingabe und 5 Dollar Ausgabe, Anthropic!
Große Sprachmodelle sind bei Spielen schwach, aber einen Reinforcement-Learning-Agenten zu schreiben, der das Spiel selbst lernt, ist durchaus möglich
Wenn mir extrem langweilig wird, lasse ich vielleicht zwei Modelle gegeneinander Schach spielen
Irgendwo gibt es bestimmt schon einen Schach-Benchmark oder ein Turnier für große Sprachmodelle
Es ist merkwürdig, dass AWS Bedrock solche Modelle nur sehr dürftig unterstützt.
Es gibt nur Kimi 2.5, qwen 3 coder, DeepSeek V3.2, GLM 5 und Ähnliches, aber keine aktuellen Modelle.
Inf2-Instanzen benötigen AWS Neuron [1]. Vielleicht dauert es einfach zu lange, die Modelle so zu portieren, dass sie auf dieser Hardware laufen.
[1] https://aws.amazon.com/ai/machine-learning/neuron/
Die Ausführungskosten sind definitiv deutlich niedriger als bei anderen Modellen, und nachdem ich es gestern etwa eine Stunde lang ausprobiert habe, wirkten die Ergebnisse vielversprechend.
In einer Reddit-Diskussion habe ich gesehen, dass das Team glm5.2 evaluiert, daher hoffe ich, dass noch mehr dazukommt.
Ist GitHub Copilot am besten als Enterprise-Plattform positioniert?
Es unterstützt Claude, GPT und Gemini und nun sogar Modelle mit offenen Gewichten. Große Organisationen zahlen ohnehin ungefähr API-Preise, also sind die Kosten ähnlich, egal wo sie es nutzen.
Es gibt eine ziemlich gute Agent-CLI und ein SDK, und inzwischen auch eine Desktop-App. Es gibt auch gehostete Agenten, und man kann „Agentic Workflows“ in CI ausführen.
Hat der Ruf so stark gelitten, dass nur noch Alternativen Aufmerksamkeit bekommen? Oder werden Nutzer außerhalb von Unternehmen wegen der Nutzungskosten verdrängt, sodass kein kostenloses Marketing entsteht?
Copilot haben wir behalten, weil die Tokens absurd billig waren; nach der neuen Preisgestaltung ist es nun ein Dienst, der preislich ähnlich wie openrouter ist, aber deutlich weniger Modelle bietet.
Ich kenne den genauen Grund nicht, aber es fühlte sich nicht gut an.
Bei uns im Unternehmen kommt dieses Thema häufig auf, weil die für Vendor-Management zuständigen Leute das Ökosystem großer Sprachmodelle nicht verstehen und deshalb glauben, Claude über Copilot und Claude über Claude Code seien dasselbe.
Jedes Mal, wenn ich gebeten werde, den Unterschied zu erklären, zeigt ein einfacher Direktvergleich in 3 bis 4 von 5 Fällen eine dramatisch schlechtere Leistung.
Wenn ihr ein kleines Team seid und Copilot ausprobieren wollt, möchte ich euch warnen: Ihr könnt Stunden damit verlieren, euch anhand veralteter Dokumentation durch die Abrechnungseinstellungen zu kämpfen.
Kurz gesagt haben wir am Ende eine E-Mail von GitHub erhalten, in der stand: „Copilot Business ist für Teams verfügbar, die 10 oder mehr Lizenzen kaufen.“ Das ist nicht dokumentiert, aber andere erleben dasselbe: https://github.com/orgs/community/discussions/199346
Wir bleiben vorerst bei Cursor und nutzen Kimi hauptsächlich unter dem Namen „Composer“.
Endlich ist es da. Ist das Copilots erstes LLM mit offenen Gewichten? Damit ist die Tür wohl geöffnet.