Kimi K2.7 Code ist offiziell in GitHub Copilot verfügbar

(github.blog)

1 Punkte von GN⁺ 22 시간 전 | 1 Kommentare | Auf WhatsApp teilen

Kimi K2.7 Code wird zu GitHub Copilot hinzugefügt und ist damit das erste Open-Weight-Modell, das im Modellauswahlmenü gewählt werden kann
GitHub hostet es auf Microsoft Azure und bietet damit mehr Modelloptionen und eine kostengünstigere Option für Coding-Workflows
Die Abrechnung erfolgt im nutzungsbasierten Abrechnungsmodell nach dem Listenpreis des Anbieters; die tatsächlichen Kosten sollten in der Dokumentation zu Copilot-Modell- und Anfragepreisen geprüft werden
Die Einführung erfolgt schrittweise zunächst für die Pläne Copilot Pro, Pro+ und Max; verfügbar ist das Modell im Modellauswahlmenü von Visual Studio Code
Bei Copilot Business und Enterprise ist es standardmäßig deaktiviert; vor der Nutzung in Organisationen müssen Administratoren die Richtlinie aktivieren sowie Sicherheits-, Compliance- und Data-Governance-Anforderungen prüfen

Das erste Open-Weight-Modell in Copilot

Kimi K2.7 Code ist ein Open-Weight-Modell, das offiziell in GitHub Copilot verfügbar ist
Es wurde als erstes Open-Weight-Modell hinzugefügt, das im Copilot-Modellauswahlmenü auswählbar ist
Es bietet mehr Modelloptionen und eine kostengünstigere Option für Coding-Workflows
GitHub hostet das Modell auf Microsoft Azure

Nutzungsbasierte Abrechnung

Kimi K2.7 Code wird in der nutzungsbasierten Abrechnung nach dem Listenpreis des Anbieters abgerechnet
Die genauen Abrechnungsgrundlagen finden sich in der Dokumentation GitHub Copilot’s pricing for models and requests

Verfügbarkeit innerhalb von Copilot

Kimi K2.7 Code wird zunächst schrittweise für die Pläne Copilot Pro, Pro+ und Max ausgerollt
Nutzer können dieses Modell im Modellauswahlmenü von Visual Studio Code auswählen
Die Einführung erfolgt stufenweise, und GitHub überwacht weiterhin Qualität und Leistung des Modells
In den kommenden Wochen soll die Verfügbarkeit auf Copilot Business, Enterprise und weitere Nutzungsoberflächen ausgeweitet werden

Unterstützte Clients und Oberflächen

Das Modellauswahlmenü ist in folgenden Umgebungen verfügbar
- Visual Studio Code 1.127.0 oder höher
- Visual Studio 17.14.6 oder höher
- Copilot CLI
- GitHub Copilot cloud agent
- GitHub Copilot App
- github.com
- GitHub Mobile für iOS und Android
- JetBrains 1.9.1-251 oder höher
- Xcode
- Eclipse

Administratoreinstellungen für Business und Enterprise

Kimi K2.7 Code ist in Copilot Business und Copilot Enterprise standardmäßig deaktiviert
Damit Organisationsmitglieder das Modell auswählen können, muss ein Planadministrator in den Copilot-Einstellungen die Richtlinie für Kimi K2.7 Code aktivieren
Bleibt die Richtlinie deaktiviert, kann das Modell in der betreffenden Organisation nicht genutzt werden
Administratoren wird empfohlen, vor der Aktivierung zu prüfen, ob das Open-Weight-Modell den eigenen Anforderungen an Sicherheit, Compliance und Data Governance entspricht

Dokumentation und Feedback-Kanäle

Alle in GitHub Copilot verfügbaren Modelle sind in der Dokumentation zu supported models aufgeführt
Hinweise zur Auswahl des passenden Modells für eine Aufgabe finden sich in der Dokumentation choosing the right AI model for your task
Feedback kann in der Diskussion in der GitHub Community geteilt werden

1 Kommentare

GN⁺ 22 시간 전

Meinungen auf Hacker News

An Cloud-basierten AI-Produkten habe ich inzwischen fast das Interesse verloren.
Zu oft sind coole Funktionen und Workflows, auf die ich einmal gehofft hatte, aus verschiedenen Gründen kaum noch nutzbar geworden: Preiserhöhungen, gefühlt schlechtere Performance, Einstellung von Diensten, Ersatz durch anderes usw. Das macht müde.
Ich habe mir ein kleines Setup zusammengestellt und bin im Grunde bei Qwen3.6 gelandet; die Funktionen, die ich brauche, füge ich nach und nach selbst hinzu. Ob es mit Claude konkurrieren kann, weiß ich nicht, und ich habe auch aufgehört, das zu prüfen. Es liefert mir jetzt schon genug Wert und wird immer besser. Und selbst wenn das Gras anderswo grüner sein mag: Mir gefällt, dass es sich nicht direkt unter meinen Füßen verändert.
- Freut mich, dass das der Top-Kommentar ist. Ich nutze es ebenfalls komplett lokal.
  Für Leute, die nicht genug Speicher haben, um große Modelle der 32-GB-Klasse laufen zu lassen, möchte ich noch anmerken, dass geprunte Modelle ebenfalls ziemlich gute Leistung bringen. Auf einer kleineren Maschine lohnt sich ein Blick auf das geprunte unsloth-Q4-Quantisierungsmodell von GLM 4.7 Flash, das in 14 GB passt: https://huggingface.co/unsloth/GLM-4.7-Flash-REAP-23B-A3B-GG...
  Normalerweise verwende ich für solche Zwecke LM Studio, aber unsloth hat auch eine eigene Studio-App, die für solche quantisierten Modelle besser passen könnte. Ich habe GLM 4.7 Flash einige Monate als Hauptmodell genutzt; es war sehr hartnäckig und sehr schnell und wirkt auf begrenzter Hardware wie eine gute Wahl.
- Qwen3.6-35B-A3B-UD-Q4_K_M läuft sogar auf meiner alten 1060 mit etwa 11 Tokens pro Sekunde. Es ist wirklich absurd, wie weit wir gekommen sind.
- Die AI-Fortschritte fühlen sich derzeit meist so an, als würden vor allem Unterschiede beim Fine-Tuning vorangetrieben.
  Zum Beispiel ist der neue Claude auf agentisches Coding abgestimmt, was für nicht-agentisches Coding sogar schädlich sein kann; Fable 5 sieht gut aus, hat aber hohe Inferenzkosten, und nach dem Release sind Performance-Absenkungen oder neue Limits und Preismodelle sehr wahrscheinlich. Gemini 3.5 hat großzügigere Limits, ist aber etwas schwächer.
  Neue Versionen erscheinen und die Versionsnummern steigen, aber ich frage mich, ob jede Änderung wirklich ein Fortschritt ist oder ob wir bei einer ähnlichen Leistung pro Dollar wie Anfang des Jahres nur anderes Tuning sehen. Die eigentlichen Veränderungen sieht man eher bei kleineren Modellen wie Qwen oder Gemma 4 31B, und gerade mit Blick auf die Mehrsprachigkeit wirkt das ziemlich magisch.
  Gerade beim Posten habe ich den Vorher-nachher-Vergleich von Fable gesehen: Bei der wieder eingeführten Version wird offenbar weiter am Modell herumgeschraubt, und die BridgeBench-Leistung ist katastrophal eingebrochen: https://x.com/Hesamation/status/2072692225100612032
- Klingt ziemlich verlockend. Welche Ausstattung bräuchte ein Mac mini, um so etwas zu machen?
- Ich nutze Qwen3.6 ebenfalls zufrieden auf einem alten MBP.
  Es ist nicht so schnell wie Claude, das ich in der Firma nutze, läuft lokal aber völlig ausreichend, und ich muss mir keine Sorgen machen, dass plötzlich Credits oder Funktionen wegfallen.
Ich mag die Copilot CLI sehr. Sie fühlt sich logischer und reibungsärmer an als Claude Code.
Mir gefällt auch, dass man mehrere Modelle nach Belieben verwenden kann. Zum Beispiel: „Mit Opus 4.6 einen Plan erstellen, diesen Plan mit GPT 5.4 prüfen und Feedback einholen und anschließend mit Sonnet 4.6 implementieren.“
Wegen der Copilot-Preisänderung im Juni mussten jedoch sowohl ich persönlich als auch unsere ganze Abteilung zu Claude Code wechseln. Im April und Mai lagen wir nur etwas über den enthaltenen Credits und zahlten ein paar Dollar extra; ab Juni war das Monatsbudget alle zwei bis drei Tage aufgebraucht.
Aus Kundensicht ist das eine völlig verrückte Preiserhöhung, und ich weiß nicht, was Microsoft sich dabei gedacht hat. Selbst wenn das der Preis ist, der für Nachhaltigkeit nötig ist, hätten sie warten müssen, bis die Konkurrenz zuerst die Preise ändert. Es würde mich nicht wundern, wenn Copilot im letzten Monat über 50 % seiner Kunden verloren hätte.
Wenn sich am Ende alle großen Anbieter auf dieses Preisniveau einpendeln, muss der Staat vielleicht öffentlich zugängliche AI ähnlich wie Fernsehen betreiben: freie öffentliche Modelle nutzen, ein paar Rechenzentren über Steuern finanzieren, regionale Beschränkungen und striktes Throttling einführen, sie Studierenden und Bürgern aber frei zugänglich machen.
Wenn in ein paar Jahren alle AI-Preise auf Copilot-Niveau liegen, können nur noch Unicorns sie nutzen, und alle anderen haben keine Chance mehr, mit Unternehmen zu konkurrieren, die AI einsetzen.
- Du sagst, sie hätten warten sollen, bis die Konkurrenz die Preise ändert, aber genau das haben sie im Grunde schon getan.
  Es ist buchstäblich eine Weitergabe der Kosten: https://platform.claude.com/docs/en/about-claude/pricing
  Anthropic bietet zwar auch Abos an, aber Unternehmen wollen die in der Regel nicht nutzen. Denn Inhalte, die über diesen Weg eingereicht werden, können fürs Training verwendet oder Teil des Modells werden.
  Wenn man das ohne ausdrückliche Erlaubnis des Arbeitgebers nutzt, kann das einen Vertragsbruch darstellen, und im Fall einer Klage könnten die Folgen ernst sein.
- Die Preiserhöhung war wahnsinnig. Auch mein Hauptarbeitgeber wechselt gerade von Copilot zu Claude-Code-Abos.
  Gleichzeitig testen wir AWS Bedrock und Deepinfra für Modelle mit offenen Gewichten, für den Fall, dass Claude Code irgendwann an die tatsächlichen Token-Kosten angepasst wird und kein gutes Geschäft mehr ist.
- Zum ersten Mal seit Monaten habe ich bei der Arbeit meine Claude-Credits aufgebraucht und bin wieder zu Copilot zurückgegangen, und es war überraschend okay.
  Claude ist bei den Tools deutlich weiter, aber Modellzuweisung pro Sub-Agent und Zugriff auf alle Modelle sind zusammen eine bessere Funktion als alles, was Claude derzeit bietet.
  Da die einzige Grenze für die Menge an AI, die ich in der Firma pro Monat verbrauchen kann, Dollar sind, ist das, was Kosten senkt, für mich das beste Modell und die beste Laufzeitumgebung. Copilot war auch besser darin, Sub-Agents automatisch passendere Modelle zuzuweisen, während Claude oft teurere Modelle verwendet.
- Ernsthaft gefragt: Kannst du genauer erklären, in welchen Punkten sich die Copilot CLI für dich besser anfühlt als Claude Code? Wenn ich die Wahl habe, nutze ich OpenCode, aber mich interessiert, was dich an der Copilot CLI stärker überzeugt.
- Modelle automatisch auswählen zu lassen, ist nicht mehr nachhaltig.
  Es gibt allerdings effiziente Modelle, die einen Plan ausführen können, den ein besseres Modell erstellt hat. Wenn man bedenkt, dass Microsofts automatische Modellauswahl in der früher verlustträchtigen Preisstruktur für Aufgaben wie das Auflösen von Dependency-Konflikten modernste Reasoning-Modelle ausgewählt hat, ist das schon etwas peinlich.
Bei der Entwicklung von VS 2026 habe ich GitHub Copilot verwendet und zwischen ChatGPT und Claude gewechselt; das war, bevor ich Claude Code und die Codex-App kannte
Copilot war für meine Zwecke in Ordnung, und 10 Dollar im Monat reichten aus
Doch als letzten Monat das neue Preismodell eingeführt wurde, waren die 10 Dollar nach ein paar Tagen aufgebraucht. Ich verstehe, dass die alte Preisgestaltung nicht nachhaltig war, aber dadurch bin ich zu Claude Code und Codex gewechselt und habe nie zurückgeschaut. Auch die Tokens von Claude Code und Codex sind stark subventioniert, aber solange es gut läuft, kann man es genießen
Zwischen der Nutzung von Claude über Copilot und der direkten Nutzung von Claude in Claude Code spürt man einen Unterschied. Was Microsoft im Hintergrund macht, weiß ich nicht
- Die Ausführungsumgebung ist sehr wichtig. Die verfügbaren Tools und der System-Prompt unterscheiden sich je nach Ausführungsumgebung
  Anthropic liegt sowohl bei der Ausführungsumgebung als auch beim Modell etwas vorn und hat damit das Beste aus beiden Welten
  Auf Microsoft-Seite ist es wahrscheinlich dasselbe Modell, aber die umgebenden Tools und Prompts sind schlechter, wodurch offenbar auch die Ergebnisse schlechter werden
- Beim Weggang von Copilot innerhalb von Zed war es ähnlich
  Derzeit nutze ich die reasonix-Ausführungsumgebung für DeepSeek, und bei Cache-Treffern sind die Kosten praktisch fast null. Das gilt selbst bei unsubventionierten US-Anbietern wie Digital Ocean oder Cloudflare
- Ich bin ebenfalls zu Cursor gewechselt. Wenn man ihm sagt, wie msbuild aufzurufen ist, editiert es auch ohne natives Visual-Studio-Plugin selbstständig
  Zielsprache ist C++, keine Probleme
- In den letzten Wochen sind die Kosten für GitHub Copilot stark gestiegen; was früher 100 Dollar kostete, braucht jetzt 300 Dollar
  Mir gefällt die Nutzung von Claude in VS Code über Copilot, und ich habe das Gefühl, dass es besseren Code liefert, weil ich die Codequalität besser kontrollieren kann. Es ist deutlich transparenter als Claude Code, Open Source, und die IDE-Oberfläche bietet mehr Kontrolle über Kontext und Artefakte
  Der Kostenanstieg liegt nicht nur an der reinen Preiserhöhung, sondern auch daran, dass der Opus-Modell-Agent mehr Tokens verbraucht. Deshalb bin ich zu Claude Code gewechselt und nutze Opus 4.6 weiterhin zufrieden. Fable und 4.7 verzetteln sich bei größeren Aufgaben häufiger, treffen Annahmen und liefern dadurch unaufgeräumte Ergebnisse
- Mit Claude 4.8 Opus war das Copilot-Kontingent vermutlich schon nach 2 bis 3 Prompts aufgebraucht. Ich hatte erwartet, dass es nicht toll sein würde, aber nicht in diesem Ausmaß. Solange es hielt, war es gut
Endlich gibt es eine Alternative eines großen Anbieters, die Unternehmen nutzen können
Viele wollten eine Möglichkeit, chinesische Modelle bei einem vertrauenswürdigen Provider auszuführen, und GitHub liefert das nun
Wenn man den Benchmarks glaubt, liegt die Leistung auf dem Niveau von Sonnet 4.6. Ob es zu GitHub-Preisen brauchbar ist, muss sich zeigen
- Da Microsoft auf tokenbasierte Abrechnung umgestellt hat, muss es günstigere Optionen anbieten
  GPT-5.4 kostete für Jahresabonnenten den Faktor 1, jetzt sind es 6x. Premium-Requests sind nach wenigen Prompts verbraucht. GitHub Copilot für 10 Dollar im Monat war früher das beste Preis-Leistungs-Verhältnis, weil man Modelle aus US-AI-Labs günstig nutzen konnte
- Benchmarks traue ich nicht. Ich habe Kimi K2.7 mehrfach ausprobiert und war enttäuscht
  Für Dinge, die Claude in einem Durchgang erledigt, drehte es sich im Kreis. Mein Nutzungspfad war allerdings Ollama Cloud, und ich weiß nicht, ob dort das echte Modell oder eine quantisierte Version bereitgestellt wird; die Quantisierung könnte die Leistung verschlechtert haben
  Die gute Nachricht ist dennoch, dass ein Präzedenzfall geschaffen wurde. Wenn Microsoft jetzt Kimi K2.7 anbietet, kann es bald auch GLM 5.2 anbieten, und das ist tatsächlich ein sehr konkurrenzfähiges Modell
- Vielleicht werde ich wieder als Werbetrommler bezeichnet, aber es ist relevant, also ist mir das egal
  Synthetic betreibt eigene Modelle zu vernünftigen Preisen, darunter GLM5.2 und Kimi K2.7-Code
  Empfehlungslink: https://synthetic.new/?referral=kwjqga9QYoUgpZV
Eingabe: 0,95 Dollar, Cache-Treffer: 0,19 Dollar, Ausgabe: 4,00 Dollar
Das ist derselbe Preis, den Moonshot verlangt, und liegt ungefähr im Bereich von GPT 5.4 mini, also keine schlechte Option
Als Beispiel für einen dummen Prompt, der Tokens für Kontext verschwendet: „Spiele allein Tic-Tac-Toe auf einem 5x5-Brett. Wer 5 in eine Reihe setzt, gewinnt.“
Bei Kimi K2.7 kostet das 0,006 Dollar, und man kann die gesamte rohe Reasoning-Spur sehen. GPT-5.4 mini kostet 0,016 Dollar und wird zusammengefasst
Falls es interessiert: Beide spielen unglaublich dämlich
Kimi:

A B C D E
1 . . . . .
2 . . . . .
3 X X X X X
4 . O O O O
5 . . . . .

GPT 5.4 mini:

1: X X X X X
2: O O . . .
3: . . O . .
4: . . . O .
5: . . . . O
- Zur Info für alle, die es interessiert: GPT 5.5 spielt denselben Müll wie 5.4 mini und kostet dabei das Vierfache
  Fable erzeugt für 40 Cent ein plausibles Spiel
  
  X X O O O
  O O X X X
  X X X O O
  X O O X O
  X O X X O
- Gute Idee. Ich habe Haiku in Claude Chat auf iOS dasselbe machen lassen; es hat ein interaktives React-Spiel gebaut, die Regeln implementiert und mich dann selbst spielen lassen
  Cleverer Zug bei 1 Dollar Eingabe und 5 Dollar Ausgabe, Anthropic!
- Große Sprachmodelle sind bei Spielen schwach, aber einen Reinforcement-Learning-Agenten zu schreiben, der das Spiel selbst lernt, ist durchaus möglich
- Wenn mir extrem langweilig wird, lasse ich vielleicht zwei Modelle gegeneinander Schach spielen
  Irgendwo gibt es bestimmt schon einen Schach-Benchmark oder ein Turnier für große Sprachmodelle
Es ist merkwürdig, dass AWS Bedrock solche Modelle nur sehr dürftig unterstützt.
Es gibt nur Kimi 2.5, qwen 3 coder, DeepSeek V3.2, GLM 5 und Ähnliches, aber keine aktuellen Modelle.
- Ich frage mich, ob das eine Produktentscheidung ist oder an GPU-Beschränkungen liegt.
  Inf2-Instanzen benötigen AWS Neuron [1]. Vielleicht dauert es einfach zu lange, die Modelle so zu portieren, dass sie auf dieser Hardware laufen.
  [1] https://aws.amazon.com/ai/machine-learning/neuron/
Die Ausführungskosten sind definitiv deutlich niedriger als bei anderen Modellen, und nachdem ich es gestern etwa eine Stunde lang ausprobiert habe, wirkten die Ergebnisse vielversprechend.
In einer Reddit-Diskussion habe ich gesehen, dass das Team glm5.2 evaluiert, daher hoffe ich, dass noch mehr dazukommt.
Ist GitHub Copilot am besten als Enterprise-Plattform positioniert?
Es unterstützt Claude, GPT und Gemini und nun sogar Modelle mit offenen Gewichten. Große Organisationen zahlen ohnehin ungefähr API-Preise, also sind die Kosten ähnlich, egal wo sie es nutzen.
Es gibt eine ziemlich gute Agent-CLI und ein SDK, und inzwischen auch eine Desktop-App. Es gibt auch gehostete Agenten, und man kann „Agentic Workflows“ in CI ausführen.
Hat der Ruf so stark gelitten, dass nur noch Alternativen Aufmerksamkeit bekommen? Oder werden Nutzer außerhalb von Unternehmen wegen der Nutzungskosten verdrängt, sodass kein kostenloses Marketing entsteht?
- Der Rug Pull, bei dem die Preise ohne Vorankündigung geändert wurden, kam im Enterprise-Bereich nicht gut an.
- Wir haben die Pläne für alle gekündigt und intern liteLLM ausgerollt.
  Copilot haben wir behalten, weil die Tokens absurd billig waren; nach der neuen Preisgestaltung ist es nun ein Dienst, der preislich ähnlich wie openrouter ist, aber deutlich weniger Modelle bietet.
- Früher war das so, aber nicht mehr, seit sie beschlossen haben, den Dienst selbst zu zerstören.
- Aus irgendeinem Grund fühlt sich Copilot dümmer an als Claude in VS Code oder Codex in VS Code.
  Ich kenne den genauen Grund nicht, aber es fühlte sich nicht gut an.
- Die Ausführungsumgebung von Copilot ist im Vergleich zu anderen CLI-basierten Ausführungsumgebungen, die ich teste, miserabel. Erstaunlich schlecht.
  Bei uns im Unternehmen kommt dieses Thema häufig auf, weil die für Vendor-Management zuständigen Leute das Ökosystem großer Sprachmodelle nicht verstehen und deshalb glauben, Claude über Copilot und Claude über Claude Code seien dasselbe.
  Jedes Mal, wenn ich gebeten werde, den Unterschied zu erklären, zeigt ein einfacher Direktvergleich in 3 bis 4 von 5 Fällen eine dramatisch schlechtere Leistung.
Wenn ihr ein kleines Team seid und Copilot ausprobieren wollt, möchte ich euch warnen: Ihr könnt Stunden damit verlieren, euch anhand veralteter Dokumentation durch die Abrechnungseinstellungen zu kämpfen.
Kurz gesagt haben wir am Ende eine E-Mail von GitHub erhalten, in der stand: „Copilot Business ist für Teams verfügbar, die 10 oder mehr Lizenzen kaufen.“ Das ist nicht dokumentiert, aber andere erleben dasselbe: https://github.com/orgs/community/discussions/199346
Wir bleiben vorerst bei Cursor und nutzen Kimi hauptsächlich unter dem Namen „Composer“.
Endlich ist es da. Ist das Copilots erstes LLM mit offenen Gewichten? Damit ist die Tür wohl geöffnet.

Kimi K2.7 Code ist offiziell in GitHub Copilot verfügbar

Das erste Open-Weight-Modell in Copilot

Nutzungsbasierte Abrechnung

Verfügbarkeit innerhalb von Copilot

Unterstützte Clients und Oberflächen

Administratoreinstellungen für Business und Enterprise

Dokumentation und Feedback-Kanäle

Verwandte Beiträge

1 Kommentare

Meinungen auf Hacker News