GitHub Copilot Coding Agent als Public Preview veröffentlicht

(github.blog)

11 Punkte von GN⁺ 2025-05-20 | 2 Kommentare | Auf WhatsApp teilen

GitHub hat den Copilot Coding Agent als Preview für Copilot Pro+ und Enterprise-Nutzer veröffentlicht
Entwickler können wiederkehrende Aufgaben und Arbeiten mit aufgelaufener technischer Schuld an Copilot delegieren, um sich stärker auf kreativere und wichtigere Aufgaben zu konzentrieren
Wenn man ein Issue der KI zuweist, führt sie Code-Änderungen, Testläufe und sogar die Erstellung eines PR automatisch aus
Sobald Copilot die Arbeit abgeschlossen hat, fordert es zur Review auf; Entwickler können zusätzliche Änderungen per Kommentar anfordern oder direkt im Branch weiterarbeiten
Die Aufgaben laufen in einer auf GitHub Actions basierenden Cloud-Entwicklungsumgebung, in der auch das Bestehen von Tests und Lintern eigenständig geprüft wird
Nutzer können Copilot im PR per Kommentar Änderungen anfordern oder den Stand in einen lokalen Branch holen und gemeinsam weiterarbeiten
Besonders geeignet ist es für Aufgaben mit niedriger bis mittlerer Komplexität wie Feature-Erweiterungen, Bugfixes und Refactorings, vor allem in gut getesteten Codebases

GitHub Copilot coding agent in public preview

Mit dem Code-Agenten technische Schuld reduzieren und sich auf kreative Arbeit konzentrieren

GitHub hat den Copilot Coding Agent als Public Preview veröffentlicht, sodass sich wiederkehrende oder einfache Issues an Copilot delegieren lassen
Entwickler können Copilot wie einem normalen Entwickler ein Issue zuweisen; unterstützt wird dies auf der GitHub-Website, in der Mobile-App und über die CLI
Copilot analysiert das Repository in seiner eigenen Cloud-Entwicklungsumgebung, wendet Änderungen an, führt Tests und Lint-Prüfungen aus und erstellt anschließend einen PR
Nach Abschluss bittet es den Nutzer um ein Review; Feedback kann über Kommentare im PR gegeben werden, oder man arbeitet lokal direkt auf dem Branch weiter

Für welche Aufgaben ist es geeignet?

Copilot zeigt Stärken bei Feature-Erweiterungen, Bugfixes, dem Ausbau von Tests, Refactorings und Verbesserungen der Dokumentation sowie allgemein bei Aufgaben mit niedriger bis mittlerer Komplexität
In gut getesteten Codebases arbeitet es besonders effektiv, und es können auch mehrere Issues gleichzeitig zugewiesen werden

Nutzungsbedingungen und Preise

Die Funktion ist in den Tarifen Copilot Pro+ oder Copilot Enterprise verfügbar
Bei Enterprise muss ein Administrator die Richtlinie „Copilot Coding Agent“ vorab aktivieren, damit die Funktion genutzt werden kann
Die Nutzung des Agenten verbraucht GitHub Actions-Zeit und Copilot Premium Requests
- Insbesondere wird ab dem 4. Juni 2025 pro Modellanfrage ein Premium Request berechnet

Plattformunterstützung und Einstieg

Die Funktion wird derzeit schrittweise für Nutzer von GitHub Mobile (iOS/Android) und der GitHub CLI ausgerollt
In der Dokumentation zum Copilot Coding Agent finden sich Hinweise zum Einstieg und nützliche Tipps
Feedback oder Fragen können in der Community-Diskussion geteilt werden

2 Kommentare

wedding 2025-05-20

Ich nutze es in VSCode Insiders, und es wird nach und nach besser, deshalb ist es sehr praktisch.
In letzter Zeit unterstützt es sogar prädiktives Codieren.

GN⁺ 2025-05-20

Hacker-News-Kommentare

Ich habe den Eindruck, dass Copilot bei niedrig bis mittel komplexen Aufgaben wie dem Hinzufügen von Features, dem Beheben von Bugs, dem Erweitern von Tests, Refactoring und der Verbesserung von Dokumentation in gut getesteten Codebasen effektiv ist. Der wichtige Punkt für Menschen ist aber, bei der Nutzung von AI wachsam zu bleiben. Wenn Tests nur von AI erstellt werden, besteht die Sorge, dass sie in der Praxis nicht wirklich korrekt funktionieren. Ich würde gern konkrete Zahlen dazu hören, wie erfolgreich das intern bei Microsoft eingesetzt wird. Microsoft war zwar dafür bekannt, die eigenen Produkte selbst produktiv zu nutzen, aber ich habe das Gefühl, dass es sehr schwer ist, massives Marketing von echter Nützlichkeit zu unterscheiden
- Bei GitHub und Microsoft wird der Copilot Coding Agent intern seit fast drei Monaten tatsächlich eingesetzt. Aus diesen Erfahrungen sind viel Feedback und viele Bugfixes eingeflossen, sodass der Agent heute veröffentlicht werden konnte. Bisher haben etwa 400 GitHub-Mitarbeiter den Agenten in mehr als 300 Repositories verwendet, und fast 1.000 von Copilot beigetragene PRs wurden gemergt. In dem Repository, in dem der Agent entwickelt wird, ist der Copilot Agent der fünftaktivste Contributor. Wir bauen also den Copilot Coding Agent mit dem Copilot Coding Agent. (Ich bin der Product Lead für den Copilot Coding Agent bei GitHub)
- Innerhalb von Microsoft wirkt es auf mich eher wie eine von oben verordnete Zwangseinführung durch das Management. Ein Freund aus dem Azure-Team erzählte mir, dass jemand fast in einen PIP geraten wäre, weil er sich geweigert hatte, einen internen AI-Coding-Assistenten zu installieren. Viele Manager haben die Zahl der „AI nutzenden Entwickler“ als OKR, und viele Entwickler installieren das Tool nur, verwenden es aber kaum. Vor allem die schwache Unterstützung für C# und PowerShell schränkt den praktischen Nutzen stark ein
- Microsoft hat tatsächlich bereits Zahlen dazu veröffentlicht, welcher Anteil des Codes von AI erzeugt wird. Es heißt, 30 % des Codes würden von AI geschrieben
- Dass Microsoft für Dogfooding berühmt war, stimmte vielleicht noch vor 15 Jahren, heute aber überhaupt nicht mehr
Ich möchte warnen, dass ein sehr großes Problem darin besteht, dass Code aus privaten Repositories beim Einsatz von Copilot fürs Training verwendet werden könnte. Es gibt zwar Pro- und Pro+-Tarife, aber in den FAQ steht nur, dass Daten aus Business- oder Enterprise-Tarifen nicht fürs Training verwendet werden. Für mich bedeutet das, dass Daten aus kostenpflichtigen Einzeltarifen weiterhin fürs Modelltraining genutzt werden
- Früher mag das so gewesen sein, inzwischen ist es anders. In der offiziellen GitHub-Dokumentation kann man die Richtlinien für persönliche Pläne nachlesen
- Wenn du unter Windows entwickelst, wird dein Bildschirm ohnehin schon alle paar Sekunden automatisch erfasst, und per OCR wird jeder Text auf deinem Bildschirm analysiert. Wenn du das nicht wusstest, ist das eine überraschende Nachricht
Ich habe mit Gemini 2.5 pro und cline in einem Greenfield-Projekt mit Vibe Coding experimentiert. Das war ziemlich beeindruckend und hat meine Produktivität deutlich mehr gesteigert als klassische LLM-Chat-Interfaces. Wenn die Architekturvorgaben aber nicht stark genug sind, neigt das LLM dazu, falsche Abstraktionen und technische Schulden aufzubauen, etwa durch das Zerstören von Strukturen. Selbstreflexion in Bezug auf Codequalität oder bessere Ansätze ist eher schwach ausgeprägt. Ein Vorteil ist, dass es sich sofort verbessert, wenn ich das Problem klar benenne und entsprechend prompe. Erstaunlich fand ich auch, dass an einem einzigen Abend 15 $ an LLM-Tokenkosten angefallen sind. Normalerweise liege ich bei etwa 20 $ pro Monat, und so etwas an nur einem Tag hatte ich noch nie
- 15 $ an LLM-Token pro Tag auszugeben, ist kein Bug, sondern ein Feature. Ich glaube, wir werden künftig auch bei LLMs das Phänomen der „AWS-Rechnung aus der Hölle“ sehen
- Ich würde auch empfehlen, ein Tool wie Aider zu verwenden und den Kontext mit /add, /drop und /clear aktiv zu verwalten
- Wenn man Cline kostensensibel einsetzen will, hat man das Gefühl, den Kontext manuell verwalten zu müssen. Ich verwende stattdessen Windsurf, ebenfalls noch mit Gemini 2.5 pro. Das Kontextmanagement ist dort deutlich einfacher
- In Greenfield-Projekten ist der Einsatz von AI eher mühsam. Es gibt zu viele Optionen, sodass die AI zwischen verschiedenen Ansätzen hin und her schwankt. In Brownfield-Projekten kann man Referenzdateien bereitstellen, damit Muster natürlich gelernt werden, und dadurch viel leichter gute Ergebnisse erzielen
- Mich interessiert, wie man architektonische Verunreinigung durch LLMs verhindern kann. Ich erwarte als nächsten Schritt einen (AI-basierten) Linter, der prüft, ob die Implementierung den Designvorgaben entspricht
Ich finde, Geschwindigkeitsoptimierung sollte vor neuen Features kommen. Das Autocomplete von Copilot ist schnell, aber wenn das Bearbeiten einer 100-Zeilen-Datei manchmal mehrere Minuten dauert, ist das eine unproduktive Erfahrung. Bei einer Trefferquote nahe 100 % könnte ich das noch verstehen, aber dieses langsame Hin und Her ist zäh. Da ist es schneller, in einem neuen Tab Claude oder ChatGPT zu fragen und Code hin und her zu kopieren. Ich habe mein Copilot-Abo gekündigt und werde für Autocomplete und einfache Aufgaben künftig auf lokale Modelle umsteigen
- Meine Erfahrung ist genau umgekehrt. Das Bearbeiten selbst von Dateien mit mehreren hundert Zeilen ist in wenigen Sekunden erledigt. Früher war es wohl langsam, aber in letzter Zeit scheint der Flaschenhals verschwunden zu sein. Selbst im WLAN einer Bibliothek läuft Copilot ziemlich flüssig
- Wenn es mehrere Minuten dauert, halte ich das für ein ernstes Problem. Die meisten Modelle liefern in wenigen Sekunden ein Ergebnis
Ich nutze in VS Code abwechselnd ChatGPT und Copilot. Dadurch ist es viel leichter geworden, die Syntax von Objective-C zu verstehen, und obwohl die Unterstützung für Bibliotheken schwach ist, habe ich Drittanbieter-Bibliotheken vielleicht auch einfach nicht genug ausprobiert. Syntax- und Ablaufprobleme erkenne ich sofort, korrigiere sie kurz und kann den Code danach fast direkt verwenden. Für 10 $ im Monat fühlt sich die Zukunft damit ziemlich positiv an. Ich habe sehr viele iOS-Apps zu aktualisieren, und es sind alles Produktivitäts-Apps, die ich selbst nutze und verkaufe. Daher ist der Nutzen doppelt so groß
Ich habe Copilot ziemlich intensiv genutzt. Es ist beeindruckend, aber auch beängstigend. Das zentrale Problem ist, dass es wahllos beliebige Abhängigkeiten aus kleinen Repositories empfiehlt, und viele davon sind für ernsthafte Projekte ungeeignet. Das heißt, man muss als Nutzer vorsichtig sein
- Ich habe ähnliche Muster bei verschiedenen AIs gesehen. Sie vertrauen den aus dem Web gelesenen Daten zu stark. Wenn man zum Beispiel um eine Einschätzung zu einem Phishing-Betrug bittet, fasst die AI oft nur den Inhalt zusammen, statt eine verlässliche Analyse zu liefern. Ich habe auch erlebt, dass ein völlig unbekanntes chinesisches Repository mit zwei Sternen als Industriestandard empfohlen wurde, nur weil das im README stand. Nicht ganz dasselbe Thema, aber mir wurde auch schon das Krypto-Protokoll „Strobe“ empfohlen, inklusive Verweis auf strobe.cool, obwohl sich diese Website selbst mit dem Hervorrufen von Halluzinationen beschäftigt
- Danke, dass du das ansprichst. In Tests habe ich dieses Verhalten bisher nicht erlebt, deshalb würde ich dem gern genauer nachgehen. Wenn du das per E-Mail teilen könntest, wäre das hilfreich (mein HN-Nickname bei github.com). Ich arbeite im Produktteam des Copilot Coding Agent
- PR-Ausführungen laufen in privaten Repositories in einem Kontext, der eigentlich verlässlicher sein sollte, deshalb ist dieses Problem mit solchen Abhängigkeitsvorschlägen in so einer Situation durchaus besorgniserregend
Die Aussage „Copilot ist stark bei niedrig bis mittel komplexen Aufgaben“ fand ich zunächst positiv. Aber die Einschränkung auf „gut getestete Codebasen“ lässt meine Erwartungen sofort sinken
- Wie in anderen Kommentaren erwähnt, ist der Coding Agent hervorragend darin, die Testabdeckung zu verbessern. Und einen Schritt weiter gedacht: Agentische Coding-Tools profitieren noch deutlich mehr, wenn bereits eine gute Testabdeckung vorhanden ist. Tests engen den Agenten ein und geben ihm die Möglichkeit, seine Arbeit wiederholt selbst zu validieren. Für solche Tools ist das nicht zwingend erforderlich, aber vorhanden führt es zu besseren Ergebnissen (ich arbeite im Team des Copilot Coding Agent)
- Wenn man Copilot alle Tests schreiben lässt, entsteht sehr schnell eine gut getestete Codebasis
- Meiner Erfahrung nach funktioniert es auch ohne Tests recht gut, besonders in Greenfield-Projekten. Updates und Patches gelingen aber eindeutig besser, wenn bereits Tests vorhanden sind
Auf den Werbespruch „Ertrinkst du in technischer Schuld?“ reagierte jemand scherzhaft damit, man solle einfach aufgeben und untergehen. Mit GitHub Copilot Coding Agent werde es noch mehr technische Schulden geben, neue technische Schulden, für die niemand Verantwortung übernehme, und bald würden auch die Kollegen in derselben Lage landen
Ein Freund von mir arbeitet bei GitHub an dem betreffenden Projekt, und ich habe seit Tagen von nichts anderem mehr gehört. Er hat mir regelrecht eingebläut, dass ich mir am Montag unbedingt die Keynote ansehen müsse. Nach dem dritten Authentifizierungs-Timeout habe ich den Stream aufgegeben, aber wenn ich gewusst hätte, dass es darum geht, hätte ich es wohl noch einmal versucht
- Mich würde interessieren, um welche Keynote es konkret ging. Bisher finde ich dazu selbst per Suche kaum etwas
- Ein Tipp: Einfach direkt zu YouTube gehen und den Microsoft-Anmeldeprozess überspringen
- Bei Aussagen von aktiven Entwicklern höre ich immer vorsichtig hin, weil intern oft starkes Marketing im Spiel ist. Ich hoffe, dass es Konkurrenzprodukte wie Cursor klar übertrifft, und werde mir die Demo auf jeden Fall anschauen
In der Frühphase der LLMs habe ich selbst einen Agenten mit GitHub Actions und einem Issues-Workflow gebaut und genutzt. Der Funktionsumfang war begrenzt, aber wenn ich einen Bug zugewiesen habe, lief automatisch ein Ablauf an, der Architektur- und Bearbeitungsaufgaben übernahm, Änderungen prüfte und am Ende einen PR verschickte. Jetzt freue ich mich darauf, etwas Ähnliches als offizielles Tool nutzen zu können (Beispiel meiner Arbeit: chota)