5 Punkte von GN⁺ 2025-08-09 | 1 Kommentare | Auf WhatsApp teilen
  • Google stellt basierend auf Gemini CLI die Gemini CLI GitHub Actions vor, die die Zusammenarbeit in GitHub-Repositories für Teams unterstützt.
    • Gemini CLI ist ein Open Source AI-Agent, mit dem sich KI-Funktionen im Terminal nutzen lassen.
    • Die GitHub-Actions-Version ist für Teamarbeit konzipiert und kann als KI-Kollege betrachtet werden, der im Repository mitarbeitet.
  • Dieses Tool ist kostenlos und Open Source und derzeit als Beta-Version weltweit verfügbar.
  • Es reagiert automatisch und asynchron auf Ereignisse in einem GitHub-Repository (z. B. neue Issues, Erstellung von PRs), versteht den gesamten Projektkontext und verarbeitet Aufgaben automatisch.
  • Es bietet drei leistungsstarke Open Source-Workflows:
    • Intelligente Issue-Triage (Intelligent issue triage)
      • Neue Issues werden analysiert und automatisch mit Labels und Prioritäten versehen.
      • Unterstützt Entwickler dabei, sich auf wichtige Aufgaben zu konzentrieren.
    • Beschleunigte PR-Reviews (Accelerated pull request reviews)
      • Stellt sofortiges und tiefgehendes Feedback zu Codeänderungen bereit.
      • Überprüft Codequalität, Stil und Korrektheit, um die Belastung der Reviewer zu verringern.
    • On-Demand-Kollaboration (On-demand collaboration)
      • Aufgaben können in Issues oder PRs delegiert werden, indem @gemini-cli erwähnt wird.
      • Beispiele: "Tests für diesen Fehler schreiben", "Obigen Vorschlag umsetzen", "Brainstorming für alternative Lösungen", "Klare Fehlerbehebung definieren"
  • Betrachten Sie diese Workflows als Launchpad; da es Open Source ist, können eigene Workflows individuell konfiguriert werden.
  • Durch die Automatisierung repetitiver und zeitaufwändiger Aufgaben steigert es die Entwicklungsproduktivität, erhöht die Effizienz von Code-Reviews und Issue-Verwaltung und beschleunigt die Zusammenarbeit im Team.

1 Kommentare

 
GN⁺ 2025-08-09
Hacker News Kommentar
  • Es ist eine verwirrende Situation, in der nicht klar ist, ob es sich um ein CLI, eine GitHub Action oder eine GitHub Application handelt. Jules wurde ursprünglich als „Coding Agent“ bezeichnet, aber jetzt ist unklar, ob ein anderes Tool diese Rolle übernimmt oder ob es sich um ein Selbstkannibalisierungsszenario von Google handelt. Ich habe das Gefühl, dass das Unternehmen jetzt eine klarere Vision und Führung braucht. Obwohl ich 13 Jahre lang Android-Code geschrieben habe, mit Google zusammengearbeitet habe, in der Google-Entwickler-Community und auf Konferenzen eine führende Rolle hatte, mit vielen GDEs kommuniziere und die Gemini API in meinen Produkten nutze, verstehe ich trotzdem nicht, was hier eigentlich passiert. Für normale Kunden ist es meiner Meinung nach kaum nachvollziehbar. Es gibt sogar zwei SDKs für die Gemini-API-Anbindung, und die Dokumentation ist völlig verstreut, sodass man für bestimmte Funktionen googeln und sogar Code-Repos durchforsten muss. Die meisten gewünschten Funktionen sind entweder rate-limitiert oder nur für private Tester geöffnet. Es gibt sogar drei Coding Agents. Obwohl Zugriff auf Google-Konto und Telefon besteht, ist die Gemini-App nutzlos. Sogar Basisaufgaben wie das Hinzufügen eines Service Accounts in Google Cloud sind wegen der verwirrenden UX schwerfällig. Das Einzige, was wirklich sinnvoll ist, ist AI Studio: Man kann dort verschiedene Modelle testen und die API-Key-Erstellung für die Gemini API ist deutlich besser in der Bedienbarkeit (DX). Ehrlich gesagt ist es schwer, diese Veröffentlichung zu feiern; es ist eher ein „mittelmäßiges“ neues Produkt.

    • Zwischen Forschungs- und Softwarekultur braucht es meiner Meinung nach eine klare Trennung. In einer Forschungssituation kann es sogar positiv sein, wenn mehrere Teams gleichzeitig unterschiedliche Experimente laufen lassen, aber bei Software und Produkten, die Kunden direkt nutzen, ist ein anderer Ansatz nötig.

    • Google richtet mehrere „Inkubations“-Räume ein, und wenn manche davon erfolgreich sind, scheinen sie sich nicht sauber mit bestehenden Produkten zu verbinden, was zu Verwirrung bei Nutzern führt. NotebookLLM ist ein Beispiel dafür. Ich finde jedoch persönlich, dass solche vielfältigen Experimente insgesamt besser sind. Das NotebookLLM-Team wirkte ebenfalls wie eine sehr autonome Arbeitsweise.

    • Dass die Gemini-App trotz Zugriff auf Google-Konto- und Telefondaten nichts kann, ist besonders absurd. Wenn man die App öffnet, begrüßt sie mit „Hello, Vasco“, aber fragt man „Wie heißt mein Name?“, antwortet sie: „Kann keine Nutzerinformationen abrufen.“ Ich weiß, warum das so ist, aber die Situation ist extrem komisch.

    • Jules läuft in einer VM asynchron auf einem separaten Checkout des Codes. Gemini CLI läuft lokal synchron mit dem Nutzer (Ausnahme: YOLO-Modus). Die beiden Ansätze sind völlig unterschiedlich.

    • Bei Google Workspace ist es eine andere Lage. Das Aktivieren von Gemini CLI für eine ganze Organisation ist ein Mix aus Freude und Frust. Ausführliche Erklärung

  • Ich verstehe, dass Google das Bedürfnis spürt, im Coding-AI-Wettbewerb mitzuhalten, aber es gibt viele merkwürdige Punkte.

    • Gemini kann nicht einmal einfache Kalenderbuchungen wie Meeting-Termine ausführen.

    • In Google Docs geht keine kollaborative Bearbeitung, nur Einfügen.

    • Für Docs oder Sheets gibt es keinen zentralen Management Point (MCP).

    • Hilfe bei Sheet-Formeln fällt sogar schlechter aus als bei Google Search. Das ist schade, denn trotz vieler klarer Alleinstellungsbereiche kann sich Gemini hier als KI kaum behaupten. Als ich in Gmail mal exakt nach dem String „remarkable“ gesucht habe, wurden stattdessen auch verwandte Begriffe wie „amazing“ als Treffer angezeigt. Die Suche in den Produkten ist gerade rückläufig – ein frustrierender Zustand.

    • In der Praxis habe ich es auf dem Android-Telefon ausprobiert: Bei einer Versand-E-Mail antippe ich lange den Power-Button und Gemini wird als Popup angezeigt. Lese ich den Screen-Context ein und sage „Trag das in meinen Kalender ein“, wird der Termin hinzugefügt. Es funktioniert nicht perfekt (etwa bei mehrtägigen Zeiträumen oder seltsamem Ort kann es aussetzen), aber es wird besser. Als Google-Workspace-Kunde werden auch Gemini-Web-App, Kalender und Drive unterstützt. Auch Dokumentenzusammenfassungen und viele weitere Aufgaben sind möglich. Die Aussage „Kann keine Termine erstellen“ ist also nicht korrekt.

    • Ich glaube, Google gibt Gemini nicht in Dokumente frei, ähnlich wie Apple KI nicht auf dem iPhone freigibt. Die Zuverlässigkeit ist noch nicht so hoch, dass man das auf 99,99 % der Zielgruppe ausrollen kann. Für Tech-Early-Adopter funktioniert es gut, ich würde das System aber nicht an den Massenmarkt empfehlen.

    • Es gibt viele kleine, nützliche Nutzungsszenarien, aber das Marketing ist schwach. Beispiel: Als ich ein Foto meiner Einkaufsliste gemacht und Gemini gebeten habe, es in ein kopierbares Format umzuwandeln, hat es nur den Inhalt in Google Keep übernommen, ohne Kategorien zu bilden. Wenn das Team etwas mehr priorisiert und es ausarbeitet, wäre es deutlich nützlicher. OpenAI bewirbt auf TikTok viele Funktionen, während viele Menschen unter 30 mit Gemini kaum etwas anfangen können oder die Existenz gar nicht kennen. In der Praxis empfinde ich Gemini als praktischer als ChatGPT, aber das Marketing ist vollkommen unzureichend.

    • Die Google-Docs-Unterstützung ist so eingeschränkt, dass kaum Erwartungen aufgebaut werden.

    • Mein Eindruck ist, dass die Suche nur auf Embeddings basiert und deshalb nicht sauber funktioniert. In Wirklichkeit braucht man eine hybride Suche mit Embeddings, Text-Matching und Qualitätsvektoren, und so etwas schnell und skalierbar zu bauen ist nicht trivial. Falls jemand ein solches System kennt, wäre ich für einen Hinweis dankbar.

  • Um zu verstehen, was der eigentliche Service ist, braucht man extrem viel Zeit. Schaltet man Marketingsprache, umständliche Erklärungen und unnötige Fachbegriffe aus, zeigt sich das wahre Produkt. Meiner Einschätzung nach ist das eine GitHub Action. Es ist ein Wrapper: Man legt es in eine GitHub-Workflow-YAML-Datei, lässt die Gemini CLI laufen und übergibt Prompt-, Repo-Kontext- sowie Eventdaten wie Issue- oder PR-Diffs, damit Antworten oder Aktionen ausgeführt werden. Über Token oder App kann man Repository-Daten über die GitHub API lesen/schreiben (Label hinzufügen, Kommentare, Code-Vorschläge usw.). Standardaufruf auf den Gemini-LLM-HTTPS-API-Endpunkt.

    • Boris Cherny und Catherine Wu haben in einer Latent-Space-Podcast-Folge über semantisches Linting in AI-basierten CLIs gesprochen. Relevantes YouTube-Interview Ich habe KI-basierte CLIs in CI/CD noch nicht aktiv eingesetzt, aber für semantisches Pass/Fail klingt das sehr spannend.

    • In der Doku steht „Verwende das in der Chat-Interface“, aber ich frage mich, was genau mit Chat Interface gemeint ist.

  • Gemini-Pläne (z. B. Google One, Workspace usw.) gelten nur für webbasierte Produkte; API-basierte Angebote wie Gemini CLI sind ausgeschlossen. Wenn man mit einem einzigen Entwickler-Monatsabo CLI, GitHub Action, Gemini Chat und Jules nutzen könnte, wäre das wirklich ein echter Durchbruch. Ich sehne ein Single-Max-Modell wie bei Claude her.

    • Das Abonnementmodell selbst zu verstehen, braucht fast eine KI.

    • Der kostenlose Gemini-Tier ist extrem verwirrend. Mit mehreren Agents getestet, trifft das Rate-Limit schon nach 5–6 Requests zu. Die Web-App wirkt dagegen fast unbegrenzt. Obwohl gesagt wird, es gäbe ein „großzügiges“ kostenloses Kontingent, ist man nach kurzer Zeit schon wieder am Ende. Für reine Tests ist es okay, im echten Produktivbetrieb aber zu wenig.

  • In den Werbebildern steht unter anderem: Mit dem Tag „@mini-cli“ können verschiedene Aufgaben von Bug-Triage bis Fix erledigt werden. Das wirkt ziemlich absurd.

    • Ich finde es erstaunlich, dass diese Formulierung noch nicht korrigiert wurde. Vielleicht ist es sogar eine erstaunlich ehrliche Aussage.
  • Ich frage mich, ob es wirklich richtig ist, das als „gemini cli“ zu bezeichnen. Wenn man es überwiegend über GitHub nutzt, ist es dann noch ein CLI? Wahrscheinlich wäre eine intuitivere Benennung wie „gemini github action“ oder „run gemini“ wie bei Claude Code sinnvoller.

    • Wahrscheinlich wurde es vom Gemini-CLI-Team entwickelt, um die eigenen Beiträge zu betonen oder aus internem Druck, damit es nicht wie ein zu generisches Produkt wirkt.

    • Tatsächlich wird in der GitHub-Action-VM gemini-cli installiert und Kommentare aus Issues/PRs werden als Prompt an gemini-cli übergeben.

    • Über die Benennung habe ich mir auch Gedanken gemacht. Das ist für mich wirklich ein enttäuschender Punkt.

    • Es ist eher eine Art Add-on zu einer vollständig lokal genutzten Gemini-CLI.

  • Letztes Jahr habe ich tatsächlich eine Bounty-Plattform für GitHub PRs entwickelt. Durch Incentives kamen viele PRs niedriger Qualität, und weil KI-Generierung von Entwürfen leicht möglich ist, wurde das Konzept praktisch bedeutungslos. Die Kernfrage im Open-Source-Management hat sich dadurch zu „limitierten Ressourcen von Reviewern/Maintern“ verschoben. Deshalb experimentiere ich mit einem Framework, das aus den Hauptagenten automatisch PRs generiert, um den Review- und Freigabe-/Änderungsprozess zu optimieren. Hier dokumentiere ich die entsprechende Case Study

  • Es werden ziemlich viele Einstellungen benötigt, und im Vergleich zu GitHub Copilot Agent, das bereits für alle Nutzer leicht einsetzbar ist, ist die Überzeugungskraft deutlich schwächer. Der Gemini Assistant müsste klar besser sein als bestehende Tools, damit überhaupt nennenswerte Nutzung entsteht.

    • Unter den bestehenden Assistenten frage ich mich, was mit „deutlich besser“ gemeint ist – ob da Claude gemeint ist. Bei Gemini wäre ein ähnliches Niveau ausreichend, wenn das Abo nur klar und fair wäre.
  • Dass das wirklich kostenlos ist, erscheint mir sogar fragwürdig. Als Gegenleistung könnte die Bereitstellung von Trainingsdaten gemeint sein, und da es keine Opt-out-Option gibt, sollte man es in persönlichen/unternehmensinternen Repos vorsichtig nutzen.

  • Mit dem Copilot Agent erziele ich sehr gute Ergebnisse. Manchmal schließe ich PRs und bereite Issues auf oder arbeite lokal mit Cursor, aber der Arbeitsstart ist so viel schneller, dass die Zufriedenheit insgesamt hoch ist.