- Googles Gemini 3 hat sich über einen einfachen dialogorientierten Chatbot hinaus zu einer digitalen KI-Begleiterin entwickelt, die reale Aufgaben wie Code schreiben, im Web navigieren und Dateien bearbeiten ausführt
- Das gleichzeitig vorgestellte Antigravity ist ein agentenbasiertes Tool, das auf den Computer des Nutzers zugreift, eigenständig Programme schreibt und über ein Inbox-System Freigaben oder Hilfe anfordert
- Gemini 3 erledigt auf Anweisung des Nutzers sogar den Aufbau von Websites, Datenanalysen und das Schreiben von Fachartikeln und zeigt dabei Forschungsfähigkeiten auf PhD-Niveau
- Fehler gibt es weiterhin, sie bewegen sich aber eher auf dem Niveau von Unterschieden im Urteilsvermögen oder Verständnis; damit ähnelt das System stärker einem „KI-Teammitglied“, das mit Menschen zusammenarbeitet
- Der Text betont den „Übergang vom Zeitalter der Chatbots zum Zeitalter digitaler Begleiter“: Menschen korrigieren nicht mehr nur Fehler der KI, sondern werden zunehmend zu Managern, die die Arbeit der KI steuern
Das Erscheinen von Gemini 3 und der Wandel in drei Jahren
- Rund drei Jahre nach der Einführung von ChatGPT zeigt Google Gemini 3, wie schnell sich KI entwickelt
- In der Ära von GPT-3.5 im Jahr 2022 lag das Niveau noch beim einfachen Erzeugen von Absätzen oder Gedichten
- 2025 ist Gemini 3 bereits in der Lage, interaktive Spiele direkt zu coden und zu gestalten
- Gemini 3 erzeugte auf Anfrage des Nutzers ein tatsächlich spielbares Spiel mit dem Titel „Candy-Powered FTL Starship Simulator“
- Das zeigt die Entwicklung von einer Phase, in der KI nur Text erklärte, hin zu einer Phase, in der sie Code und Interface direkt umsetzt
Antigravity und agentische KI
- Google stellte zusammen mit Gemini 3 ein Entwickler-Tool namens Antigravity vor
- Ähnlich wie Claude Code oder OpenAI Codex ist es ein System, das auf den Computer des Nutzers zugreift und selbstständig Code schreibt
- Antigravity führt ein Inbox-Konzept ein: Wenn die KI während der Arbeit Freigaben oder Hilfe benötigt, sendet sie dem Nutzer eine Benachrichtigung
- Der Nutzer gibt Anweisungen auf Englisch, und die KI setzt sie in Code um
- Als Beispiel analysierte sie die Newsletter-Dateien des Autors und erstellte automatisch eine Website, die KI-bezogene Prognosen zusammenfasst
- Die KI führte Websuche, Code-Ausführung und Browser-Tests durch und verpackte das Ergebnis so, dass es auf Netlify deployt werden konnte
Gemini 3 als kollaborative KI
- Gemini 3 teilt seinen Fortschritt transparent, indem es während der Arbeit Nutzerfreigaben anfordert
- Der Nutzer prüft und überarbeitet die Vorschläge der KI und arbeitet so mit ihr zusammen
- Dieser Prozess fühlt sich eher nach „KI-Management“ an
- Die KI ist nicht perfekt, aber ihre Fehler liegen eher bei Unterschieden im Urteilsvermögen oder Missverständnissen bei der Interpretation von Absichten; das bisherige Problem der Halluzinationen ist fast verschwunden
- Die Zusammenarbeit mit Gemini 3 ähnelt dem „Management eines Teammitglieds“ und geht deutlich über das bloße Eingeben eines Prompts hinaus
Forschungsleistung und die Bewertung „PhD-Niveau“
- Gemini 3 übernahm Aufgaben wie die Analyse von Forschungsdatensätzen und das Schreiben eines Fachartikels
- Es stellte eine alte Crowdfunding-Datendatei wieder her, bereinigte sie und führte neue Analysen durch
- Anschließend schrieb es einen 14-seitigen Fachartikel zum Thema „Gründung und Geschäftsstrategie“
- Die KI entwickelte eigenständige Hypothesen, führte statistische Analysen durch und erzeugte eigene Metriken zur Messung der Originalität von Ideen
- Das Ergebnis erreichte die Qualität eines Graduiertenstudenten, auch wenn einzelne statistische Methoden und die theoretische Ausarbeitung noch Schwächen zeigten
- Mit zusätzlichen Anweisungen verbesserte sich die Qualität deutlich
- Der Autor bewertet es so, dass „Intelligenz auf PhD-Niveau nicht mehr fern ist“
Der Übergang zum digitalen Begleiter
- Gemini 3 ist eine partnerartige KI, die denkt und handelt, und für Milliarden Menschen weltweit zugänglich
- Es gibt keine Anzeichen für eine Verlangsamung der KI-Entwicklung; stattdessen rücken der Aufstieg agentischer Modelle und die Bedeutung von Kompetenz im Management von KI in den Vordergrund
- Der Autor beschreibt dies als „Übergang vom Zeitalter der Chatbots zum Zeitalter digitaler Begleiter“
- Menschen sind nun nicht mehr nur dafür da, Fehler der KI zu korrigieren, sondern werden zu Managern, die die Arbeit der KI dirigieren
- Zum Schluss demonstrierte Gemini 3 kreative Fähigkeiten jenseits von Text, etwa indem es allein mit Code ein Coverbild für einen Blog erzeugte
- Allerdings ist Vorsicht geboten: Wer einer KI Zugriff auf den eigenen Computer gibt, geht damit auch Sicherheitsrisiken ein
1 Kommentare
Hacker-News-Kommentare
Jedes Mal, wenn ich solche Artikel sehe, fehlt für mich immer ein Teil — nämlich die Frage: „Ist es gut, ist es korrekt?“
edgeDetect(image)schreiben lassen, und je nach Modell gelang das oder eben nichtInteressant ist, dass die Interaktion mit AI bisher größtenteils auf Textboxen zentriert ist
Das Problem der „Halluzinationen“ besteht weiterhin
Bei der Frage „Ist das Intelligenz auf PhD-Niveau?“ habe ich als Doktorand ein ähnliches Gefühl
Googles Fortschritt findet nicht nur in der Software, sondern auch in der Hardware statt
Gemini 3 ist beeindruckend, wirkt aber immer noch, als bliebe es innerhalb der Grenzen der bestehenden Literatur
GPT-3 wurde im Juni 2020 veröffentlicht, und ChatGPT war Version 3.5
Dass sich „Human in the loop“ vom Menschen, der AI-Fehler korrigiert, zum Menschen, der AI dirigiert, entwickelt, höre ich schon lange
Ich frage mich, ob es sicher ist, Werkzeuge wie Claude Code oder Antigrav direkt auf dem lokalen System auszuführen