Gemini 3 für Entwickler: Neue Funktionen für Reasoning und Agenten

(blog.google)

5 Punkte von GN⁺ 2025-11-19 | 2 Kommentare | Auf WhatsApp teilen

Gemini 3 Pro ist Googles neuestes KI-Modell und bietet im Vergleich zur vorherigen Version eine verbesserte Reasoning-Fähigkeit und Coding-Performance
Es unterstützt agentische Entwicklungsumgebungen und kann auf verschiedenen Plattformen wie Google AI Studio, Vertex AI und Antigravity genutzt werden
Mit der „Vibe Coding“-Funktion, die Apps allein per natürlicher Sprache erzeugt, lassen sich vollständige Anwendungen mit einem einzigen Prompt erstellen
Die Leistung bei multimodalem Verstehen sowie visuellem, räumlichem und Video-Reasoning wurde verbessert, wodurch sich der Einsatz für komplexe Bilder, Videos und UI-Aufgaben erweitert
Es ist in den gesamten Entwickler-Workflow integriert und etabliert sich als neuer Standard für KI-gestützte Softwareentwicklung

Überblick über Gemini 3 Pro

Gemini 3 Pro ist Googles intelligentestes Modell und übertrifft die vorherige Version in wichtigen KI-Benchmarks
- Gegenüber 2.5 Pro wurden die Coding-Performance und die Bearbeitung von Zero-shot-Aufgaben verbessert
Es lässt sich nahtlos in agentische Workflows und bestehende Coding-Umgebungen integrieren und ermöglicht neue Anwendungsfälle
Das Preismodell liegt bei 2 US-Dollar pro 1 Million Input-Token und 12 US-Dollar pro 1 Million Output-Token (bei Prompts bis 200k Token)
Eine Preview-Version ist über Google AI Studio und Vertex AI verfügbar, teils kostenlos

Gemini 3 Pro erreichte auf Terminal-Bench 2.0 einen Wert von 54,2 % und belegt damit seine Fähigkeit im Umgang mit terminalbasierten Tools
Es ist integriert mit Google Antigravity, Gemini CLI, Android Studio, Cursor, GitHub, JetBrains, Manus, Cline und weiteren
- Cline implementiert mit Gemini 3 eine Funktion zur autonomen Code-Erzeugung innerhalb der IDE
Das Modell kann den Kontext auch bei langfristigen Code-Aufgaben wie Multifile-Refactoring, Debugging und Funktionsimplementierung besser aufrechterhalten

Google Antigravity ist eine agentische Entwicklungsplattform auf Basis von Gemini 3, auf der Entwickler mehrere Agenten verwalten und Aufgaben ausführen lassen können
- Sie bietet eine intelligente kollaborative Umgebung für Agenten, die editor-, terminal- und browserübergreifend autonom arbeitet
Entwickler übernehmen die Rolle des Architekten, während Agenten Funktionsumsetzung, UI-Iterationen, Bugfixes, Recherche und Berichtserstellung übernehmen
Eine öffentliche Preview-Version für macOS, Windows und Linux kann kostenlos heruntergeladen werden

Über ein clientseitiges bash-Tool kann das Modell Shell-Befehle vorschlagen und Systemaufgaben automatisieren
Das serverseitige bash-Tool unterstützt die mehrsprachige Code-Erzeugung und sicheres Prototyping
Google Search-basierte Datenanbindung (Grounding) und die Funktion URL context lassen sich mit strukturierten Ausgaben kombinieren
- Nach Datensammlung und -extraktion können sie für nachgelagerte Agenten-Aufgaben genutzt werden

Gemini 3 Pro bietet die Funktion Vibe Coding, mit der sich Apps allein per natürlicher Sprache erzeugen lassen
- Dank besserem Verständnis komplexer Anweisungen und besserer Tool-Nutzung kann mit einem einzigen Prompt eine vollständige interaktive App erstellt werden
Auf dem WebDev Arena Leaderboard erreichte es 1487 Elo
Auf Emergents Full-Stack-App-Entwicklungsplattform wurde die Performance in UI- und Frontend-Workflows verbessert
In Google AI Studio lassen sich aus Sprachmemos oder Skizzen Spiele und Apps erzeugen
- Der Build mode verbindet Modell und API automatisch und unterstützt das schnelle Hinzufügen von KI-Funktionen

Gemini 3 erzielte Bestwerte in MMMU-Pro und Video MMMU
- Damit setzt es neue Maßstäbe bei komplexem Bild- und Video-Reasoning
Das Kontextfenster mit 1 Million Token verbessert die Effizienz bei der Entwicklung multimodaler Anwendungen
Die visuelle Verarbeitungsauflösung (media resolution) lässt sich fein abstimmen, um Latenz und Kosten zu steuern

Es geht über einfaches OCR hinaus und ermöglicht Dokumentenverständnis und Schlussfolgerungen
Es gibt eine Demo-App, die allein aus Bildeingaben interaktive Web-Erlebnisse erzeugt

Die Fähigkeit zum räumlichen Verständnis bei Pointing, Trajektorienvorhersage und Task-Fortschritt wurde verbessert
- Das ist unter anderem für autonomes Fahren, XR und Robotik nutzbar
Durch Bildschirmverständnis und Erkennung von Nutzerverhalten steigt die Leistung in Desktop- und mobilen Umgebungen
- Die Nutzerintention wird auf Basis von Mausbewegungen und Annotationen erkannt

Durch Verständnis bei hohen Bildraten werden auch in schnellen Szenen Details erfasst
Mit Langzeit-Kontextgedächtnis lassen sich aus stundenlangen Videos Narrative aufbauen und Details extrahieren
In der Umgebung Agent Opus wurde die Geschwindigkeit um 32 % erhöht, zugleich verbesserten sich Genauigkeit und Zuverlässigkeit bei komplexen Anweisungen

Über die Gemini API ist eine sofortige Integration in Anwendungen möglich
- Neue Parameter wie thinking level, media resolution und thought signatures wurden hinzugefügt
Agentische Architekturen werden in Gemini CLI, der Android-App und Google Antigravity unterstützt
Mit dem Build mode in Google AI Studio lassen sich Apps mit einem einzigen Prompt erzeugen
- Die Funktion I’m feeling lucky automatisiert die Umsetzung kreativen Codes

Gemini 3 Pro ist ein Wendepunkt für KI-zentrierte Entwicklungsumgebungen, integriert sich in bestehende Workflows und zeigt neue Entwicklungsweisen auf
Google stellt Entwicklern Werkzeuge bereit, die die Grenzen dessen erweitern, was mit KI möglich ist
Es markiert den Beginn des Gemini-3-Zeitalters und weckt die Erwartung, dass Entwickler damit neue Innovationen schaffen werden

iolothebard 2025-11-26

Mit Vibe-Coding-Funktion ausgestattet!! hahaha

GN⁺ 2025-11-19