Alles, was auf der Google I/O 2026 angekündigt wurde

xguru · 2026-05-21T11:01:01+09:00

Die zentralen Schwerpunkte sind Gemini 3.5 Flash, Gemini Omni Flash, Antigravity 2.0, Google AI Studio, Gemma 4, Android 17, Chrome/Web, Firebase, Google Play und Developer-Skills im AI-Zeitalter Google stellt nicht nur Modellankündigungen in den Mittelpunkt, sondern den Entwicklungsfluss, in dem Agenten tatsächlich auf Produkte, Browser, Cloud, Mobile-Apps, Daten, Dokumente und Testumgebungen zugreifen Entwickler-Tools gehen über das reine Schreiben von Code hinaus und erweitern sich auf Planung, Ausführung, Verifikation, Debugging, Deployment, Evaluierung und die Koordination mehrerer Agenten Android, Flutter, Chrome, Firebase und Google Play werden alle so erweitert, dass Gemini und Agenten-Tools in bestehende Entwicklungsabläufe integriert werden Größere Engpässe als das Schreiben von Code sind inzwischen Validierungskosten, Bereitstellung von Kontext, Zugriffsrechte auf Tools, Runtime-Beobachtung, Testinfrastruktur sowie die Dokumentation und Systemarchitektur einer Organisation Sitzung 1 - Google keynote Jeden Monat erstellen mehr als 8,5 Millionen Menschen Apps und Experiences mit Google-Modellen Die Modell-APIs von Google verarbeiten etwa 19 Milliarden Tokens pro Minute Nutzung von AI Search: AI Overviews werden monatlich von mehr als 2,5 Milliarden Menschen genutzt AI Mode wird monatlich von mehr als 1 Milliarde Menschen genutzt Die monatlich aktiven Nutzer der Gemini app stiegen seit der I/O im vergangenen Jahr von 400 Millionen auf mehr als 900 Millionen Mit dem Modell Nano Banana wurden mehr als 50 Milliarden Bilder erzeugt Gemini 3.5 Flash ist produktübergreifend und über die API verfügbar; die Kernmerkmale sind schnelle Ausführung und Kosteneffizienz Gemini Omni Flash ist das erste Modell der Omni-Familie und zielt darauf ab, multimodale Ein- und Ausgaben umfassender zu verarbeiten Antigravity 2.0 ist eine eigenständige Desktop-App, die weltweit verfügbar ist und Agentengespräche, Projekte und Aufgabenmanagement auf einem Bildschirm zusammenführt Große Antigravity-Demo: Mit 93 Sub-Agenten, mehr als 15.000 Modellanfragen und 2,6 Milliarden Tokens wurde aus einem leeren Projekt ein funktionsfähiger Betriebssystem-Kern erstellt Mithilfe der Leistung und Kosteneffizienz von Gemini 3.5 Flash lief dies mit API-Credits von unter 1.000 US-Dollar Sitzung 2 - Developer keynote Google zeigt für Entwickler einen Ansatz, der Modelle, Agenten-Tools, Nutzerplattformen und Infrastruktur zusammenführt Managed agents kommen in die Gemini API, sodass sich ein Agenten-Harness wie Antigravity in API-Form nutzen lässt Google Antigravity 2.0 ist eine agentenzentrierte Desktop-App, in der mehrere Agenten Entwicklungsaufgaben übernehmen Mit dem Antigravity SDK lassen sich Agenten-Workflows direkt anpassen und bereitstellen In Google AI Studio können neue Nutzer ohne Kreditkarte direkt auf Cloud Run deployen Durch die Integration mit Google Workspace kann AI Studio Workspace-Daten im App-Erstellungs-Workflow verwenden In Google AI Studio ist nun ein Workflow möglich, der Ideen direkt in Android-Apps umsetzt Gemma 4: Wird unter der Apache-2-Lizenz angeboten Erreichte im ersten Monat 100 Millionen Downloads Die gesamten Gemma-Downloads stiegen auf mehr als 500 Millionen Chrome DevTools for Agents können in Antigravity und in mehr als 20 Coding-Agenten verwendet werden Gemma 4 wurde mit LoRA feinabgestimmt, um Bash-Befehlsantworten zu erzeugen, die direkt in CI-Pipelines nutzbar sind, und dann auf einem lokalen Notebook bereitzustellen Sitzung 3 - Agent-first workflows from prompt to production In AI Studio erstellte Apps werden mit Cloud Run und Firebase deployt; anschließend wird auch Debugging und Analyse in der Produktionsphase in einen Agenten-Workflow eingebunden Über mehr als 50 verwaltete MCP-Server greifen Agenten auf Google-Cloud-Tools und Daten zu Developer Knowledge MCP speist aktuelle Informationen auf Basis der Google-Dokumentation in Agenten-Tools ein und reduziert so Probleme mit veralteten Dokumenten Aktuelle Dokumentations-Snapshots werden in etwa alle 8 bis 12 Stunden in Agenten-Tools eingespeist Mit Data Agent Kit und BigQuery MCP werden Firestore-, BigQuery- und Log-Daten analysiert und Dashboards erstellt Antigravity kann App-Fehler untersuchen, relevante Dateien finden und anpassen und den Prozess bis zu einem GitHub-Commit fortführen Ein auf Cloud Run bereitgestellter remediation agent und ein CI agent sind mit Eventarc, Pub/Sub und Gemini verbunden, um Fehler zu untersuchen und zu beheben Mehrere Agenten übergeben sich Aufgaben im A2A(agent-to-agent)-Verfahren Agentenentwicklung endet nicht bei der Prototyperstellung, sondern erweitert sich auf Deployment, Monitoring, Datenanalyse und automatische Wiederherstellung Sitzung 4 - What’s new in Android Android 17 ergänzt Speicherlimits und zugehörige Tools, damit übermäßiger Speicherverbrauch von Apps die User Experience nicht beeinträchtigt Android 17 nimmt Bedingungen wie excessive memory, cold start und excessive CPU automatisch in die Analyse auf Apps, die auf Android 17 abzielen, benötigen die Berechtigung ACCESS_LOCAL_NETWORK, um Geräte im lokalen Netzwerk zu finden und sich mit ihnen zu verbinden Google verstärkt den Kurs, Android-UIs mit Jetpack Compose zu erstellen Compose 1.10 und Compose 1.11 enthalten Verbesserungen bei Performance, hybrid UI und neuen APIs Die Integration von AppFunctions und Gemini befindet sich in der geschlossenen Preview; Apps können dabei zum Ziel der Gemini-Orchestrierung werden Mit der Developer Preview der ML Kit Prompt API lassen sich einige neue Funktionen testen Android 17 bietet Eclipsa Video, verbesserte HE-AAC-Sprachqualität sowie Kamera- und Medienverbesserungen auf Basis von CameraX und Media3 Apps für große Bildschirme bewegen sich mit Navigation 3 und der Bibliothek Compose Adaptive in eine Richtung, die sich weniger an bisherigen Mobile-Beschränkungen orientiert Compose 1.6 für Wear OS unterstützt Navigation 3 und einen mode manager zur Verwaltung von Inhalten im Energiesparmodus Sitzung 5 - What’s new in Chrome Chrome konzentriert sich darauf, Websites so zu gestalten, dass sie für Nutzer mit Agenten und agentischen Tools gut funktionieren Statt sich nur auf das Grundwissen von Modellen zu verlassen, will Chrome aktuelles Baseline und Web-Features mit Entwickler-Tools verbinden Seit dem vergangenen Jahr haben 55 Funktionen den Status Baseline Widely Available erreicht Zum Zeitpunkt der Ankündigung befinden sich 52 Funktionen im Status Baseline Newly Available Da Chrome alle vier Wochen aktualisiert wird, erzeugen Coding-Agenten leicht veraltete Implementierungen, wenn ihnen aktuelle Web-Features nicht bekannt sind Die Prompt API von Chrome wird in Chrome 148 verfügbar sein Navigation API, View Transitions, HTML-in-Canvas und declarative partial updates werden in den Entwicklungsworkflow aufgenommen Entwickler von Chrome-Erweiterungen können Installation, Service Worker, side panel und popup automatisch prüfen und debuggen Chrome erweitert sich in die Richtung, Agenten High-Level-Skills für Web-Performance, identity und security sowie Leitfäden für mehr als 100 gängige Anwendungsfälle bereitzustellen Wenn Agenten mit aktuellen Web-Features und Informationen zur Browser-Unterstützung versorgt werden, lässt sich die Wiederholung veralteter Kompatibilitätsmuster reduzieren Sitzung 6 – What’s new in Google AI Die Gemini-Modellfamilie ist eine multimodale Modellfamilie, die Texte, Bilder, Audio, Video und Code als Eingaben sowie verschiedene Ausgabeformen verarbeiten kann Rollen von Gemini 3.5 Pro und Flash: Gemini 3.5 Pro ist auf das Lösen komplexer Probleme fokussiert Gemini 3.5 Flash übernimmt die Balance aus Leistung, Geschwindigkeit und Kosten Die Build-Funktion in AI Studio verwendet 3.5 Flash als Standardmodell Nano Banana 2 kann direkt in AI Studio ausprobiert werden Gemini Omni Flash ist ein Modell, das aus Eingaben Ausgaben einschließlich Video erzeugen kann Gemini Live und die Live API unterstützen sprachbasierte Interaktionen Die Interactions API ist eine Funktion für die Interaktion mit Agenten innerhalb von AI Studio Zugänglichkeit von Gemma 4: Kann im AI Studio playground getestet werden Teilweise sind auch kostenlose Aufrufe über die Gemini API möglich Verfügt über ein Kontextfenster von 256.000 Tokens und ist auf Hugging Face zu finden Ebenfalls vorgestellt wurden Gemini Robotics 1.6, Genie 3, Antigravity 2.0 sowie eine Strategie zur Kostensenkung durch die Mischung aus offenen und proprietären Modellen Sitzung 7 – Build next-gen AI experiences with Google AI Studio and Google Antigravity Google AI Studio erweitert sich über einen Model-Playground hinaus zu einem Ort, an dem Ideen in Apps verwandelt und bereitgestellt werden Modelle, Agenten, App-Erstellung, Workspace-Integration und Cloud-Run-Deployment sind in einem durchgängigen Ablauf zusammengeführt Der App-Bereich von AI Studio soll bald verfügbar sein und App-Erstellung sowie Deployment direkter abdecken Hinzugekommen ist eine Funktion, mit der in AI Studio erstellter Code mit einem Klick nach Antigravity exportiert werden kann Antigravity 2.0 übernimmt nicht nur das Schreiben von Code, sondern die Rolle einer Mission Control, die verschiedene Aufgaben über Agenten koordiniert Antigravity 2.0 stellt task list, implementation plan und die Prüfung geänderter Dateien in den Mittelpunkt des Ablaufs Code-Review und die Prüfung von Änderungen lassen sich direkt in Antigravity 2.0 erledigen Die Struktur ist darauf ausgelegt, schwere Aufgaben wie Browser-Tests, Planung, Funktionsentwicklung über mehrere Dateien und End-to-End-Validierung an Agenten zu übergeben Mit Google AI Studio lässt sich in etwa 20 Minuten eine neue Business-App erstellen und anschließend mit Antigravity weiterentwickeln Google AI Studio ist ein schneller Startpunkt für „prompt to app“, während Antigravity das Werkzeug ist, um daraus echte Entwicklungsarbeit zu machen Sitzung 8 – Unlock modern web capabilities in your AI coding workflows Wenn Coding-Agenten moderne Web-Funktionen nicht kennen, erzeugen sie leicht Code nach veralteten Standards für Browser-Kompatibilität Chrome hat im vergangenen Jahr 50 neue Funktionen veröffentlicht, doch wegen des Knowledge-Cutoff vieler Modelle erreichen diese Funktionen die Modelle oft nicht Im Beispiel zur Interest Invokers API zeigte sich das Problem, dass ein Agent den alten Attributnamen interesttarget verwendet Modern Web Guidance ist ein Wissenspaket, das Agenten dabei hilft, aktuelle Web-Funktionen und empfohlene Implementierungen zu finden Bevor ein Agent antwortet, führt er innerhalb eines lokalen Pakets eine semantische Suche durch Umfang und Struktur der Guidance: Derzeit gibt es mehr als 100 Guides Die Skills für einzelne Funktionen werden nicht alle als Top-Level-Tools offengelegt, sondern bei Bedarf gefunden und genutzt Die Guides liefern sowohl die ideale moderne Implementierung als auch empfohlene Fallbacks Wenn es keine Anforderungen an Browser-Support gibt, geht der Agent standardmäßig von Baseline Widely Available aus Wenn in AGENTS.md Bedingungen wie „nur Unterstützung für Chrome 144 oder höher“ eingetragen sind, kann der Agent unnötige Fallbacks vermeiden Das Chrome-Team führt täglich Evaluierungen mit Modellen wie Gemini 3.1, Claude Opus 4.7 und GPT 5.5 durch Sitzung 9 – What’s new in Firebase Firebase entwickelt sich zu einer agent-native platform, auf der sowohl Menschen als auch Agenten Apps erstellen und skalieren können Firebase Data Connect entwickelt sich zu Firebase SQL Connect weiter, das SQL-basierte App-Entwicklung unterstützt Mit dem custom resolver von Firebase SQL Connect lassen sich Google-Cloud-Dienste wie Cloud Functions und BigQuery anbinden Firestore unterstützt Geo Search, native Full-Text-Suche und Semantic Match Firebase AI Logic unterstützt aktuelle Modelle und kann mit Maps Grounding ortsbezogene AI-Funktionen erstellen Auch die Bildgenerierungssteuerung von Nano Banana kann in Firebase AI Logic genutzt werden Firebase AI Logic unterstützt lokales und hybrides Inferencing auf iOS, Chrome und Android und fällt auf ein cloud-hosted model zurück, wenn kein lokales Modell vorhanden ist Dart support for Cloud Functions in Firebase wird als Experimental Preview bereitgestellt AI Studio ist mit Google Workspace verbunden, sodass Daten aus Sheets, Docs, Gmail und Calendar in Apps genutzt werden können Firebase agent skills sind auf Android, iOS, Web und Flutter nutzbar, außerdem wird die Unterstützung für Crashlytics erweitert Sitzung 10 – What’s new in Google Play Play Billing unterstützt in mehr als 65 Märkten mehr als 300 lokale Zahlungsmethoden Google Play hat mehr als 890 Millionen kaufbereite Nutzer Die Auswahl, Google Play Billing zusammen mit alternativen Zahlungen anzubieten, wird ausgeweitet, zudem wurden niedrigere Servicegebühren angekündigt App Discovery wird auf die Gemini app, Android und das Web ausgeweitet, sodass Nutzer Apps und Spiele innerhalb von Gemini finden können Statt einer statischen Linkliste empfiehlt Gemini Apps anhand ihrer tatsächlichen Funktionen und der Informationen im Store Listing Bei einigen Themen können Nutzer von Gemini und Play mehr als 450.000 Film- und TV-Inhalte durchsuchen In der Play Console kann Gemini Listings vorab ausfüllen, wenn strukturierte Dateien wie Eclipsa Video oder Google Sheets hochgeladen werden Gemini soll bei Aufgaben in der Play Console wie bulk price changes, import skills und metadata configuration helfen Mit der in-app subscription management API können Nutzer ihren Abo-Plan direkt in der App einfach ändern Im vergangenen Jahr hat Google Play Billing versuchten Betrug im Wert von 3,4 Milliarden US-Dollar und missbräuchliche Rückerstattungen im Wert von 130 Millionen US-Dollar verhindert Sitzung 11 – Defining the agentic AI era Gemini, Search, die Gemini-App und Google DeepMind behandeln agentische KI in dieselbe Richtung Gemini 3.5 Flash kann auch innerhalb der Search genutzt werden Search muss ein Gleichgewicht zwischen schnellen Antworten und längeren agentischen Aufgaben finden Gemini Spark übernimmt die Rolle eines Always-on-Agenten, der im Hintergrund Aufgaben erledigt, die Nutzer ihm überlassen haben Modelle müssen über einfache Chat-Antworten hinaus auf die gesamte Google-Produktwelt und das externe Ökosystem aufsetzen Internes Tool, das von Python nach Go übersetzt wurde: Die Aufgabe, ein bestehendes Programm mit Tests in eine andere Sprache zu übersetzen, ist für Modelle ein klarer umrissenes Problem Einige interne Tools wurden über Nacht 10- bis 20-mal schneller Auch Googles interne Software-Infrastruktur kann sich passend zur neuen agentischen Welt schneller verändern Hardware, Modellgröße, Produkteinsatz und Feedback-Loop müssen zusammenpassen, damit Gemini in die gesamte Google-Produktpalette eingebaut werden kann Der Fokus der Fragen verschiebt sich von „Was kann das Modell?“ zu „Wie platziert man das Modell in Produkten und Workflows?“ Sitzung 12 - What’s new in Android development tools Android-Entwicklungstools werden nicht nur für menschliche Entwickler, sondern auch für AI Agents entworfen, die in Codebasen eingesetzt werden Android Studio Otter unterstützt Gemini-Enterprise- und Google-One-Konten Android Studio kann lokale und entfernte Modelle einbinden und verwenden Android Bench dient als Maßstab dafür, welches Modell für Android-Entwicklungsaufgaben geeignet ist Direkt in Compose Preview kann man UI-Änderungen anfordern, damit der Agent mit besserem Kontext arbeiten kann Mit dem agent-basierten Assistenten für neue Projekte lassen sich allein per Prompt adaptive Android-Apps erstellen Android Studio enthält etwa 10 Skills, die bei Aufgaben wie adaptiver API-Integration oder der Umwandlung von XML in Compose helfen Die neue Android CLI unterstützt LLM-Workflows und reduziert beim Erstellen neuer Projekte den Token-Verbrauch gegenüber anderen Gradle-LLM-Tools um mehr als 70 % Antigravity CLI, Android CLI und Android Skills lassen sich bündeln, sodass sich auch in Antigravity mit der Android-App-Entwicklung beginnen lässt In Android Studio Quail und auf Android-17-Geräten bleibt die Geräteverbindung erhalten, selbst wenn man das Netzwerk wechselt oder den Laptop neu startet Sitzung 13 - What’s new in Flutter Flutter 3.44 und Dart 3.12 erscheinen gemeinsam Am Flutter-Projekt haben in diesem Jahr mehr als 1.700 Contributors mitgewirkt Jeden Monat entwickeln mehr als 1,5 Millionen Entwickler mit Flutter In Flutter 3.44 kann auf Geräten mit Vulkan-Unterstützung ab Android API 34 ein neuer Rendering-Modus ausprobiert werden Flutter wird im Infotainment-System des Toyota 2026 RAV4 eingesetzt Bei Dart-basierten Cloud Functions for Firebase sinkt der Cold Start dank AOT-Kompilierung in manchen Fällen auf 10 ms Firebase AI Logic erhält serverseitige Prompt-Templates, sodass Prompts nicht direkt in die App eingebettet werden müssen Firebase Agent Skills for Flutter liefern Agents Anleitungen zum Aufbau von Full-Stack-Apps mit Flutter und Firebase Unterstützung für LiteRT-LM soll bald in das Paket flutter_gemma aufgenommen werden Bei Flutter Desktop ist Canonical als Lead Maintainer und strategischer Steward beteiligt Sitzung 14 - What’s new in the Gemma open model family Gemma 4 etabliert sich als das leistungsstärkste öffentliche Modell der Gemma-Familie Es wird in mehreren Größen von 2B bis 31B angeboten und kann auf Mobilgeräten, Laptops und in der Cloud genutzt werden Gemma startete 2024 als Modellfamilie, die von 1B bis 27B reichte Gemma 4 ist ein Open-Weights-Modell und mit dem Open-Source-Ökosystem kompatibel Mit MTP und Speculative Decoding lässt sich die Decoding-Geschwindigkeit um bis zu das Dreifache erhöhen Für das Android-Ökosystem steht eine Day-zero-Implementierung von Gemma 4 bereit Über Android-APIs lassen sich kleinere Gemma-Modelle direkt auf dem Smartphone ausführen, oder Android-Apps mit lokalen Gemma-Modellen entwickeln, wenn der Zugriff auf die Gemini API schwierig ist Mit dem ADK (Agent Development Kit) auf Cloud Run und Gemma 31B werden Agents gebaut, die Datenbanken verstehen und Antworten finden Gemma 4 lässt sich über die OpenAI-kompatiblen Schnittstellen von Transformers.js, Ollama und LM Studio im Browser oder lokal ausführen Enterprise-Cloud, lokale Maschinen, Browser und Mobilgeräte werden alle zu Laufzeitumgebungen für Gemma Sitzung 15 - What’s new in Web UI Die Web-UI-Updates 2026 behandeln wichtige Funktionen zusammen mit ihrem Baseline-Status Alle Funktionen erhalten Kompatibilitätskennzeichnungen wie Baseline Widely Available, Newly Available oder Limited Available Mit der contrast-color API lassen sich in CSS leichter Farben mit passendem Kontrast wählen Die Funktion meta name="text-scale" in Chrome 146 reagiert auf die systemweiten Einstellungen für die Schriftgröße Bei Nutzern von Android und iOS ändern jeweils mehr als 30 % die Standard-Schriftgröße Seit Chrome 134 unterstützt das Dialog-Element Funktionen wie Declarative Light Dismiss von Popover Two-phase View Transitions können in Chrome Canary getestet werden Scroll-driven Animations wurden 2023 in Chrome eingeführt und verbessern über Interop 2026 die Interoperabilität Die HTML-in-Canvas API ermöglicht es, echte DOM-Inhalte in Canvas einzubetten In Chrome 149 kommen Gap Decorations und neue Einsatzmöglichkeiten für Shape Outside hinzu Sitzung 16 - Adaptive development for the expanding Android ecosystem Android ist nicht mehr nur ein Ökosystem für Smartphones; mehr als 580 Millionen aktive Großbildgeräte profitieren von Investitionen in adaptive Apps Nutzer von Foldables werden bei adaptiven Apps als besonders wertvolle Nutzergruppe eingestuft In Android 17 wird für target SDK 37 die Möglichkeit abgeschafft, sich von orientation und resizability abzumelden Der Desktop emulator in Android Studio Quail Canary unterstützt das Testen von Android-Apps in Desktop-Form Mit der Continue On API in Android 17 können Nutzer ihre Arbeit von einem Gerät auf einem zweiten Gerät fortsetzen Google verstärkt den Trend, Android-Apps Compose-first zu entwickeln Compose 1.11 verbessert die Trackpad-Unterstützung auf Mouse- und Pointer-Niveau und fügt eine Testing-API für Non-Touch-Eingaben hinzu Für zustandsbasiertes Styling wurde Compose eine experimentelle API hinzugefügt Connected Displays wird über den Android Feature Drop allgemein verfügbar gemacht Compose, Navigation 3 und die Compose Adaptive-Bibliothek unterstützen verschiedene Displays wie Foldables, Desktop, Auto, TV und XR Sitzung 17 – Building the quantum-AI future with Hartmut Neven and James Manyika Der zentrale Schwerpunkt ist, wie sich Quantencomputing und AI gegenseitig beschleunigen Hartmut Neven startete 2012 Googles Quantum-AI-Team superposition und qubit bilden die Grundlage des Quantencomputings Die Zahl möglicher Bitstrings auf einem 105-qubit-Chip beträgt 2 hoch 105 Die Community hat derzeit mehr als 70 Algorithmen und Probleme identifiziert, die Quantencomputer sinnvoll lösen können Diese Zahl könnte sich künftig mehr als verzehnfachen quantum error correction ist eine Schlüsseltechnologie, um den Zustand der Superposition aufrechtzuerhalten Google gelang es 2022, mit quantum error correction die Fehler realer Maschinen zu verringern Quantum Echoes steht in Verbindung mit Verfahren zum Lernen aus Daten aus NMR oder MRI Google vertritt die Ansicht, dass der Übergang zu post-quantum cryptography bis 2029 deutlich robuster vorangetrieben werden sollte Sitzung 18 – Scale AI with Google’s TPU software stack Behandelt wird ein Open-Source-Software-Stack zum Trainieren, Fine-Tuning und Ausführen von Inferenz für Modelle auf TPU Der Modellentwicklungsprozess ist in Pre-Training, Post-Training und Serving/Inferenz unterteilt Mit den kostenlosen TPUs in Kaggle und Colab lassen sich Post-Training und Inferenz ausprobieren Die Demo vLLM on TPU führt das Modell Gemma 4 31B auf TPU aus und fasst anhand eines Essensbildes Nährwertinformationen zusammen Gemma 4 ist ein multimodales Modell, das sich gut dafür eignet, Bilder zu verstehen und Inhalte zusammenzufassen Durch die Integration von MTP in vLLM TPU inference wurde in mehreren Aufgaben eine Beschleunigung von rund 3x erreicht Tunix ist ein leichtgewichtiges Framework für Post-Training Statt eines großen Modells wird ein 4B-Modell feinabgestimmt, damit es dieselbe Aufgabe übernimmt, und auf einem einzelnen Trillium-Chip ausgeführt MaxText, Tunix, vLLM, JAX, PyTorch und TPU sind als Werkzeuge entlang des Modelllebenszyklus angeordnet Sitzung 19 – Supercharge your AI coding workflow with Chrome DevTools for agents Chrome DevTools for agents ist ein Tool, mit dem Coding-Agenten die Browser-Runtime über DevTools direkt beobachten können So wie menschliche Entwickler mit DevTools lernen und debuggen, sollten auch Coding-Agenten denselben geschlossenen Feedback-Loop haben Agenten können eine echte Chrome-Instanz öffnen, Seiten durchsuchen, Formulare ausfüllen sowie console log und network request erfassen Über den Zugriff auf source maps kann von Laufzeitproblemen direkt zur relevanten Quelldatei gesprungen werden Das Tool wird als NPM package bereitgestellt und enthält zusammen einen MCP server und eine CLI Sechs bereitgestellte Skills: troubleshooting, Chrome DevTools und Chrome DevTools CLI skill helfen bei allgemeiner Nutzung und Konzepten accessibility debugging, memory leak debugging und optimized LCP skill bringen spezialisiertes Fachwissen in den Agenten ein Die Implementierung basiert auf Puppeteer; Agenten verwenden statt direktem Puppeteer-Zugriff den Tool-Wrapper Standardmäßig wird ein separates anonymes Browser-Profil verwendet, ohne Zugriff auf den Chrome password manager CyberAgent prüfte mit DevTools for agents 236 Storybook-Stories aus 32 Komponenten in weniger als einer Stunde Sitzung 20 – A new era of discovery: AI and the frontiers of science with Demis Hassabis Demis Hassabis definierte das ursprüngliche Ziel von DeepMind als „solve intelligence“ Zentrales Thema ist, wie AI wissenschaftliche Entdeckungen, Produkte und Forschungstools verändert AlphaFold wird erneut als Beispiel dafür genannt, ein 50 Jahre altes Problem der Proteinstruktur gelöst zu haben Gemini for Science knüpft an die im Keynote vorgestellte Entwicklung wissenschaftlicher Modelle an Demis Hassabis beschreibt die Gegenwart als die „foothills of the singularity“ und sieht den Zeitpunkt, an dem intelligence gelöst wird, bei ungefähr 2030 ± 1 Jahr Modelle der Genie-Reihe werden von Waymo genutzt, um in der Realität schwer beobachtbare 1 in a billion-Situationen zu testen Die Fortschritte von Isomorphic Labs in der drug discovery dienen als Beispiel dafür, wie AI die Wissenschaft beschleunigt Die Gemini-App hat monatlich 900 Millionen Nutzer, und AI Mode in Search ist ebenfalls zu einer wichtigen Produktoberfläche geworden AI wird über Produktfunktionen hinaus als Werkzeug zur Lösung wissenschaftlicher und forschungsbezogener Probleme eingesetzt Sitzung 21 – A fireside chat on the evolution of the developer craft In der AI-Ära verlagert sich die Arbeit von Entwicklern vom Schreiben von Code hin zu Systemdesign, Dokumentation und Orchestrierung Zwar erscheinen ständig neue Tools und Modelle, aber man muss nicht jedem Trend sofort folgen und sollte bewusst auswählen, was man lernen will Agenten ins Team zu holen ist ähnlich, als würde man mehrere Junior Engineers einstellen; dadurch werden interne Dokumentation und Aufzeichnungen von Designentscheidungen wichtiger Für einen guten agentic workflow muss festgelegt werden, wofür ein einzelner Agent verantwortlich ist, wie mehrere Agenten miteinander kommunizieren und an welcher Stelle Menschen die Aufsicht übernehmen Die UX vieler Coding-Tools ähnelt sich zunehmend, sodass sich in einem Tool gelernte Muster auch auf andere übertragen lassen Bei der Arbeit mit Agenten muss man einen Teil der Kontrolle über den Weg loslassen und stattdessen Ergebnisse und Designabsichten abstimmen Technical debt, cognitive debt und intent debt können sich mit AI schneller verbessern oder schneller verschlechtern 20 Agenten gleichzeitig laufen zu lassen kann die menschliche kognitive Kapazität übersteigen und muss daher bewusst gesteuert werden Gute Prompt-Gewohnheiten entwickeln sich weg von Suchwortfragmenten hin zu vollständigen Zielen mit Kontext Wichtiger als die Frage „Schreibe ich jeden Code selbst?“ ist, ob man Kontext und ein Validierungssystem geschaffen hat, in denen Agenten arbeiten können Sitzung 22 – Build core skills to thrive as an AI-era developer Auch im AI-Zeitalter werden grundlegende Software-Engineering-Fähigkeiten noch wichtiger AI kann ein Force Multiplier sein, aber um Ergebnisse zu bewerten, zu integrieren und zu warten, ist tiefes Fachwissen nötig Je autonomer Agenten arbeiten, desto mehr braucht es ein Shift-left, bei dem die Intent frühzeitig klar definiert wird System Design weitet sich zu einem Konzept aus, das auch Umfeld, Menschen, Agenten, Tools und Kultur umfasst Teams sollten Agenten nicht nur out of the box einsetzen, sondern Agent Role, Profile, Recipe, Rule und Skill selbst erstellen und pflegen Specs, Agent Rules und Skills werden zur Source of Truth, die dem Agenten das What und Why des Systems vermittelt Um realistische Evals zu erstellen, braucht es gemeinsam Kompetenzen in AI, Software Engineering, Nutzerverständnis und Business Es muss ein Feedback-Loop aufgebaut werden, der durch die Analyse von Agent Traces die Tool-Usability, Agent Skills und das System Design verbessert Menschliche Engineers wechseln von der Rolle des Conductors einzelner Agenten zur Rolle des Orchestrators mehrerer asynchroner Agenten-Teams Um ein System aus der Perspektive böswilliger Akteure zu betrachten, kann explizit ein Red Team Agent eingesetzt werden Session 23 - Software engineering at the tipping point Wenn AI das Schreiben von Code beschleunigt, gerät das gesamte Entwicklungsökosystem auf der Ebene der Software Ecology unter Druck Bei Google liegt der gesamte Code, einschließlich Android und Chrome, in einem gemeinsamen Monorepo und wird auf den Trunk committed Google nutzt seit Langem interne Tools, mit denen ein einzelner Entwickler Millionen Zeilen Code ändern kann Es ist sehr wahrscheinlich, dass das heutige Entwicklungsökosystem 10-fache Geschwindigkeit nicht bewältigen kann Wenn Agenten mehr Kompilierungen, Tests, Commits und Token-Verbrauch erzeugen, steigen Infrastrukturkosten und Bottlenecks Agenten können Code erzeugen, der leicht zu schreiben ist, aber nicht unbedingt Code, der für Menschen leicht wartbar ist Es braucht agentische Skills für Component Reuse und Component Isolation, die Wiederverwendung und Isolation erzwingen APIs und Datenzugriffe müssen so robust abgesichert werden, als wären sie für Agenten faktisch öffentlich Der Satz „agents will find things you probably didn't want them to“ zeigt das Risiko beim Design von Berechtigungen Im Entwicklungsökosystem des Jahres 2030 könnte die heutige Arbeitsweise so veraltet wirken wie die CD-ROM-Ära von 2001 Session 24 - Vibe once, run anywhere with Google Antigravity and Flutter Mit Antigravity und Flutter zusammen lässt sich eine einmal entwickelte Idee auf mehrere Plattformen ausweiten Seit der Einführung von Gemini 3 sind die Modellfähigkeiten stark gestiegen, und Antigravity unterstützt diese Fähigkeiten von Anfang an Im Kern von Antigravity steht ein Feedback-Loop, in dem Planung, Ausführung und Verifizierung eng verzahnt sind Antigravity erstellt eine Task List und einen Implementation Plan, hinterlässt während der Ausführung Screenshots und Videos und verfasst nach Abschluss einen Bericht mit der Implementierung und den Gründen dafür In der Verifizierungsphase folgen aufeinander App-Start, Screenshot-Aufnahme, Klicks auf Chrome-Buttons und Testausführung In Flutter liefern die starke Typisierung von Dart und der Analysis Server dem LLM objektive Fehlersignale wie Funktionssignaturen und Klassenstrukturen Flutter ist ein Cross-Platform-UI-Toolkit, das dieselben Pixel und Funktionen auf mehreren Displays bereitstellt Das Stateful Hot Reload von Flutter bietet eine Entwicklungserfahrung, bei der die laufende App in unter 1 Sekunde neu gebaut wird Je mehr Code Agenten erzeugen, desto stärker müssen Menschen die Designziele und Produktrichtung vorgeben und die Ergebnisse der Agenten prüfen Antigravity liefert den Ausführungs-Loop für Agenten, und Flutter sorgt plattformübergreifend für konsistente Ergebnisse, wodurch ein „vibe once, run anywhere“-Flow entsteht

(io.google)

2 Punkte von xguru 1 시간 전 | 1 Kommentare | Auf WhatsApp teilen

Die zentralen Schwerpunkte sind Gemini 3.5 Flash, Gemini Omni Flash, Antigravity 2.0, Google AI Studio, Gemma 4, Android 17, Chrome/Web, Firebase, Google Play und Developer-Skills im AI-Zeitalter
Google stellt nicht nur Modellankündigungen in den Mittelpunkt, sondern den Entwicklungsfluss, in dem Agenten tatsächlich auf Produkte, Browser, Cloud, Mobile-Apps, Daten, Dokumente und Testumgebungen zugreifen
Entwickler-Tools gehen über das reine Schreiben von Code hinaus und erweitern sich auf Planung, Ausführung, Verifikation, Debugging, Deployment, Evaluierung und die Koordination mehrerer Agenten
Android, Flutter, Chrome, Firebase und Google Play werden alle so erweitert, dass Gemini und Agenten-Tools in bestehende Entwicklungsabläufe integriert werden
Größere Engpässe als das Schreiben von Code sind inzwischen Validierungskosten, Bereitstellung von Kontext, Zugriffsrechte auf Tools, Runtime-Beobachtung, Testinfrastruktur sowie die Dokumentation und Systemarchitektur einer Organisation

Sitzung 1 - Google keynote

Jeden Monat erstellen mehr als 8,5 Millionen Menschen Apps und Experiences mit Google-Modellen
Die Modell-APIs von Google verarbeiten etwa 19 Milliarden Tokens pro Minute
Nutzung von AI Search:
- AI Overviews werden monatlich von mehr als 2,5 Milliarden Menschen genutzt
- AI Mode wird monatlich von mehr als 1 Milliarde Menschen genutzt
Die monatlich aktiven Nutzer der Gemini app stiegen seit der I/O im vergangenen Jahr von 400 Millionen auf mehr als 900 Millionen
Mit dem Modell Nano Banana wurden mehr als 50 Milliarden Bilder erzeugt
Gemini 3.5 Flash ist produktübergreifend und über die API verfügbar; die Kernmerkmale sind schnelle Ausführung und Kosteneffizienz
Gemini Omni Flash ist das erste Modell der Omni-Familie und zielt darauf ab, multimodale Ein- und Ausgaben umfassender zu verarbeiten
Antigravity 2.0 ist eine eigenständige Desktop-App, die weltweit verfügbar ist und Agentengespräche, Projekte und Aufgabenmanagement auf einem Bildschirm zusammenführt
Große Antigravity-Demo:
- Mit 93 Sub-Agenten, mehr als 15.000 Modellanfragen und 2,6 Milliarden Tokens wurde aus einem leeren Projekt ein funktionsfähiger Betriebssystem-Kern erstellt
- Mithilfe der Leistung und Kosteneffizienz von Gemini 3.5 Flash lief dies mit API-Credits von unter 1.000 US-Dollar

Sitzung 2 - Developer keynote

Google zeigt für Entwickler einen Ansatz, der Modelle, Agenten-Tools, Nutzerplattformen und Infrastruktur zusammenführt
Managed agents kommen in die Gemini API, sodass sich ein Agenten-Harness wie Antigravity in API-Form nutzen lässt
Google Antigravity 2.0 ist eine agentenzentrierte Desktop-App, in der mehrere Agenten Entwicklungsaufgaben übernehmen
Mit dem Antigravity SDK lassen sich Agenten-Workflows direkt anpassen und bereitstellen
In Google AI Studio können neue Nutzer ohne Kreditkarte direkt auf Cloud Run deployen
Durch die Integration mit Google Workspace kann AI Studio Workspace-Daten im App-Erstellungs-Workflow verwenden
In Google AI Studio ist nun ein Workflow möglich, der Ideen direkt in Android-Apps umsetzt
Gemma 4:
- Wird unter der Apache-2-Lizenz angeboten
- Erreichte im ersten Monat 100 Millionen Downloads
- Die gesamten Gemma-Downloads stiegen auf mehr als 500 Millionen
Chrome DevTools for Agents können in Antigravity und in mehr als 20 Coding-Agenten verwendet werden
Gemma 4 wurde mit LoRA feinabgestimmt, um Bash-Befehlsantworten zu erzeugen, die direkt in CI-Pipelines nutzbar sind, und dann auf einem lokalen Notebook bereitzustellen

Sitzung 3 - Agent-first workflows from prompt to production

In AI Studio erstellte Apps werden mit Cloud Run und Firebase deployt; anschließend wird auch Debugging und Analyse in der Produktionsphase in einen Agenten-Workflow eingebunden
Über mehr als 50 verwaltete MCP-Server greifen Agenten auf Google-Cloud-Tools und Daten zu
Developer Knowledge MCP speist aktuelle Informationen auf Basis der Google-Dokumentation in Agenten-Tools ein und reduziert so Probleme mit veralteten Dokumenten
Aktuelle Dokumentations-Snapshots werden in etwa alle 8 bis 12 Stunden in Agenten-Tools eingespeist
Mit Data Agent Kit und BigQuery MCP werden Firestore-, BigQuery- und Log-Daten analysiert und Dashboards erstellt
Antigravity kann App-Fehler untersuchen, relevante Dateien finden und anpassen und den Prozess bis zu einem GitHub-Commit fortführen
Ein auf Cloud Run bereitgestellter remediation agent und ein CI agent sind mit Eventarc, Pub/Sub und Gemini verbunden, um Fehler zu untersuchen und zu beheben
Mehrere Agenten übergeben sich Aufgaben im A2A(agent-to-agent)-Verfahren
Agentenentwicklung endet nicht bei der Prototyperstellung, sondern erweitert sich auf Deployment, Monitoring, Datenanalyse und automatische Wiederherstellung

Sitzung 4 - What’s new in Android

Android 17 ergänzt Speicherlimits und zugehörige Tools, damit übermäßiger Speicherverbrauch von Apps die User Experience nicht beeinträchtigt
Android 17 nimmt Bedingungen wie excessive memory, cold start und excessive CPU automatisch in die Analyse auf
Apps, die auf Android 17 abzielen, benötigen die Berechtigung ACCESS_LOCAL_NETWORK, um Geräte im lokalen Netzwerk zu finden und sich mit ihnen zu verbinden
Google verstärkt den Kurs, Android-UIs mit Jetpack Compose zu erstellen
Compose 1.10 und Compose 1.11 enthalten Verbesserungen bei Performance, hybrid UI und neuen APIs
Die Integration von AppFunctions und Gemini befindet sich in der geschlossenen Preview; Apps können dabei zum Ziel der Gemini-Orchestrierung werden
Mit der Developer Preview der ML Kit Prompt API lassen sich einige neue Funktionen testen
Android 17 bietet Eclipsa Video, verbesserte HE-AAC-Sprachqualität sowie Kamera- und Medienverbesserungen auf Basis von CameraX und Media3
Apps für große Bildschirme bewegen sich mit Navigation 3 und der Bibliothek Compose Adaptive in eine Richtung, die sich weniger an bisherigen Mobile-Beschränkungen orientiert
Compose 1.6 für Wear OS unterstützt Navigation 3 und einen mode manager zur Verwaltung von Inhalten im Energiesparmodus

Sitzung 5 - What’s new in Chrome

Chrome konzentriert sich darauf, Websites so zu gestalten, dass sie für Nutzer mit Agenten und agentischen Tools gut funktionieren
Statt sich nur auf das Grundwissen von Modellen zu verlassen, will Chrome aktuelles Baseline und Web-Features mit Entwickler-Tools verbinden
Seit dem vergangenen Jahr haben 55 Funktionen den Status Baseline Widely Available erreicht
Zum Zeitpunkt der Ankündigung befinden sich 52 Funktionen im Status Baseline Newly Available
Da Chrome alle vier Wochen aktualisiert wird, erzeugen Coding-Agenten leicht veraltete Implementierungen, wenn ihnen aktuelle Web-Features nicht bekannt sind
Die Prompt API von Chrome wird in Chrome 148 verfügbar sein
Navigation API, View Transitions, HTML-in-Canvas und declarative partial updates werden in den Entwicklungsworkflow aufgenommen
Entwickler von Chrome-Erweiterungen können Installation, Service Worker, side panel und popup automatisch prüfen und debuggen
Chrome erweitert sich in die Richtung, Agenten High-Level-Skills für Web-Performance, identity und security sowie Leitfäden für mehr als 100 gängige Anwendungsfälle bereitzustellen
Wenn Agenten mit aktuellen Web-Features und Informationen zur Browser-Unterstützung versorgt werden, lässt sich die Wiederholung veralteter Kompatibilitätsmuster reduzieren

Sitzung 6 – What’s new in Google AI

Die Gemini-Modellfamilie ist eine multimodale Modellfamilie, die Texte, Bilder, Audio, Video und Code als Eingaben sowie verschiedene Ausgabeformen verarbeiten kann
Rollen von Gemini 3.5 Pro und Flash:
- Gemini 3.5 Pro ist auf das Lösen komplexer Probleme fokussiert
- Gemini 3.5 Flash übernimmt die Balance aus Leistung, Geschwindigkeit und Kosten
Die Build-Funktion in AI Studio verwendet 3.5 Flash als Standardmodell
Nano Banana 2 kann direkt in AI Studio ausprobiert werden
Gemini Omni Flash ist ein Modell, das aus Eingaben Ausgaben einschließlich Video erzeugen kann
Gemini Live und die Live API unterstützen sprachbasierte Interaktionen
Die Interactions API ist eine Funktion für die Interaktion mit Agenten innerhalb von AI Studio
Zugänglichkeit von Gemma 4:
- Kann im AI Studio playground getestet werden
- Teilweise sind auch kostenlose Aufrufe über die Gemini API möglich
- Verfügt über ein Kontextfenster von 256.000 Tokens und ist auf Hugging Face zu finden
Ebenfalls vorgestellt wurden Gemini Robotics 1.6, Genie 3, Antigravity 2.0 sowie eine Strategie zur Kostensenkung durch die Mischung aus offenen und proprietären Modellen

Sitzung 7 – Build next-gen AI experiences with Google AI Studio and Google Antigravity

Google AI Studio erweitert sich über einen Model-Playground hinaus zu einem Ort, an dem Ideen in Apps verwandelt und bereitgestellt werden
Modelle, Agenten, App-Erstellung, Workspace-Integration und Cloud-Run-Deployment sind in einem durchgängigen Ablauf zusammengeführt
Der App-Bereich von AI Studio soll bald verfügbar sein und App-Erstellung sowie Deployment direkter abdecken
Hinzugekommen ist eine Funktion, mit der in AI Studio erstellter Code mit einem Klick nach Antigravity exportiert werden kann
Antigravity 2.0 übernimmt nicht nur das Schreiben von Code, sondern die Rolle einer Mission Control, die verschiedene Aufgaben über Agenten koordiniert
Antigravity 2.0 stellt task list, implementation plan und die Prüfung geänderter Dateien in den Mittelpunkt des Ablaufs
Code-Review und die Prüfung von Änderungen lassen sich direkt in Antigravity 2.0 erledigen
Die Struktur ist darauf ausgelegt, schwere Aufgaben wie Browser-Tests, Planung, Funktionsentwicklung über mehrere Dateien und End-to-End-Validierung an Agenten zu übergeben
Mit Google AI Studio lässt sich in etwa 20 Minuten eine neue Business-App erstellen und anschließend mit Antigravity weiterentwickeln
Google AI Studio ist ein schneller Startpunkt für „prompt to app“, während Antigravity das Werkzeug ist, um daraus echte Entwicklungsarbeit zu machen

Sitzung 8 – Unlock modern web capabilities in your AI coding workflows

Wenn Coding-Agenten moderne Web-Funktionen nicht kennen, erzeugen sie leicht Code nach veralteten Standards für Browser-Kompatibilität
Chrome hat im vergangenen Jahr 50 neue Funktionen veröffentlicht, doch wegen des Knowledge-Cutoff vieler Modelle erreichen diese Funktionen die Modelle oft nicht
Im Beispiel zur Interest Invokers API zeigte sich das Problem, dass ein Agent den alten Attributnamen interesttarget verwendet
Modern Web Guidance ist ein Wissenspaket, das Agenten dabei hilft, aktuelle Web-Funktionen und empfohlene Implementierungen zu finden
Bevor ein Agent antwortet, führt er innerhalb eines lokalen Pakets eine semantische Suche durch
Umfang und Struktur der Guidance:
- Derzeit gibt es mehr als 100 Guides
- Die Skills für einzelne Funktionen werden nicht alle als Top-Level-Tools offengelegt, sondern bei Bedarf gefunden und genutzt
Die Guides liefern sowohl die ideale moderne Implementierung als auch empfohlene Fallbacks
Wenn es keine Anforderungen an Browser-Support gibt, geht der Agent standardmäßig von Baseline Widely Available aus
Wenn in AGENTS.md Bedingungen wie „nur Unterstützung für Chrome 144 oder höher“ eingetragen sind, kann der Agent unnötige Fallbacks vermeiden
Das Chrome-Team führt täglich Evaluierungen mit Modellen wie Gemini 3.1, Claude Opus 4.7 und GPT 5.5 durch

Sitzung 9 – What’s new in Firebase

Firebase entwickelt sich zu einer agent-native platform, auf der sowohl Menschen als auch Agenten Apps erstellen und skalieren können
Firebase Data Connect entwickelt sich zu Firebase SQL Connect weiter, das SQL-basierte App-Entwicklung unterstützt
Mit dem custom resolver von Firebase SQL Connect lassen sich Google-Cloud-Dienste wie Cloud Functions und BigQuery anbinden
Firestore unterstützt Geo Search, native Full-Text-Suche und Semantic Match
Firebase AI Logic unterstützt aktuelle Modelle und kann mit Maps Grounding ortsbezogene AI-Funktionen erstellen
Auch die Bildgenerierungssteuerung von Nano Banana kann in Firebase AI Logic genutzt werden
Firebase AI Logic unterstützt lokales und hybrides Inferencing auf iOS, Chrome und Android und fällt auf ein cloud-hosted model zurück, wenn kein lokales Modell vorhanden ist
Dart support for Cloud Functions in Firebase wird als Experimental Preview bereitgestellt
AI Studio ist mit Google Workspace verbunden, sodass Daten aus Sheets, Docs, Gmail und Calendar in Apps genutzt werden können
Firebase agent skills sind auf Android, iOS, Web und Flutter nutzbar, außerdem wird die Unterstützung für Crashlytics erweitert

Sitzung 10 – What’s new in Google Play

Play Billing unterstützt in mehr als 65 Märkten mehr als 300 lokale Zahlungsmethoden
Google Play hat mehr als 890 Millionen kaufbereite Nutzer
Die Auswahl, Google Play Billing zusammen mit alternativen Zahlungen anzubieten, wird ausgeweitet, zudem wurden niedrigere Servicegebühren angekündigt
App Discovery wird auf die Gemini app, Android und das Web ausgeweitet, sodass Nutzer Apps und Spiele innerhalb von Gemini finden können
Statt einer statischen Linkliste empfiehlt Gemini Apps anhand ihrer tatsächlichen Funktionen und der Informationen im Store Listing
Bei einigen Themen können Nutzer von Gemini und Play mehr als 450.000 Film- und TV-Inhalte durchsuchen
In der Play Console kann Gemini Listings vorab ausfüllen, wenn strukturierte Dateien wie Eclipsa Video oder Google Sheets hochgeladen werden
Gemini soll bei Aufgaben in der Play Console wie bulk price changes, import skills und metadata configuration helfen
Mit der in-app subscription management API können Nutzer ihren Abo-Plan direkt in der App einfach ändern
Im vergangenen Jahr hat Google Play Billing versuchten Betrug im Wert von 3,4 Milliarden US-Dollar und missbräuchliche Rückerstattungen im Wert von 130 Millionen US-Dollar verhindert

Sitzung 11 – Defining the agentic AI era

Gemini, Search, die Gemini-App und Google DeepMind behandeln agentische KI in dieselbe Richtung
Gemini 3.5 Flash kann auch innerhalb der Search genutzt werden
Search muss ein Gleichgewicht zwischen schnellen Antworten und längeren agentischen Aufgaben finden
Gemini Spark übernimmt die Rolle eines Always-on-Agenten, der im Hintergrund Aufgaben erledigt, die Nutzer ihm überlassen haben
Modelle müssen über einfache Chat-Antworten hinaus auf die gesamte Google-Produktwelt und das externe Ökosystem aufsetzen
Internes Tool, das von Python nach Go übersetzt wurde:
- Die Aufgabe, ein bestehendes Programm mit Tests in eine andere Sprache zu übersetzen, ist für Modelle ein klarer umrissenes Problem
- Einige interne Tools wurden über Nacht 10- bis 20-mal schneller
Auch Googles interne Software-Infrastruktur kann sich passend zur neuen agentischen Welt schneller verändern
Hardware, Modellgröße, Produkteinsatz und Feedback-Loop müssen zusammenpassen, damit Gemini in die gesamte Google-Produktpalette eingebaut werden kann
Der Fokus der Fragen verschiebt sich von „Was kann das Modell?“ zu „Wie platziert man das Modell in Produkten und Workflows?“

Sitzung 12 - What’s new in Android development tools

Android-Entwicklungstools werden nicht nur für menschliche Entwickler, sondern auch für AI Agents entworfen, die in Codebasen eingesetzt werden
Android Studio Otter unterstützt Gemini-Enterprise- und Google-One-Konten
Android Studio kann lokale und entfernte Modelle einbinden und verwenden
Android Bench dient als Maßstab dafür, welches Modell für Android-Entwicklungsaufgaben geeignet ist
Direkt in Compose Preview kann man UI-Änderungen anfordern, damit der Agent mit besserem Kontext arbeiten kann
Mit dem agent-basierten Assistenten für neue Projekte lassen sich allein per Prompt adaptive Android-Apps erstellen
Android Studio enthält etwa 10 Skills, die bei Aufgaben wie adaptiver API-Integration oder der Umwandlung von XML in Compose helfen
Die neue Android CLI unterstützt LLM-Workflows und reduziert beim Erstellen neuer Projekte den Token-Verbrauch gegenüber anderen Gradle-LLM-Tools um mehr als 70 %
Antigravity CLI, Android CLI und Android Skills lassen sich bündeln, sodass sich auch in Antigravity mit der Android-App-Entwicklung beginnen lässt
In Android Studio Quail und auf Android-17-Geräten bleibt die Geräteverbindung erhalten, selbst wenn man das Netzwerk wechselt oder den Laptop neu startet

Sitzung 13 - What’s new in Flutter

Flutter 3.44 und Dart 3.12 erscheinen gemeinsam
Am Flutter-Projekt haben in diesem Jahr mehr als 1.700 Contributors mitgewirkt
Jeden Monat entwickeln mehr als 1,5 Millionen Entwickler mit Flutter
In Flutter 3.44 kann auf Geräten mit Vulkan-Unterstützung ab Android API 34 ein neuer Rendering-Modus ausprobiert werden
Flutter wird im Infotainment-System des Toyota 2026 RAV4 eingesetzt
Bei Dart-basierten Cloud Functions for Firebase sinkt der Cold Start dank AOT-Kompilierung in manchen Fällen auf 10 ms
Firebase AI Logic erhält serverseitige Prompt-Templates, sodass Prompts nicht direkt in die App eingebettet werden müssen
Firebase Agent Skills for Flutter liefern Agents Anleitungen zum Aufbau von Full-Stack-Apps mit Flutter und Firebase
Unterstützung für LiteRT-LM soll bald in das Paket flutter_gemma aufgenommen werden
Bei Flutter Desktop ist Canonical als Lead Maintainer und strategischer Steward beteiligt

Sitzung 14 - What’s new in the Gemma open model family

Gemma 4 etabliert sich als das leistungsstärkste öffentliche Modell der Gemma-Familie
Es wird in mehreren Größen von 2B bis 31B angeboten und kann auf Mobilgeräten, Laptops und in der Cloud genutzt werden
Gemma startete 2024 als Modellfamilie, die von 1B bis 27B reichte
Gemma 4 ist ein Open-Weights-Modell und mit dem Open-Source-Ökosystem kompatibel
Mit MTP und Speculative Decoding lässt sich die Decoding-Geschwindigkeit um bis zu das Dreifache erhöhen
Für das Android-Ökosystem steht eine Day-zero-Implementierung von Gemma 4 bereit
Über Android-APIs lassen sich kleinere Gemma-Modelle direkt auf dem Smartphone ausführen, oder Android-Apps mit lokalen Gemma-Modellen entwickeln, wenn der Zugriff auf die Gemini API schwierig ist
Mit dem ADK (Agent Development Kit) auf Cloud Run und Gemma 31B werden Agents gebaut, die Datenbanken verstehen und Antworten finden
Gemma 4 lässt sich über die OpenAI-kompatiblen Schnittstellen von Transformers.js, Ollama und LM Studio im Browser oder lokal ausführen
Enterprise-Cloud, lokale Maschinen, Browser und Mobilgeräte werden alle zu Laufzeitumgebungen für Gemma

Sitzung 15 - What’s new in Web UI

Die Web-UI-Updates 2026 behandeln wichtige Funktionen zusammen mit ihrem Baseline-Status
Alle Funktionen erhalten Kompatibilitätskennzeichnungen wie Baseline Widely Available, Newly Available oder Limited Available
Mit der contrast-color API lassen sich in CSS leichter Farben mit passendem Kontrast wählen
Die Funktion meta name="text-scale" in Chrome 146 reagiert auf die systemweiten Einstellungen für die Schriftgröße
Bei Nutzern von Android und iOS ändern jeweils mehr als 30 % die Standard-Schriftgröße
Seit Chrome 134 unterstützt das Dialog-Element Funktionen wie Declarative Light Dismiss von Popover
Two-phase View Transitions können in Chrome Canary getestet werden
Scroll-driven Animations wurden 2023 in Chrome eingeführt und verbessern über Interop 2026 die Interoperabilität
Die HTML-in-Canvas API ermöglicht es, echte DOM-Inhalte in Canvas einzubetten
In Chrome 149 kommen Gap Decorations und neue Einsatzmöglichkeiten für Shape Outside hinzu

Sitzung 16 - Adaptive development for the expanding Android ecosystem

Android ist nicht mehr nur ein Ökosystem für Smartphones; mehr als 580 Millionen aktive Großbildgeräte profitieren von Investitionen in adaptive Apps
Nutzer von Foldables werden bei adaptiven Apps als besonders wertvolle Nutzergruppe eingestuft
In Android 17 wird für target SDK 37 die Möglichkeit abgeschafft, sich von orientation und resizability abzumelden
Der Desktop emulator in Android Studio Quail Canary unterstützt das Testen von Android-Apps in Desktop-Form
Mit der Continue On API in Android 17 können Nutzer ihre Arbeit von einem Gerät auf einem zweiten Gerät fortsetzen
Google verstärkt den Trend, Android-Apps Compose-first zu entwickeln
Compose 1.11 verbessert die Trackpad-Unterstützung auf Mouse- und Pointer-Niveau und fügt eine Testing-API für Non-Touch-Eingaben hinzu
Für zustandsbasiertes Styling wurde Compose eine experimentelle API hinzugefügt
Connected Displays wird über den Android Feature Drop allgemein verfügbar gemacht
Compose, Navigation 3 und die Compose Adaptive-Bibliothek unterstützen verschiedene Displays wie Foldables, Desktop, Auto, TV und XR

Sitzung 17 – Building the quantum-AI future with Hartmut Neven and James Manyika

Der zentrale Schwerpunkt ist, wie sich Quantencomputing und AI gegenseitig beschleunigen
Hartmut Neven startete 2012 Googles Quantum-AI-Team
superposition und qubit bilden die Grundlage des Quantencomputings
Die Zahl möglicher Bitstrings auf einem 105-qubit-Chip beträgt 2 hoch 105
Die Community hat derzeit mehr als 70 Algorithmen und Probleme identifiziert, die Quantencomputer sinnvoll lösen können
Diese Zahl könnte sich künftig mehr als verzehnfachen
quantum error correction ist eine Schlüsseltechnologie, um den Zustand der Superposition aufrechtzuerhalten
Google gelang es 2022, mit quantum error correction die Fehler realer Maschinen zu verringern
Quantum Echoes steht in Verbindung mit Verfahren zum Lernen aus Daten aus NMR oder MRI
Google vertritt die Ansicht, dass der Übergang zu post-quantum cryptography bis 2029 deutlich robuster vorangetrieben werden sollte

Sitzung 18 – Scale AI with Google’s TPU software stack

Behandelt wird ein Open-Source-Software-Stack zum Trainieren, Fine-Tuning und Ausführen von Inferenz für Modelle auf TPU
Der Modellentwicklungsprozess ist in Pre-Training, Post-Training und Serving/Inferenz unterteilt
Mit den kostenlosen TPUs in Kaggle und Colab lassen sich Post-Training und Inferenz ausprobieren
Die Demo vLLM on TPU führt das Modell Gemma 4 31B auf TPU aus und fasst anhand eines Essensbildes Nährwertinformationen zusammen
Gemma 4 ist ein multimodales Modell, das sich gut dafür eignet, Bilder zu verstehen und Inhalte zusammenzufassen
Durch die Integration von MTP in vLLM TPU inference wurde in mehreren Aufgaben eine Beschleunigung von rund 3x erreicht
Tunix ist ein leichtgewichtiges Framework für Post-Training
Statt eines großen Modells wird ein 4B-Modell feinabgestimmt, damit es dieselbe Aufgabe übernimmt, und auf einem einzelnen Trillium-Chip ausgeführt
MaxText, Tunix, vLLM, JAX, PyTorch und TPU sind als Werkzeuge entlang des Modelllebenszyklus angeordnet

Sitzung 19 – Supercharge your AI coding workflow with Chrome DevTools for agents

Chrome DevTools for agents ist ein Tool, mit dem Coding-Agenten die Browser-Runtime über DevTools direkt beobachten können
So wie menschliche Entwickler mit DevTools lernen und debuggen, sollten auch Coding-Agenten denselben geschlossenen Feedback-Loop haben
Agenten können eine echte Chrome-Instanz öffnen, Seiten durchsuchen, Formulare ausfüllen sowie console log und network request erfassen
Über den Zugriff auf source maps kann von Laufzeitproblemen direkt zur relevanten Quelldatei gesprungen werden
Das Tool wird als NPM package bereitgestellt und enthält zusammen einen MCP server und eine CLI
Sechs bereitgestellte Skills:
- troubleshooting, Chrome DevTools und Chrome DevTools CLI skill helfen bei allgemeiner Nutzung und Konzepten
- accessibility debugging, memory leak debugging und optimized LCP skill bringen spezialisiertes Fachwissen in den Agenten ein
Die Implementierung basiert auf Puppeteer; Agenten verwenden statt direktem Puppeteer-Zugriff den Tool-Wrapper
Standardmäßig wird ein separates anonymes Browser-Profil verwendet, ohne Zugriff auf den Chrome password manager
CyberAgent prüfte mit DevTools for agents 236 Storybook-Stories aus 32 Komponenten in weniger als einer Stunde

Sitzung 20 – A new era of discovery: AI and the frontiers of science with Demis Hassabis

Demis Hassabis definierte das ursprüngliche Ziel von DeepMind als „solve intelligence“
Zentrales Thema ist, wie AI wissenschaftliche Entdeckungen, Produkte und Forschungstools verändert
AlphaFold wird erneut als Beispiel dafür genannt, ein 50 Jahre altes Problem der Proteinstruktur gelöst zu haben
Gemini for Science knüpft an die im Keynote vorgestellte Entwicklung wissenschaftlicher Modelle an
Demis Hassabis beschreibt die Gegenwart als die „foothills of the singularity“ und sieht den Zeitpunkt, an dem intelligence gelöst wird, bei ungefähr 2030 ± 1 Jahr
Modelle der Genie-Reihe werden von Waymo genutzt, um in der Realität schwer beobachtbare 1 in a billion-Situationen zu testen
Die Fortschritte von Isomorphic Labs in der drug discovery dienen als Beispiel dafür, wie AI die Wissenschaft beschleunigt
Die Gemini-App hat monatlich 900 Millionen Nutzer, und AI Mode in Search ist ebenfalls zu einer wichtigen Produktoberfläche geworden
AI wird über Produktfunktionen hinaus als Werkzeug zur Lösung wissenschaftlicher und forschungsbezogener Probleme eingesetzt

Sitzung 21 – A fireside chat on the evolution of the developer craft

In der AI-Ära verlagert sich die Arbeit von Entwicklern vom Schreiben von Code hin zu Systemdesign, Dokumentation und Orchestrierung
Zwar erscheinen ständig neue Tools und Modelle, aber man muss nicht jedem Trend sofort folgen und sollte bewusst auswählen, was man lernen will
Agenten ins Team zu holen ist ähnlich, als würde man mehrere Junior Engineers einstellen; dadurch werden interne Dokumentation und Aufzeichnungen von Designentscheidungen wichtiger
Für einen guten agentic workflow muss festgelegt werden, wofür ein einzelner Agent verantwortlich ist, wie mehrere Agenten miteinander kommunizieren und an welcher Stelle Menschen die Aufsicht übernehmen
Die UX vieler Coding-Tools ähnelt sich zunehmend, sodass sich in einem Tool gelernte Muster auch auf andere übertragen lassen
Bei der Arbeit mit Agenten muss man einen Teil der Kontrolle über den Weg loslassen und stattdessen Ergebnisse und Designabsichten abstimmen
Technical debt, cognitive debt und intent debt können sich mit AI schneller verbessern oder schneller verschlechtern
20 Agenten gleichzeitig laufen zu lassen kann die menschliche kognitive Kapazität übersteigen und muss daher bewusst gesteuert werden
Gute Prompt-Gewohnheiten entwickeln sich weg von Suchwortfragmenten hin zu vollständigen Zielen mit Kontext
Wichtiger als die Frage „Schreibe ich jeden Code selbst?“ ist, ob man Kontext und ein Validierungssystem geschaffen hat, in denen Agenten arbeiten können

Sitzung 22 – Build core skills to thrive as an AI-era developer

Auch im AI-Zeitalter werden grundlegende Software-Engineering-Fähigkeiten noch wichtiger
AI kann ein Force Multiplier sein, aber um Ergebnisse zu bewerten, zu integrieren und zu warten, ist tiefes Fachwissen nötig
Je autonomer Agenten arbeiten, desto mehr braucht es ein Shift-left, bei dem die Intent frühzeitig klar definiert wird
System Design weitet sich zu einem Konzept aus, das auch Umfeld, Menschen, Agenten, Tools und Kultur umfasst
Teams sollten Agenten nicht nur out of the box einsetzen, sondern Agent Role, Profile, Recipe, Rule und Skill selbst erstellen und pflegen
Specs, Agent Rules und Skills werden zur Source of Truth, die dem Agenten das What und Why des Systems vermittelt
Um realistische Evals zu erstellen, braucht es gemeinsam Kompetenzen in AI, Software Engineering, Nutzerverständnis und Business
Es muss ein Feedback-Loop aufgebaut werden, der durch die Analyse von Agent Traces die Tool-Usability, Agent Skills und das System Design verbessert
Menschliche Engineers wechseln von der Rolle des Conductors einzelner Agenten zur Rolle des Orchestrators mehrerer asynchroner Agenten-Teams
Um ein System aus der Perspektive böswilliger Akteure zu betrachten, kann explizit ein Red Team Agent eingesetzt werden

Session 23 - Software engineering at the tipping point

Wenn AI das Schreiben von Code beschleunigt, gerät das gesamte Entwicklungsökosystem auf der Ebene der Software Ecology unter Druck
Bei Google liegt der gesamte Code, einschließlich Android und Chrome, in einem gemeinsamen Monorepo und wird auf den Trunk committed
Google nutzt seit Langem interne Tools, mit denen ein einzelner Entwickler Millionen Zeilen Code ändern kann
Es ist sehr wahrscheinlich, dass das heutige Entwicklungsökosystem 10-fache Geschwindigkeit nicht bewältigen kann
Wenn Agenten mehr Kompilierungen, Tests, Commits und Token-Verbrauch erzeugen, steigen Infrastrukturkosten und Bottlenecks
Agenten können Code erzeugen, der leicht zu schreiben ist, aber nicht unbedingt Code, der für Menschen leicht wartbar ist
Es braucht agentische Skills für Component Reuse und Component Isolation, die Wiederverwendung und Isolation erzwingen
APIs und Datenzugriffe müssen so robust abgesichert werden, als wären sie für Agenten faktisch öffentlich
Der Satz „agents will find things you probably didn't want them to“ zeigt das Risiko beim Design von Berechtigungen
Im Entwicklungsökosystem des Jahres 2030 könnte die heutige Arbeitsweise so veraltet wirken wie die CD-ROM-Ära von 2001

Session 24 - Vibe once, run anywhere with Google Antigravity and Flutter

Mit Antigravity und Flutter zusammen lässt sich eine einmal entwickelte Idee auf mehrere Plattformen ausweiten
Seit der Einführung von Gemini 3 sind die Modellfähigkeiten stark gestiegen, und Antigravity unterstützt diese Fähigkeiten von Anfang an
Im Kern von Antigravity steht ein Feedback-Loop, in dem Planung, Ausführung und Verifizierung eng verzahnt sind
Antigravity erstellt eine Task List und einen Implementation Plan, hinterlässt während der Ausführung Screenshots und Videos und verfasst nach Abschluss einen Bericht mit der Implementierung und den Gründen dafür
In der Verifizierungsphase folgen aufeinander App-Start, Screenshot-Aufnahme, Klicks auf Chrome-Buttons und Testausführung
In Flutter liefern die starke Typisierung von Dart und der Analysis Server dem LLM objektive Fehlersignale wie Funktionssignaturen und Klassenstrukturen
Flutter ist ein Cross-Platform-UI-Toolkit, das dieselben Pixel und Funktionen auf mehreren Displays bereitstellt
Das Stateful Hot Reload von Flutter bietet eine Entwicklungserfahrung, bei der die laufende App in unter 1 Sekunde neu gebaut wird
Je mehr Code Agenten erzeugen, desto stärker müssen Menschen die Designziele und Produktrichtung vorgeben und die Ergebnisse der Agenten prüfen
Antigravity liefert den Ausführungs-Loop für Agenten, und Flutter sorgt plattformübergreifend für konsistente Ergebnisse, wodurch ein „vibe once, run anywhere“-Flow entsteht

1 Kommentare

hmmhmmhm 1 시간 전

Flash ist viel zu teuer, ich werde jetzt für immer beim Gemma-Hosting von OpenRouter bleiben