- Die zentralen Schwerpunkte sind Gemini 3.5 Flash, Gemini Omni Flash, Antigravity 2.0, Google AI Studio, Gemma 4, Android 17, Chrome/Web, Firebase, Google Play und Developer-Skills im AI-Zeitalter
- Google stellt nicht nur Modellankündigungen in den Mittelpunkt, sondern den Entwicklungsfluss, in dem Agenten tatsächlich auf Produkte, Browser, Cloud, Mobile-Apps, Daten, Dokumente und Testumgebungen zugreifen
- Entwickler-Tools gehen über das reine Schreiben von Code hinaus und erweitern sich auf Planung, Ausführung, Verifikation, Debugging, Deployment, Evaluierung und die Koordination mehrerer Agenten
- Android, Flutter, Chrome, Firebase und Google Play werden alle so erweitert, dass Gemini und Agenten-Tools in bestehende Entwicklungsabläufe integriert werden
- Größere Engpässe als das Schreiben von Code sind inzwischen Validierungskosten, Bereitstellung von Kontext, Zugriffsrechte auf Tools, Runtime-Beobachtung, Testinfrastruktur sowie die Dokumentation und Systemarchitektur einer Organisation
Sitzung 1 - Google keynote
- Jeden Monat erstellen mehr als 8,5 Millionen Menschen Apps und Experiences mit Google-Modellen
- Die Modell-APIs von Google verarbeiten etwa 19 Milliarden Tokens pro Minute
- Nutzung von AI Search:
- AI Overviews werden monatlich von mehr als 2,5 Milliarden Menschen genutzt
- AI Mode wird monatlich von mehr als 1 Milliarde Menschen genutzt
- Die monatlich aktiven Nutzer der Gemini app stiegen seit der I/O im vergangenen Jahr von 400 Millionen auf mehr als 900 Millionen
- Mit dem Modell Nano Banana wurden mehr als 50 Milliarden Bilder erzeugt
- Gemini 3.5 Flash ist produktübergreifend und über die API verfügbar; die Kernmerkmale sind schnelle Ausführung und Kosteneffizienz
- Gemini Omni Flash ist das erste Modell der Omni-Familie und zielt darauf ab, multimodale Ein- und Ausgaben umfassender zu verarbeiten
- Antigravity 2.0 ist eine eigenständige Desktop-App, die weltweit verfügbar ist und Agentengespräche, Projekte und Aufgabenmanagement auf einem Bildschirm zusammenführt
- Große Antigravity-Demo:
- Mit 93 Sub-Agenten, mehr als 15.000 Modellanfragen und 2,6 Milliarden Tokens wurde aus einem leeren Projekt ein funktionsfähiger Betriebssystem-Kern erstellt
- Mithilfe der Leistung und Kosteneffizienz von Gemini 3.5 Flash lief dies mit API-Credits von unter 1.000 US-Dollar
Sitzung 2 - Developer keynote
- Google zeigt für Entwickler einen Ansatz, der Modelle, Agenten-Tools, Nutzerplattformen und Infrastruktur zusammenführt
- Managed agents kommen in die Gemini API, sodass sich ein Agenten-Harness wie Antigravity in API-Form nutzen lässt
- Google Antigravity 2.0 ist eine agentenzentrierte Desktop-App, in der mehrere Agenten Entwicklungsaufgaben übernehmen
- Mit dem Antigravity SDK lassen sich Agenten-Workflows direkt anpassen und bereitstellen
- In Google AI Studio können neue Nutzer ohne Kreditkarte direkt auf Cloud Run deployen
- Durch die Integration mit Google Workspace kann AI Studio Workspace-Daten im App-Erstellungs-Workflow verwenden
- In Google AI Studio ist nun ein Workflow möglich, der Ideen direkt in Android-Apps umsetzt
- Gemma 4:
- Wird unter der Apache-2-Lizenz angeboten
- Erreichte im ersten Monat 100 Millionen Downloads
- Die gesamten Gemma-Downloads stiegen auf mehr als 500 Millionen
- Chrome DevTools for Agents können in Antigravity und in mehr als 20 Coding-Agenten verwendet werden
- Gemma 4 wurde mit LoRA feinabgestimmt, um Bash-Befehlsantworten zu erzeugen, die direkt in CI-Pipelines nutzbar sind, und dann auf einem lokalen Notebook bereitzustellen
Sitzung 3 - Agent-first workflows from prompt to production
- In AI Studio erstellte Apps werden mit Cloud Run und Firebase deployt; anschließend wird auch Debugging und Analyse in der Produktionsphase in einen Agenten-Workflow eingebunden
- Über mehr als 50 verwaltete MCP-Server greifen Agenten auf Google-Cloud-Tools und Daten zu
- Developer Knowledge MCP speist aktuelle Informationen auf Basis der Google-Dokumentation in Agenten-Tools ein und reduziert so Probleme mit veralteten Dokumenten
- Aktuelle Dokumentations-Snapshots werden in etwa alle 8 bis 12 Stunden in Agenten-Tools eingespeist
- Mit Data Agent Kit und BigQuery MCP werden Firestore-, BigQuery- und Log-Daten analysiert und Dashboards erstellt
- Antigravity kann App-Fehler untersuchen, relevante Dateien finden und anpassen und den Prozess bis zu einem GitHub-Commit fortführen
- Ein auf Cloud Run bereitgestellter remediation agent und ein CI agent sind mit Eventarc, Pub/Sub und Gemini verbunden, um Fehler zu untersuchen und zu beheben
- Mehrere Agenten übergeben sich Aufgaben im A2A(agent-to-agent)-Verfahren
- Agentenentwicklung endet nicht bei der Prototyperstellung, sondern erweitert sich auf Deployment, Monitoring, Datenanalyse und automatische Wiederherstellung
Sitzung 4 - What’s new in Android
- Android 17 ergänzt Speicherlimits und zugehörige Tools, damit übermäßiger Speicherverbrauch von Apps die User Experience nicht beeinträchtigt
- Android 17 nimmt Bedingungen wie excessive memory, cold start und excessive CPU automatisch in die Analyse auf
- Apps, die auf Android 17 abzielen, benötigen die Berechtigung ACCESS_LOCAL_NETWORK, um Geräte im lokalen Netzwerk zu finden und sich mit ihnen zu verbinden
- Google verstärkt den Kurs, Android-UIs mit Jetpack Compose zu erstellen
- Compose 1.10 und Compose 1.11 enthalten Verbesserungen bei Performance, hybrid UI und neuen APIs
- Die Integration von AppFunctions und Gemini befindet sich in der geschlossenen Preview; Apps können dabei zum Ziel der Gemini-Orchestrierung werden
- Mit der Developer Preview der ML Kit Prompt API lassen sich einige neue Funktionen testen
- Android 17 bietet Eclipsa Video, verbesserte HE-AAC-Sprachqualität sowie Kamera- und Medienverbesserungen auf Basis von CameraX und Media3
- Apps für große Bildschirme bewegen sich mit Navigation 3 und der Bibliothek Compose Adaptive in eine Richtung, die sich weniger an bisherigen Mobile-Beschränkungen orientiert
- Compose 1.6 für Wear OS unterstützt Navigation 3 und einen mode manager zur Verwaltung von Inhalten im Energiesparmodus
Sitzung 5 - What’s new in Chrome
- Chrome konzentriert sich darauf, Websites so zu gestalten, dass sie für Nutzer mit Agenten und agentischen Tools gut funktionieren
- Statt sich nur auf das Grundwissen von Modellen zu verlassen, will Chrome aktuelles Baseline und Web-Features mit Entwickler-Tools verbinden
- Seit dem vergangenen Jahr haben 55 Funktionen den Status Baseline Widely Available erreicht
- Zum Zeitpunkt der Ankündigung befinden sich 52 Funktionen im Status Baseline Newly Available
- Da Chrome alle vier Wochen aktualisiert wird, erzeugen Coding-Agenten leicht veraltete Implementierungen, wenn ihnen aktuelle Web-Features nicht bekannt sind
- Die Prompt API von Chrome wird in Chrome 148 verfügbar sein
- Navigation API, View Transitions, HTML-in-Canvas und declarative partial updates werden in den Entwicklungsworkflow aufgenommen
- Entwickler von Chrome-Erweiterungen können Installation, Service Worker, side panel und popup automatisch prüfen und debuggen
- Chrome erweitert sich in die Richtung, Agenten High-Level-Skills für Web-Performance, identity und security sowie Leitfäden für mehr als 100 gängige Anwendungsfälle bereitzustellen
- Wenn Agenten mit aktuellen Web-Features und Informationen zur Browser-Unterstützung versorgt werden, lässt sich die Wiederholung veralteter Kompatibilitätsmuster reduzieren
Sitzung 6 – What’s new in Google AI
- Die Gemini-Modellfamilie ist eine multimodale Modellfamilie, die Texte, Bilder, Audio, Video und Code als Eingaben sowie verschiedene Ausgabeformen verarbeiten kann
- Rollen von Gemini 3.5 Pro und Flash:
- Gemini 3.5 Pro ist auf das Lösen komplexer Probleme fokussiert
- Gemini 3.5 Flash übernimmt die Balance aus Leistung, Geschwindigkeit und Kosten
- Die Build-Funktion in AI Studio verwendet 3.5 Flash als Standardmodell
- Nano Banana 2 kann direkt in AI Studio ausprobiert werden
- Gemini Omni Flash ist ein Modell, das aus Eingaben Ausgaben einschließlich Video erzeugen kann
- Gemini Live und die Live API unterstützen sprachbasierte Interaktionen
- Die Interactions API ist eine Funktion für die Interaktion mit Agenten innerhalb von AI Studio
- Zugänglichkeit von Gemma 4:
- Kann im AI Studio playground getestet werden
- Teilweise sind auch kostenlose Aufrufe über die Gemini API möglich
- Verfügt über ein Kontextfenster von 256.000 Tokens und ist auf Hugging Face zu finden
- Ebenfalls vorgestellt wurden Gemini Robotics 1.6, Genie 3, Antigravity 2.0 sowie eine Strategie zur Kostensenkung durch die Mischung aus offenen und proprietären Modellen
Sitzung 7 – Build next-gen AI experiences with Google AI Studio and Google Antigravity
- Google AI Studio erweitert sich über einen Model-Playground hinaus zu einem Ort, an dem Ideen in Apps verwandelt und bereitgestellt werden
- Modelle, Agenten, App-Erstellung, Workspace-Integration und Cloud-Run-Deployment sind in einem durchgängigen Ablauf zusammengeführt
- Der App-Bereich von AI Studio soll bald verfügbar sein und App-Erstellung sowie Deployment direkter abdecken
- Hinzugekommen ist eine Funktion, mit der in AI Studio erstellter Code mit einem Klick nach Antigravity exportiert werden kann
- Antigravity 2.0 übernimmt nicht nur das Schreiben von Code, sondern die Rolle einer Mission Control, die verschiedene Aufgaben über Agenten koordiniert
- Antigravity 2.0 stellt task list, implementation plan und die Prüfung geänderter Dateien in den Mittelpunkt des Ablaufs
- Code-Review und die Prüfung von Änderungen lassen sich direkt in Antigravity 2.0 erledigen
- Die Struktur ist darauf ausgelegt, schwere Aufgaben wie Browser-Tests, Planung, Funktionsentwicklung über mehrere Dateien und End-to-End-Validierung an Agenten zu übergeben
- Mit Google AI Studio lässt sich in etwa 20 Minuten eine neue Business-App erstellen und anschließend mit Antigravity weiterentwickeln
- Google AI Studio ist ein schneller Startpunkt für „prompt to app“, während Antigravity das Werkzeug ist, um daraus echte Entwicklungsarbeit zu machen
Sitzung 8 – Unlock modern web capabilities in your AI coding workflows
- Wenn Coding-Agenten moderne Web-Funktionen nicht kennen, erzeugen sie leicht Code nach veralteten Standards für Browser-Kompatibilität
- Chrome hat im vergangenen Jahr 50 neue Funktionen veröffentlicht, doch wegen des Knowledge-Cutoff vieler Modelle erreichen diese Funktionen die Modelle oft nicht
- Im Beispiel zur Interest Invokers API zeigte sich das Problem, dass ein Agent den alten Attributnamen
interesttargetverwendet - Modern Web Guidance ist ein Wissenspaket, das Agenten dabei hilft, aktuelle Web-Funktionen und empfohlene Implementierungen zu finden
- Bevor ein Agent antwortet, führt er innerhalb eines lokalen Pakets eine semantische Suche durch
- Umfang und Struktur der Guidance:
- Derzeit gibt es mehr als 100 Guides
- Die Skills für einzelne Funktionen werden nicht alle als Top-Level-Tools offengelegt, sondern bei Bedarf gefunden und genutzt
- Die Guides liefern sowohl die ideale moderne Implementierung als auch empfohlene Fallbacks
- Wenn es keine Anforderungen an Browser-Support gibt, geht der Agent standardmäßig von Baseline Widely Available aus
- Wenn in
AGENTS.mdBedingungen wie „nur Unterstützung für Chrome 144 oder höher“ eingetragen sind, kann der Agent unnötige Fallbacks vermeiden - Das Chrome-Team führt täglich Evaluierungen mit Modellen wie Gemini 3.1, Claude Opus 4.7 und GPT 5.5 durch
Sitzung 9 – What’s new in Firebase
- Firebase entwickelt sich zu einer agent-native platform, auf der sowohl Menschen als auch Agenten Apps erstellen und skalieren können
- Firebase Data Connect entwickelt sich zu Firebase SQL Connect weiter, das SQL-basierte App-Entwicklung unterstützt
- Mit dem custom resolver von Firebase SQL Connect lassen sich Google-Cloud-Dienste wie Cloud Functions und BigQuery anbinden
- Firestore unterstützt Geo Search, native Full-Text-Suche und Semantic Match
- Firebase AI Logic unterstützt aktuelle Modelle und kann mit Maps Grounding ortsbezogene AI-Funktionen erstellen
- Auch die Bildgenerierungssteuerung von Nano Banana kann in Firebase AI Logic genutzt werden
- Firebase AI Logic unterstützt lokales und hybrides Inferencing auf iOS, Chrome und Android und fällt auf ein cloud-hosted model zurück, wenn kein lokales Modell vorhanden ist
- Dart support for Cloud Functions in Firebase wird als Experimental Preview bereitgestellt
- AI Studio ist mit Google Workspace verbunden, sodass Daten aus Sheets, Docs, Gmail und Calendar in Apps genutzt werden können
- Firebase agent skills sind auf Android, iOS, Web und Flutter nutzbar, außerdem wird die Unterstützung für Crashlytics erweitert
Sitzung 10 – What’s new in Google Play
- Play Billing unterstützt in mehr als 65 Märkten mehr als 300 lokale Zahlungsmethoden
- Google Play hat mehr als 890 Millionen kaufbereite Nutzer
- Die Auswahl, Google Play Billing zusammen mit alternativen Zahlungen anzubieten, wird ausgeweitet, zudem wurden niedrigere Servicegebühren angekündigt
- App Discovery wird auf die Gemini app, Android und das Web ausgeweitet, sodass Nutzer Apps und Spiele innerhalb von Gemini finden können
- Statt einer statischen Linkliste empfiehlt Gemini Apps anhand ihrer tatsächlichen Funktionen und der Informationen im Store Listing
- Bei einigen Themen können Nutzer von Gemini und Play mehr als 450.000 Film- und TV-Inhalte durchsuchen
- In der Play Console kann Gemini Listings vorab ausfüllen, wenn strukturierte Dateien wie Eclipsa Video oder Google Sheets hochgeladen werden
- Gemini soll bei Aufgaben in der Play Console wie bulk price changes, import skills und metadata configuration helfen
- Mit der in-app subscription management API können Nutzer ihren Abo-Plan direkt in der App einfach ändern
- Im vergangenen Jahr hat Google Play Billing versuchten Betrug im Wert von 3,4 Milliarden US-Dollar und missbräuchliche Rückerstattungen im Wert von 130 Millionen US-Dollar verhindert
Sitzung 11 – Defining the agentic AI era
- Gemini, Search, die Gemini-App und Google DeepMind behandeln agentische KI in dieselbe Richtung
- Gemini 3.5 Flash kann auch innerhalb der Search genutzt werden
- Search muss ein Gleichgewicht zwischen schnellen Antworten und längeren agentischen Aufgaben finden
- Gemini Spark übernimmt die Rolle eines Always-on-Agenten, der im Hintergrund Aufgaben erledigt, die Nutzer ihm überlassen haben
- Modelle müssen über einfache Chat-Antworten hinaus auf die gesamte Google-Produktwelt und das externe Ökosystem aufsetzen
- Internes Tool, das von Python nach Go übersetzt wurde:
- Die Aufgabe, ein bestehendes Programm mit Tests in eine andere Sprache zu übersetzen, ist für Modelle ein klarer umrissenes Problem
- Einige interne Tools wurden über Nacht 10- bis 20-mal schneller
- Auch Googles interne Software-Infrastruktur kann sich passend zur neuen agentischen Welt schneller verändern
- Hardware, Modellgröße, Produkteinsatz und Feedback-Loop müssen zusammenpassen, damit Gemini in die gesamte Google-Produktpalette eingebaut werden kann
- Der Fokus der Fragen verschiebt sich von „Was kann das Modell?“ zu „Wie platziert man das Modell in Produkten und Workflows?“
Sitzung 12 - What’s new in Android development tools
- Android-Entwicklungstools werden nicht nur für menschliche Entwickler, sondern auch für AI Agents entworfen, die in Codebasen eingesetzt werden
- Android Studio Otter unterstützt Gemini-Enterprise- und Google-One-Konten
- Android Studio kann lokale und entfernte Modelle einbinden und verwenden
- Android Bench dient als Maßstab dafür, welches Modell für Android-Entwicklungsaufgaben geeignet ist
- Direkt in Compose Preview kann man UI-Änderungen anfordern, damit der Agent mit besserem Kontext arbeiten kann
- Mit dem agent-basierten Assistenten für neue Projekte lassen sich allein per Prompt adaptive Android-Apps erstellen
- Android Studio enthält etwa 10 Skills, die bei Aufgaben wie adaptiver API-Integration oder der Umwandlung von XML in Compose helfen
- Die neue Android CLI unterstützt LLM-Workflows und reduziert beim Erstellen neuer Projekte den Token-Verbrauch gegenüber anderen Gradle-LLM-Tools um mehr als 70 %
- Antigravity CLI, Android CLI und Android Skills lassen sich bündeln, sodass sich auch in Antigravity mit der Android-App-Entwicklung beginnen lässt
- In Android Studio Quail und auf Android-17-Geräten bleibt die Geräteverbindung erhalten, selbst wenn man das Netzwerk wechselt oder den Laptop neu startet
Sitzung 13 - What’s new in Flutter
- Flutter 3.44 und Dart 3.12 erscheinen gemeinsam
- Am Flutter-Projekt haben in diesem Jahr mehr als 1.700 Contributors mitgewirkt
- Jeden Monat entwickeln mehr als 1,5 Millionen Entwickler mit Flutter
- In Flutter 3.44 kann auf Geräten mit Vulkan-Unterstützung ab Android API 34 ein neuer Rendering-Modus ausprobiert werden
- Flutter wird im Infotainment-System des Toyota 2026 RAV4 eingesetzt
- Bei Dart-basierten Cloud Functions for Firebase sinkt der Cold Start dank AOT-Kompilierung in manchen Fällen auf 10 ms
- Firebase AI Logic erhält serverseitige Prompt-Templates, sodass Prompts nicht direkt in die App eingebettet werden müssen
- Firebase Agent Skills for Flutter liefern Agents Anleitungen zum Aufbau von Full-Stack-Apps mit Flutter und Firebase
- Unterstützung für LiteRT-LM soll bald in das Paket
flutter_gemmaaufgenommen werden - Bei Flutter Desktop ist Canonical als Lead Maintainer und strategischer Steward beteiligt
Sitzung 14 - What’s new in the Gemma open model family
- Gemma 4 etabliert sich als das leistungsstärkste öffentliche Modell der Gemma-Familie
- Es wird in mehreren Größen von 2B bis 31B angeboten und kann auf Mobilgeräten, Laptops und in der Cloud genutzt werden
- Gemma startete 2024 als Modellfamilie, die von 1B bis 27B reichte
- Gemma 4 ist ein Open-Weights-Modell und mit dem Open-Source-Ökosystem kompatibel
- Mit MTP und Speculative Decoding lässt sich die Decoding-Geschwindigkeit um bis zu das Dreifache erhöhen
- Für das Android-Ökosystem steht eine Day-zero-Implementierung von Gemma 4 bereit
- Über Android-APIs lassen sich kleinere Gemma-Modelle direkt auf dem Smartphone ausführen, oder Android-Apps mit lokalen Gemma-Modellen entwickeln, wenn der Zugriff auf die Gemini API schwierig ist
- Mit dem ADK (Agent Development Kit) auf Cloud Run und Gemma 31B werden Agents gebaut, die Datenbanken verstehen und Antworten finden
- Gemma 4 lässt sich über die OpenAI-kompatiblen Schnittstellen von Transformers.js, Ollama und LM Studio im Browser oder lokal ausführen
- Enterprise-Cloud, lokale Maschinen, Browser und Mobilgeräte werden alle zu Laufzeitumgebungen für Gemma
Sitzung 15 - What’s new in Web UI
- Die Web-UI-Updates 2026 behandeln wichtige Funktionen zusammen mit ihrem Baseline-Status
- Alle Funktionen erhalten Kompatibilitätskennzeichnungen wie Baseline Widely Available, Newly Available oder Limited Available
- Mit der contrast-color API lassen sich in CSS leichter Farben mit passendem Kontrast wählen
- Die Funktion
meta name="text-scale"in Chrome 146 reagiert auf die systemweiten Einstellungen für die Schriftgröße - Bei Nutzern von Android und iOS ändern jeweils mehr als 30 % die Standard-Schriftgröße
- Seit Chrome 134 unterstützt das Dialog-Element Funktionen wie Declarative Light Dismiss von Popover
- Two-phase View Transitions können in Chrome Canary getestet werden
- Scroll-driven Animations wurden 2023 in Chrome eingeführt und verbessern über Interop 2026 die Interoperabilität
- Die HTML-in-Canvas API ermöglicht es, echte DOM-Inhalte in Canvas einzubetten
- In Chrome 149 kommen Gap Decorations und neue Einsatzmöglichkeiten für Shape Outside hinzu
Sitzung 16 - Adaptive development for the expanding Android ecosystem
- Android ist nicht mehr nur ein Ökosystem für Smartphones; mehr als 580 Millionen aktive Großbildgeräte profitieren von Investitionen in adaptive Apps
- Nutzer von Foldables werden bei adaptiven Apps als besonders wertvolle Nutzergruppe eingestuft
- In Android 17 wird für target SDK 37 die Möglichkeit abgeschafft, sich von orientation und resizability abzumelden
- Der Desktop emulator in Android Studio Quail Canary unterstützt das Testen von Android-Apps in Desktop-Form
- Mit der Continue On API in Android 17 können Nutzer ihre Arbeit von einem Gerät auf einem zweiten Gerät fortsetzen
- Google verstärkt den Trend, Android-Apps Compose-first zu entwickeln
- Compose 1.11 verbessert die Trackpad-Unterstützung auf Mouse- und Pointer-Niveau und fügt eine Testing-API für Non-Touch-Eingaben hinzu
- Für zustandsbasiertes Styling wurde Compose eine experimentelle API hinzugefügt
- Connected Displays wird über den Android Feature Drop allgemein verfügbar gemacht
- Compose, Navigation 3 und die Compose Adaptive-Bibliothek unterstützen verschiedene Displays wie Foldables, Desktop, Auto, TV und XR
Sitzung 17 – Building the quantum-AI future with Hartmut Neven and James Manyika
- Der zentrale Schwerpunkt ist, wie sich Quantencomputing und AI gegenseitig beschleunigen
- Hartmut Neven startete 2012 Googles Quantum-AI-Team
- superposition und qubit bilden die Grundlage des Quantencomputings
- Die Zahl möglicher Bitstrings auf einem 105-qubit-Chip beträgt 2 hoch 105
- Die Community hat derzeit mehr als 70 Algorithmen und Probleme identifiziert, die Quantencomputer sinnvoll lösen können
- Diese Zahl könnte sich künftig mehr als verzehnfachen
- quantum error correction ist eine Schlüsseltechnologie, um den Zustand der Superposition aufrechtzuerhalten
- Google gelang es 2022, mit quantum error correction die Fehler realer Maschinen zu verringern
- Quantum Echoes steht in Verbindung mit Verfahren zum Lernen aus Daten aus NMR oder MRI
- Google vertritt die Ansicht, dass der Übergang zu post-quantum cryptography bis 2029 deutlich robuster vorangetrieben werden sollte
Sitzung 18 – Scale AI with Google’s TPU software stack
- Behandelt wird ein Open-Source-Software-Stack zum Trainieren, Fine-Tuning und Ausführen von Inferenz für Modelle auf TPU
- Der Modellentwicklungsprozess ist in Pre-Training, Post-Training und Serving/Inferenz unterteilt
- Mit den kostenlosen TPUs in Kaggle und Colab lassen sich Post-Training und Inferenz ausprobieren
- Die Demo vLLM on TPU führt das Modell Gemma 4 31B auf TPU aus und fasst anhand eines Essensbildes Nährwertinformationen zusammen
- Gemma 4 ist ein multimodales Modell, das sich gut dafür eignet, Bilder zu verstehen und Inhalte zusammenzufassen
- Durch die Integration von MTP in vLLM TPU inference wurde in mehreren Aufgaben eine Beschleunigung von rund 3x erreicht
- Tunix ist ein leichtgewichtiges Framework für Post-Training
- Statt eines großen Modells wird ein 4B-Modell feinabgestimmt, damit es dieselbe Aufgabe übernimmt, und auf einem einzelnen Trillium-Chip ausgeführt
- MaxText, Tunix, vLLM, JAX, PyTorch und TPU sind als Werkzeuge entlang des Modelllebenszyklus angeordnet
Sitzung 19 – Supercharge your AI coding workflow with Chrome DevTools for agents
- Chrome DevTools for agents ist ein Tool, mit dem Coding-Agenten die Browser-Runtime über DevTools direkt beobachten können
- So wie menschliche Entwickler mit DevTools lernen und debuggen, sollten auch Coding-Agenten denselben geschlossenen Feedback-Loop haben
- Agenten können eine echte Chrome-Instanz öffnen, Seiten durchsuchen, Formulare ausfüllen sowie console log und network request erfassen
- Über den Zugriff auf source maps kann von Laufzeitproblemen direkt zur relevanten Quelldatei gesprungen werden
- Das Tool wird als NPM package bereitgestellt und enthält zusammen einen MCP server und eine CLI
- Sechs bereitgestellte Skills:
- troubleshooting, Chrome DevTools und Chrome DevTools CLI skill helfen bei allgemeiner Nutzung und Konzepten
- accessibility debugging, memory leak debugging und optimized LCP skill bringen spezialisiertes Fachwissen in den Agenten ein
- Die Implementierung basiert auf Puppeteer; Agenten verwenden statt direktem Puppeteer-Zugriff den Tool-Wrapper
- Standardmäßig wird ein separates anonymes Browser-Profil verwendet, ohne Zugriff auf den Chrome password manager
- CyberAgent prüfte mit DevTools for agents 236 Storybook-Stories aus 32 Komponenten in weniger als einer Stunde
Sitzung 20 – A new era of discovery: AI and the frontiers of science with Demis Hassabis
- Demis Hassabis definierte das ursprüngliche Ziel von DeepMind als „solve intelligence“
- Zentrales Thema ist, wie AI wissenschaftliche Entdeckungen, Produkte und Forschungstools verändert
- AlphaFold wird erneut als Beispiel dafür genannt, ein 50 Jahre altes Problem der Proteinstruktur gelöst zu haben
- Gemini for Science knüpft an die im Keynote vorgestellte Entwicklung wissenschaftlicher Modelle an
- Demis Hassabis beschreibt die Gegenwart als die „foothills of the singularity“ und sieht den Zeitpunkt, an dem intelligence gelöst wird, bei ungefähr 2030 ± 1 Jahr
- Modelle der Genie-Reihe werden von Waymo genutzt, um in der Realität schwer beobachtbare 1 in a billion-Situationen zu testen
- Die Fortschritte von Isomorphic Labs in der drug discovery dienen als Beispiel dafür, wie AI die Wissenschaft beschleunigt
- Die Gemini-App hat monatlich 900 Millionen Nutzer, und AI Mode in Search ist ebenfalls zu einer wichtigen Produktoberfläche geworden
- AI wird über Produktfunktionen hinaus als Werkzeug zur Lösung wissenschaftlicher und forschungsbezogener Probleme eingesetzt
Sitzung 21 – A fireside chat on the evolution of the developer craft
- In der AI-Ära verlagert sich die Arbeit von Entwicklern vom Schreiben von Code hin zu Systemdesign, Dokumentation und Orchestrierung
- Zwar erscheinen ständig neue Tools und Modelle, aber man muss nicht jedem Trend sofort folgen und sollte bewusst auswählen, was man lernen will
- Agenten ins Team zu holen ist ähnlich, als würde man mehrere Junior Engineers einstellen; dadurch werden interne Dokumentation und Aufzeichnungen von Designentscheidungen wichtiger
- Für einen guten agentic workflow muss festgelegt werden, wofür ein einzelner Agent verantwortlich ist, wie mehrere Agenten miteinander kommunizieren und an welcher Stelle Menschen die Aufsicht übernehmen
- Die UX vieler Coding-Tools ähnelt sich zunehmend, sodass sich in einem Tool gelernte Muster auch auf andere übertragen lassen
- Bei der Arbeit mit Agenten muss man einen Teil der Kontrolle über den Weg loslassen und stattdessen Ergebnisse und Designabsichten abstimmen
- Technical debt, cognitive debt und intent debt können sich mit AI schneller verbessern oder schneller verschlechtern
- 20 Agenten gleichzeitig laufen zu lassen kann die menschliche kognitive Kapazität übersteigen und muss daher bewusst gesteuert werden
- Gute Prompt-Gewohnheiten entwickeln sich weg von Suchwortfragmenten hin zu vollständigen Zielen mit Kontext
- Wichtiger als die Frage „Schreibe ich jeden Code selbst?“ ist, ob man Kontext und ein Validierungssystem geschaffen hat, in denen Agenten arbeiten können
Sitzung 22 – Build core skills to thrive as an AI-era developer
- Auch im AI-Zeitalter werden grundlegende Software-Engineering-Fähigkeiten noch wichtiger
- AI kann ein Force Multiplier sein, aber um Ergebnisse zu bewerten, zu integrieren und zu warten, ist tiefes Fachwissen nötig
- Je autonomer Agenten arbeiten, desto mehr braucht es ein Shift-left, bei dem die Intent frühzeitig klar definiert wird
- System Design weitet sich zu einem Konzept aus, das auch Umfeld, Menschen, Agenten, Tools und Kultur umfasst
- Teams sollten Agenten nicht nur out of the box einsetzen, sondern Agent Role, Profile, Recipe, Rule und Skill selbst erstellen und pflegen
- Specs, Agent Rules und Skills werden zur Source of Truth, die dem Agenten das What und Why des Systems vermittelt
- Um realistische Evals zu erstellen, braucht es gemeinsam Kompetenzen in AI, Software Engineering, Nutzerverständnis und Business
- Es muss ein Feedback-Loop aufgebaut werden, der durch die Analyse von Agent Traces die Tool-Usability, Agent Skills und das System Design verbessert
- Menschliche Engineers wechseln von der Rolle des Conductors einzelner Agenten zur Rolle des Orchestrators mehrerer asynchroner Agenten-Teams
- Um ein System aus der Perspektive böswilliger Akteure zu betrachten, kann explizit ein Red Team Agent eingesetzt werden
Session 23 - Software engineering at the tipping point
- Wenn AI das Schreiben von Code beschleunigt, gerät das gesamte Entwicklungsökosystem auf der Ebene der Software Ecology unter Druck
- Bei Google liegt der gesamte Code, einschließlich Android und Chrome, in einem gemeinsamen Monorepo und wird auf den Trunk committed
- Google nutzt seit Langem interne Tools, mit denen ein einzelner Entwickler Millionen Zeilen Code ändern kann
- Es ist sehr wahrscheinlich, dass das heutige Entwicklungsökosystem 10-fache Geschwindigkeit nicht bewältigen kann
- Wenn Agenten mehr Kompilierungen, Tests, Commits und Token-Verbrauch erzeugen, steigen Infrastrukturkosten und Bottlenecks
- Agenten können Code erzeugen, der leicht zu schreiben ist, aber nicht unbedingt Code, der für Menschen leicht wartbar ist
- Es braucht agentische Skills für Component Reuse und Component Isolation, die Wiederverwendung und Isolation erzwingen
- APIs und Datenzugriffe müssen so robust abgesichert werden, als wären sie für Agenten faktisch öffentlich
- Der Satz „agents will find things you probably didn't want them to“ zeigt das Risiko beim Design von Berechtigungen
- Im Entwicklungsökosystem des Jahres 2030 könnte die heutige Arbeitsweise so veraltet wirken wie die CD-ROM-Ära von 2001
Session 24 - Vibe once, run anywhere with Google Antigravity and Flutter
- Mit Antigravity und Flutter zusammen lässt sich eine einmal entwickelte Idee auf mehrere Plattformen ausweiten
- Seit der Einführung von Gemini 3 sind die Modellfähigkeiten stark gestiegen, und Antigravity unterstützt diese Fähigkeiten von Anfang an
- Im Kern von Antigravity steht ein Feedback-Loop, in dem Planung, Ausführung und Verifizierung eng verzahnt sind
- Antigravity erstellt eine Task List und einen Implementation Plan, hinterlässt während der Ausführung Screenshots und Videos und verfasst nach Abschluss einen Bericht mit der Implementierung und den Gründen dafür
- In der Verifizierungsphase folgen aufeinander App-Start, Screenshot-Aufnahme, Klicks auf Chrome-Buttons und Testausführung
- In Flutter liefern die starke Typisierung von Dart und der Analysis Server dem LLM objektive Fehlersignale wie Funktionssignaturen und Klassenstrukturen
- Flutter ist ein Cross-Platform-UI-Toolkit, das dieselben Pixel und Funktionen auf mehreren Displays bereitstellt
- Das Stateful Hot Reload von Flutter bietet eine Entwicklungserfahrung, bei der die laufende App in unter 1 Sekunde neu gebaut wird
- Je mehr Code Agenten erzeugen, desto stärker müssen Menschen die Designziele und Produktrichtung vorgeben und die Ergebnisse der Agenten prüfen
- Antigravity liefert den Ausführungs-Loop für Agenten, und Flutter sorgt plattformübergreifend für konsistente Ergebnisse, wodurch ein „vibe once, run anywhere“-Flow entsteht
3 Kommentare
Wenn sich etwas verändert, an das man sich gewöhnt hatte, und man erstmal ablehnend reagiert, merke ich, dass ich wohl langsam älter werde T_T
Hacker-News-Kommentare
Die Keynote war für mich persönlich die langweiligste.
Ich hatte sie angehalten, um aufs Klo zu gehen, und dann sogar vergessen, dass ich sie überhaupt geschaut hatte; Google scheint aus dem Blick zu verlieren, was I/O und die Keynote für Nutzer bedeuten.
Besser wäre es gewesen, wie bei der Android-Veranstaltung letzte Woche ein eigenes Event nur für Gemini zu machen, und durch den Fokus darauf, AI in jedes Produkt zu drücken, verschwimmen auch die Grenzen zwischen den Produktlinien.
Google Home ist ein einziges Durcheinander und scheitert ständig schon an Basisfunktionen, aber in den Präsentationen des Google-Home-VP geht es jedes Mal nur um Gemini. Es hat sogar Jahre gedauert, die Häufigkeit zu senken, mit der Geräte offline gehen.
Auch die Sessions wirken fad, mehr als eine Mischung aus „neue Funktionen für X“ und „dieses und jenes mit AI“.
In drei Worten: „Neu ist besser“.
Deshalb wird Google Home schlechter. Niemand wird befördert, weil etwas, das bereits gut genug funktioniert, einfach weiter stabil gehalten wird; befördert wird man, wenn man auf dieser Plattform etwas Neues launcht und dann mit ausgewählten Kennzahlen „Impact“ nachweist.
Aus demselben Grund drehte sich die Keynote komplett um AI. AI ist gerade das heiße Chaos, in das Ressourcen hineingekippt werden, und wenn man AI in jedes Produkt steckt, bekommen unzählige Leute die Chance, neue Features zu launchen und „Impact“ zu zeigen.
I/O ist zwar eine Entwicklerkonferenz, aber zu glauben, dass Wall Street nicht hinschaut, wäre naiv. Vor Beginn der I/O war die Aktie an dem Tag 10 Dollar gefallen, während der Keynote stieg sie um 5 Dollar; auch wenn das nicht hielt, ist klar, dass die Keynote Einfluss auf den Aktienkurs hatte. Sundar weiß das auch.
Schon allein mitzuerleben, wie die Gesellschaft weltweit so viel zusätzliche Compute-Kapazität aufbaut, ist eine gewaltige Zeit.
Die Qualität von Gemini ist wieder besser geworden, und jetzt gibt es auch lang laufende Agenten. Für viele Menschen, die „etwas am Computer machen“, wird das ein Schlag sein.
Wenn das in echten Produktionsumgebungen ankommt, könnte man lieber ein oder zwei Kollegen entlassen und deren Gehälter in Tokens ausbezahlen. Dass jemand irgendwann dasselbe über mich denkt, ist wohl nur eine Frage der Zeit.
All das ist überhaupt nicht fad; ich verstehe nicht, wie dabei so extrem gegensätzliche Sichtweisen entstehen können.
Wenn man diese durchchoreografierten, faden Präsentationen sieht und wie Leute offenbar Prompts außerhalb des Bildes ablesen, wirken die alten Steve-Jobs-Präsentationen umso beeindruckender.
Ob es wirklich so ist, weiß ich nicht, aber so sieht es aus, und Steve war einfach außergewöhnlich gut darin, Produkte vorzustellen. Wenigstens sollten die Leute versuchen, sich daran ein Beispiel zu nehmen.
Steve war bei Keynotes und technischen Demos ein absolutes Naturtalent; manche Menschen werden wohl einfach mit so einem Talent geboren.
Das ist Verwahrlosung im großen AI-Maßstab, und es ist bitter, dabei zuzusehen.
Ich frage mich, was für lokale Gemma-Modelle und für Flutter geplant ist.
Ich baue gerade eine komplett lokale App, die Gemma 4 2B herunterlädt oder das eingebaute AICore von Android beziehungsweise Apples Foundation Models verwendet.
Lokale Modelle sind inzwischen ziemlich gut, sogar mit Websuche und Tool-Calling, sodass man für viele Anwendungsfälle gar kein Cloud-Modell mehr braucht.
Auf Firefox für Desktop funktionierte der Button Join the livestream nicht, in Chrome dagegen ohne Probleme.
Interessant, dass 3.5 Flash vor 3.5 Pro erscheint.
Historisch gesehen war Flash bei Gemini eher ein aus Pro destilliertes Modell, also gefühlt die umgekehrte Reihenfolge; vielleicht trainieren sie es noch etwas weiter, bis es in Benchmarks vorne liegt?
Damals konnte es nicht einmal ein 200-Zeilen-Python-Skript ohne grobe Fehler korrigieren und machte Dinge kaputt wie die Reihenfolge von Funktionsargumenten.
Wenn das kleinere Modell bei Agenten-Evaluierungen gewinnt, ist es plausibler, dass diese Evaluierung die Qualität von Agenten von vornherein gar nicht gemessen hat.
Für Builder ist das ein größeres Problem als die Modellwahl.
Ich erinnere mich an die guten alten Zeiten, als wir unsere Geräte vollständig besaßen und kontrollierten. Ich will das wieder.
Technisch ist es heute eindeutig viel besser. Linux ist heute großartig, Self-Hosting ist günstig und leicht zugänglich.
Ich verstehe nicht genau, inwiefern es heute beim Thema Kontrolle über die eigenen Geräte schlimmer geworden sein soll.
Die Stimmung ist komplett daneben. Ich vermisse die Zeit, als I/O stark auf Android fokussiert war und alles von Optimismus geprägt war.
Es hat sich verändert von „Googles Antwort auf Apple WWDC und Launch-Events“ zu „gleichzeitig überall AI“.
Wenn man sieht, was Google zwischen 2008 und 2020 alles Großartiges herausgebracht hat, ist das wirklich schade.
Es ist sicher nicht nur ein Google-Problem. Große Konferenzen verändern sich generell so. Es geht nur noch um AI. Bei der CES vielleicht nicht ganz, aber trotzdem.
Seit dem Launch von Google Wave im Jahr 2009 war die Google I/O mein liebstes Tech-Event, und damals war ich völlig davon begeistert.
Ein paar Jahre später kamen dann noch die Google-Glass-Fallschirmsprünge dazu, das waren unterhaltsame Zeiten.
In der Demo ging es darum: „Lass statt dich mit deinen Nachbarn bekannt zu machen lieber einen AI-Agenten die Blockparty in deiner Straße planen.“
Bedeutet Spark so etwas wie cloud-gehostetes openclaw?
Flash ist viel zu teuer, ich werde jetzt für immer beim Gemma-Hosting von OpenRouter bleiben