2 Punkte von xguru 1 시간 전 | 1 Kommentare | Auf WhatsApp teilen
  • Die zentralen Schwerpunkte sind Gemini 3.5 Flash, Gemini Omni Flash, Antigravity 2.0, Google AI Studio, Gemma 4, Android 17, Chrome/Web, Firebase, Google Play und Developer-Skills im AI-Zeitalter
  • Google stellt nicht nur Modellankündigungen in den Mittelpunkt, sondern den Entwicklungsfluss, in dem Agenten tatsächlich auf Produkte, Browser, Cloud, Mobile-Apps, Daten, Dokumente und Testumgebungen zugreifen
  • Entwickler-Tools gehen über das reine Schreiben von Code hinaus und erweitern sich auf Planung, Ausführung, Verifikation, Debugging, Deployment, Evaluierung und die Koordination mehrerer Agenten
  • Android, Flutter, Chrome, Firebase und Google Play werden alle so erweitert, dass Gemini und Agenten-Tools in bestehende Entwicklungsabläufe integriert werden
  • Größere Engpässe als das Schreiben von Code sind inzwischen Validierungskosten, Bereitstellung von Kontext, Zugriffsrechte auf Tools, Runtime-Beobachtung, Testinfrastruktur sowie die Dokumentation und Systemarchitektur einer Organisation

Sitzung 1 - Google keynote

  • Jeden Monat erstellen mehr als 8,5 Millionen Menschen Apps und Experiences mit Google-Modellen
  • Die Modell-APIs von Google verarbeiten etwa 19 Milliarden Tokens pro Minute
  • Nutzung von AI Search:
    • AI Overviews werden monatlich von mehr als 2,5 Milliarden Menschen genutzt
    • AI Mode wird monatlich von mehr als 1 Milliarde Menschen genutzt
  • Die monatlich aktiven Nutzer der Gemini app stiegen seit der I/O im vergangenen Jahr von 400 Millionen auf mehr als 900 Millionen
  • Mit dem Modell Nano Banana wurden mehr als 50 Milliarden Bilder erzeugt
  • Gemini 3.5 Flash ist produktübergreifend und über die API verfügbar; die Kernmerkmale sind schnelle Ausführung und Kosteneffizienz
  • Gemini Omni Flash ist das erste Modell der Omni-Familie und zielt darauf ab, multimodale Ein- und Ausgaben umfassender zu verarbeiten
  • Antigravity 2.0 ist eine eigenständige Desktop-App, die weltweit verfügbar ist und Agentengespräche, Projekte und Aufgabenmanagement auf einem Bildschirm zusammenführt
  • Große Antigravity-Demo:
    • Mit 93 Sub-Agenten, mehr als 15.000 Modellanfragen und 2,6 Milliarden Tokens wurde aus einem leeren Projekt ein funktionsfähiger Betriebssystem-Kern erstellt
    • Mithilfe der Leistung und Kosteneffizienz von Gemini 3.5 Flash lief dies mit API-Credits von unter 1.000 US-Dollar

Sitzung 2 - Developer keynote

  • Google zeigt für Entwickler einen Ansatz, der Modelle, Agenten-Tools, Nutzerplattformen und Infrastruktur zusammenführt
  • Managed agents kommen in die Gemini API, sodass sich ein Agenten-Harness wie Antigravity in API-Form nutzen lässt
  • Google Antigravity 2.0 ist eine agentenzentrierte Desktop-App, in der mehrere Agenten Entwicklungsaufgaben übernehmen
  • Mit dem Antigravity SDK lassen sich Agenten-Workflows direkt anpassen und bereitstellen
  • In Google AI Studio können neue Nutzer ohne Kreditkarte direkt auf Cloud Run deployen
  • Durch die Integration mit Google Workspace kann AI Studio Workspace-Daten im App-Erstellungs-Workflow verwenden
  • In Google AI Studio ist nun ein Workflow möglich, der Ideen direkt in Android-Apps umsetzt
  • Gemma 4:
    • Wird unter der Apache-2-Lizenz angeboten
    • Erreichte im ersten Monat 100 Millionen Downloads
    • Die gesamten Gemma-Downloads stiegen auf mehr als 500 Millionen
  • Chrome DevTools for Agents können in Antigravity und in mehr als 20 Coding-Agenten verwendet werden
  • Gemma 4 wurde mit LoRA feinabgestimmt, um Bash-Befehlsantworten zu erzeugen, die direkt in CI-Pipelines nutzbar sind, und dann auf einem lokalen Notebook bereitzustellen

Sitzung 3 - Agent-first workflows from prompt to production

  • In AI Studio erstellte Apps werden mit Cloud Run und Firebase deployt; anschließend wird auch Debugging und Analyse in der Produktionsphase in einen Agenten-Workflow eingebunden
  • Über mehr als 50 verwaltete MCP-Server greifen Agenten auf Google-Cloud-Tools und Daten zu
  • Developer Knowledge MCP speist aktuelle Informationen auf Basis der Google-Dokumentation in Agenten-Tools ein und reduziert so Probleme mit veralteten Dokumenten
  • Aktuelle Dokumentations-Snapshots werden in etwa alle 8 bis 12 Stunden in Agenten-Tools eingespeist
  • Mit Data Agent Kit und BigQuery MCP werden Firestore-, BigQuery- und Log-Daten analysiert und Dashboards erstellt
  • Antigravity kann App-Fehler untersuchen, relevante Dateien finden und anpassen und den Prozess bis zu einem GitHub-Commit fortführen
  • Ein auf Cloud Run bereitgestellter remediation agent und ein CI agent sind mit Eventarc, Pub/Sub und Gemini verbunden, um Fehler zu untersuchen und zu beheben
  • Mehrere Agenten übergeben sich Aufgaben im A2A(agent-to-agent)-Verfahren
  • Agentenentwicklung endet nicht bei der Prototyperstellung, sondern erweitert sich auf Deployment, Monitoring, Datenanalyse und automatische Wiederherstellung

Sitzung 4 - What’s new in Android

  • Android 17 ergänzt Speicherlimits und zugehörige Tools, damit übermäßiger Speicherverbrauch von Apps die User Experience nicht beeinträchtigt
  • Android 17 nimmt Bedingungen wie excessive memory, cold start und excessive CPU automatisch in die Analyse auf
  • Apps, die auf Android 17 abzielen, benötigen die Berechtigung ACCESS_LOCAL_NETWORK, um Geräte im lokalen Netzwerk zu finden und sich mit ihnen zu verbinden
  • Google verstärkt den Kurs, Android-UIs mit Jetpack Compose zu erstellen
  • Compose 1.10 und Compose 1.11 enthalten Verbesserungen bei Performance, hybrid UI und neuen APIs
  • Die Integration von AppFunctions und Gemini befindet sich in der geschlossenen Preview; Apps können dabei zum Ziel der Gemini-Orchestrierung werden
  • Mit der Developer Preview der ML Kit Prompt API lassen sich einige neue Funktionen testen
  • Android 17 bietet Eclipsa Video, verbesserte HE-AAC-Sprachqualität sowie Kamera- und Medienverbesserungen auf Basis von CameraX und Media3
  • Apps für große Bildschirme bewegen sich mit Navigation 3 und der Bibliothek Compose Adaptive in eine Richtung, die sich weniger an bisherigen Mobile-Beschränkungen orientiert
  • Compose 1.6 für Wear OS unterstützt Navigation 3 und einen mode manager zur Verwaltung von Inhalten im Energiesparmodus

Sitzung 5 - What’s new in Chrome

  • Chrome konzentriert sich darauf, Websites so zu gestalten, dass sie für Nutzer mit Agenten und agentischen Tools gut funktionieren
  • Statt sich nur auf das Grundwissen von Modellen zu verlassen, will Chrome aktuelles Baseline und Web-Features mit Entwickler-Tools verbinden
  • Seit dem vergangenen Jahr haben 55 Funktionen den Status Baseline Widely Available erreicht
  • Zum Zeitpunkt der Ankündigung befinden sich 52 Funktionen im Status Baseline Newly Available
  • Da Chrome alle vier Wochen aktualisiert wird, erzeugen Coding-Agenten leicht veraltete Implementierungen, wenn ihnen aktuelle Web-Features nicht bekannt sind
  • Die Prompt API von Chrome wird in Chrome 148 verfügbar sein
  • Navigation API, View Transitions, HTML-in-Canvas und declarative partial updates werden in den Entwicklungsworkflow aufgenommen
  • Entwickler von Chrome-Erweiterungen können Installation, Service Worker, side panel und popup automatisch prüfen und debuggen
  • Chrome erweitert sich in die Richtung, Agenten High-Level-Skills für Web-Performance, identity und security sowie Leitfäden für mehr als 100 gängige Anwendungsfälle bereitzustellen
  • Wenn Agenten mit aktuellen Web-Features und Informationen zur Browser-Unterstützung versorgt werden, lässt sich die Wiederholung veralteter Kompatibilitätsmuster reduzieren

Sitzung 6 – What’s new in Google AI

  • Die Gemini-Modellfamilie ist eine multimodale Modellfamilie, die Texte, Bilder, Audio, Video und Code als Eingaben sowie verschiedene Ausgabeformen verarbeiten kann
  • Rollen von Gemini 3.5 Pro und Flash:
    • Gemini 3.5 Pro ist auf das Lösen komplexer Probleme fokussiert
    • Gemini 3.5 Flash übernimmt die Balance aus Leistung, Geschwindigkeit und Kosten
  • Die Build-Funktion in AI Studio verwendet 3.5 Flash als Standardmodell
  • Nano Banana 2 kann direkt in AI Studio ausprobiert werden
  • Gemini Omni Flash ist ein Modell, das aus Eingaben Ausgaben einschließlich Video erzeugen kann
  • Gemini Live und die Live API unterstützen sprachbasierte Interaktionen
  • Die Interactions API ist eine Funktion für die Interaktion mit Agenten innerhalb von AI Studio
  • Zugänglichkeit von Gemma 4:
    • Kann im AI Studio playground getestet werden
    • Teilweise sind auch kostenlose Aufrufe über die Gemini API möglich
    • Verfügt über ein Kontextfenster von 256.000 Tokens und ist auf Hugging Face zu finden
  • Ebenfalls vorgestellt wurden Gemini Robotics 1.6, Genie 3, Antigravity 2.0 sowie eine Strategie zur Kostensenkung durch die Mischung aus offenen und proprietären Modellen

Sitzung 7 – Build next-gen AI experiences with Google AI Studio and Google Antigravity

  • Google AI Studio erweitert sich über einen Model-Playground hinaus zu einem Ort, an dem Ideen in Apps verwandelt und bereitgestellt werden
  • Modelle, Agenten, App-Erstellung, Workspace-Integration und Cloud-Run-Deployment sind in einem durchgängigen Ablauf zusammengeführt
  • Der App-Bereich von AI Studio soll bald verfügbar sein und App-Erstellung sowie Deployment direkter abdecken
  • Hinzugekommen ist eine Funktion, mit der in AI Studio erstellter Code mit einem Klick nach Antigravity exportiert werden kann
  • Antigravity 2.0 übernimmt nicht nur das Schreiben von Code, sondern die Rolle einer Mission Control, die verschiedene Aufgaben über Agenten koordiniert
  • Antigravity 2.0 stellt task list, implementation plan und die Prüfung geänderter Dateien in den Mittelpunkt des Ablaufs
  • Code-Review und die Prüfung von Änderungen lassen sich direkt in Antigravity 2.0 erledigen
  • Die Struktur ist darauf ausgelegt, schwere Aufgaben wie Browser-Tests, Planung, Funktionsentwicklung über mehrere Dateien und End-to-End-Validierung an Agenten zu übergeben
  • Mit Google AI Studio lässt sich in etwa 20 Minuten eine neue Business-App erstellen und anschließend mit Antigravity weiterentwickeln
  • Google AI Studio ist ein schneller Startpunkt für „prompt to app“, während Antigravity das Werkzeug ist, um daraus echte Entwicklungsarbeit zu machen

Sitzung 8 – Unlock modern web capabilities in your AI coding workflows

  • Wenn Coding-Agenten moderne Web-Funktionen nicht kennen, erzeugen sie leicht Code nach veralteten Standards für Browser-Kompatibilität
  • Chrome hat im vergangenen Jahr 50 neue Funktionen veröffentlicht, doch wegen des Knowledge-Cutoff vieler Modelle erreichen diese Funktionen die Modelle oft nicht
  • Im Beispiel zur Interest Invokers API zeigte sich das Problem, dass ein Agent den alten Attributnamen interesttarget verwendet
  • Modern Web Guidance ist ein Wissenspaket, das Agenten dabei hilft, aktuelle Web-Funktionen und empfohlene Implementierungen zu finden
  • Bevor ein Agent antwortet, führt er innerhalb eines lokalen Pakets eine semantische Suche durch
  • Umfang und Struktur der Guidance:
    • Derzeit gibt es mehr als 100 Guides
    • Die Skills für einzelne Funktionen werden nicht alle als Top-Level-Tools offengelegt, sondern bei Bedarf gefunden und genutzt
  • Die Guides liefern sowohl die ideale moderne Implementierung als auch empfohlene Fallbacks
  • Wenn es keine Anforderungen an Browser-Support gibt, geht der Agent standardmäßig von Baseline Widely Available aus
  • Wenn in AGENTS.md Bedingungen wie „nur Unterstützung für Chrome 144 oder höher“ eingetragen sind, kann der Agent unnötige Fallbacks vermeiden
  • Das Chrome-Team führt täglich Evaluierungen mit Modellen wie Gemini 3.1, Claude Opus 4.7 und GPT 5.5 durch

Sitzung 9 – What’s new in Firebase

  • Firebase entwickelt sich zu einer agent-native platform, auf der sowohl Menschen als auch Agenten Apps erstellen und skalieren können
  • Firebase Data Connect entwickelt sich zu Firebase SQL Connect weiter, das SQL-basierte App-Entwicklung unterstützt
  • Mit dem custom resolver von Firebase SQL Connect lassen sich Google-Cloud-Dienste wie Cloud Functions und BigQuery anbinden
  • Firestore unterstützt Geo Search, native Full-Text-Suche und Semantic Match
  • Firebase AI Logic unterstützt aktuelle Modelle und kann mit Maps Grounding ortsbezogene AI-Funktionen erstellen
  • Auch die Bildgenerierungssteuerung von Nano Banana kann in Firebase AI Logic genutzt werden
  • Firebase AI Logic unterstützt lokales und hybrides Inferencing auf iOS, Chrome und Android und fällt auf ein cloud-hosted model zurück, wenn kein lokales Modell vorhanden ist
  • Dart support for Cloud Functions in Firebase wird als Experimental Preview bereitgestellt
  • AI Studio ist mit Google Workspace verbunden, sodass Daten aus Sheets, Docs, Gmail und Calendar in Apps genutzt werden können
  • Firebase agent skills sind auf Android, iOS, Web und Flutter nutzbar, außerdem wird die Unterstützung für Crashlytics erweitert

Sitzung 10 – What’s new in Google Play

  • Play Billing unterstützt in mehr als 65 Märkten mehr als 300 lokale Zahlungsmethoden
  • Google Play hat mehr als 890 Millionen kaufbereite Nutzer
  • Die Auswahl, Google Play Billing zusammen mit alternativen Zahlungen anzubieten, wird ausgeweitet, zudem wurden niedrigere Servicegebühren angekündigt
  • App Discovery wird auf die Gemini app, Android und das Web ausgeweitet, sodass Nutzer Apps und Spiele innerhalb von Gemini finden können
  • Statt einer statischen Linkliste empfiehlt Gemini Apps anhand ihrer tatsächlichen Funktionen und der Informationen im Store Listing
  • Bei einigen Themen können Nutzer von Gemini und Play mehr als 450.000 Film- und TV-Inhalte durchsuchen
  • In der Play Console kann Gemini Listings vorab ausfüllen, wenn strukturierte Dateien wie Eclipsa Video oder Google Sheets hochgeladen werden
  • Gemini soll bei Aufgaben in der Play Console wie bulk price changes, import skills und metadata configuration helfen
  • Mit der in-app subscription management API können Nutzer ihren Abo-Plan direkt in der App einfach ändern
  • Im vergangenen Jahr hat Google Play Billing versuchten Betrug im Wert von 3,4 Milliarden US-Dollar und missbräuchliche Rückerstattungen im Wert von 130 Millionen US-Dollar verhindert

Sitzung 11 – Defining the agentic AI era

  • Gemini, Search, die Gemini-App und Google DeepMind behandeln agentische KI in dieselbe Richtung
  • Gemini 3.5 Flash kann auch innerhalb der Search genutzt werden
  • Search muss ein Gleichgewicht zwischen schnellen Antworten und längeren agentischen Aufgaben finden
  • Gemini Spark übernimmt die Rolle eines Always-on-Agenten, der im Hintergrund Aufgaben erledigt, die Nutzer ihm überlassen haben
  • Modelle müssen über einfache Chat-Antworten hinaus auf die gesamte Google-Produktwelt und das externe Ökosystem aufsetzen
  • Internes Tool, das von Python nach Go übersetzt wurde:
    • Die Aufgabe, ein bestehendes Programm mit Tests in eine andere Sprache zu übersetzen, ist für Modelle ein klarer umrissenes Problem
    • Einige interne Tools wurden über Nacht 10- bis 20-mal schneller
  • Auch Googles interne Software-Infrastruktur kann sich passend zur neuen agentischen Welt schneller verändern
  • Hardware, Modellgröße, Produkteinsatz und Feedback-Loop müssen zusammenpassen, damit Gemini in die gesamte Google-Produktpalette eingebaut werden kann
  • Der Fokus der Fragen verschiebt sich von „Was kann das Modell?“ zu „Wie platziert man das Modell in Produkten und Workflows?“

Sitzung 12 - What’s new in Android development tools

  • Android-Entwicklungstools werden nicht nur für menschliche Entwickler, sondern auch für AI Agents entworfen, die in Codebasen eingesetzt werden
  • Android Studio Otter unterstützt Gemini-Enterprise- und Google-One-Konten
  • Android Studio kann lokale und entfernte Modelle einbinden und verwenden
  • Android Bench dient als Maßstab dafür, welches Modell für Android-Entwicklungsaufgaben geeignet ist
  • Direkt in Compose Preview kann man UI-Änderungen anfordern, damit der Agent mit besserem Kontext arbeiten kann
  • Mit dem agent-basierten Assistenten für neue Projekte lassen sich allein per Prompt adaptive Android-Apps erstellen
  • Android Studio enthält etwa 10 Skills, die bei Aufgaben wie adaptiver API-Integration oder der Umwandlung von XML in Compose helfen
  • Die neue Android CLI unterstützt LLM-Workflows und reduziert beim Erstellen neuer Projekte den Token-Verbrauch gegenüber anderen Gradle-LLM-Tools um mehr als 70 %
  • Antigravity CLI, Android CLI und Android Skills lassen sich bündeln, sodass sich auch in Antigravity mit der Android-App-Entwicklung beginnen lässt
  • In Android Studio Quail und auf Android-17-Geräten bleibt die Geräteverbindung erhalten, selbst wenn man das Netzwerk wechselt oder den Laptop neu startet

Sitzung 13 - What’s new in Flutter

  • Flutter 3.44 und Dart 3.12 erscheinen gemeinsam
  • Am Flutter-Projekt haben in diesem Jahr mehr als 1.700 Contributors mitgewirkt
  • Jeden Monat entwickeln mehr als 1,5 Millionen Entwickler mit Flutter
  • In Flutter 3.44 kann auf Geräten mit Vulkan-Unterstützung ab Android API 34 ein neuer Rendering-Modus ausprobiert werden
  • Flutter wird im Infotainment-System des Toyota 2026 RAV4 eingesetzt
  • Bei Dart-basierten Cloud Functions for Firebase sinkt der Cold Start dank AOT-Kompilierung in manchen Fällen auf 10 ms
  • Firebase AI Logic erhält serverseitige Prompt-Templates, sodass Prompts nicht direkt in die App eingebettet werden müssen
  • Firebase Agent Skills for Flutter liefern Agents Anleitungen zum Aufbau von Full-Stack-Apps mit Flutter und Firebase
  • Unterstützung für LiteRT-LM soll bald in das Paket flutter_gemma aufgenommen werden
  • Bei Flutter Desktop ist Canonical als Lead Maintainer und strategischer Steward beteiligt

Sitzung 14 - What’s new in the Gemma open model family

  • Gemma 4 etabliert sich als das leistungsstärkste öffentliche Modell der Gemma-Familie
  • Es wird in mehreren Größen von 2B bis 31B angeboten und kann auf Mobilgeräten, Laptops und in der Cloud genutzt werden
  • Gemma startete 2024 als Modellfamilie, die von 1B bis 27B reichte
  • Gemma 4 ist ein Open-Weights-Modell und mit dem Open-Source-Ökosystem kompatibel
  • Mit MTP und Speculative Decoding lässt sich die Decoding-Geschwindigkeit um bis zu das Dreifache erhöhen
  • Für das Android-Ökosystem steht eine Day-zero-Implementierung von Gemma 4 bereit
  • Über Android-APIs lassen sich kleinere Gemma-Modelle direkt auf dem Smartphone ausführen, oder Android-Apps mit lokalen Gemma-Modellen entwickeln, wenn der Zugriff auf die Gemini API schwierig ist
  • Mit dem ADK (Agent Development Kit) auf Cloud Run und Gemma 31B werden Agents gebaut, die Datenbanken verstehen und Antworten finden
  • Gemma 4 lässt sich über die OpenAI-kompatiblen Schnittstellen von Transformers.js, Ollama und LM Studio im Browser oder lokal ausführen
  • Enterprise-Cloud, lokale Maschinen, Browser und Mobilgeräte werden alle zu Laufzeitumgebungen für Gemma

Sitzung 15 - What’s new in Web UI

  • Die Web-UI-Updates 2026 behandeln wichtige Funktionen zusammen mit ihrem Baseline-Status
  • Alle Funktionen erhalten Kompatibilitätskennzeichnungen wie Baseline Widely Available, Newly Available oder Limited Available
  • Mit der contrast-color API lassen sich in CSS leichter Farben mit passendem Kontrast wählen
  • Die Funktion meta name="text-scale" in Chrome 146 reagiert auf die systemweiten Einstellungen für die Schriftgröße
  • Bei Nutzern von Android und iOS ändern jeweils mehr als 30 % die Standard-Schriftgröße
  • Seit Chrome 134 unterstützt das Dialog-Element Funktionen wie Declarative Light Dismiss von Popover
  • Two-phase View Transitions können in Chrome Canary getestet werden
  • Scroll-driven Animations wurden 2023 in Chrome eingeführt und verbessern über Interop 2026 die Interoperabilität
  • Die HTML-in-Canvas API ermöglicht es, echte DOM-Inhalte in Canvas einzubetten
  • In Chrome 149 kommen Gap Decorations und neue Einsatzmöglichkeiten für Shape Outside hinzu

Sitzung 16 - Adaptive development for the expanding Android ecosystem

  • Android ist nicht mehr nur ein Ökosystem für Smartphones; mehr als 580 Millionen aktive Großbildgeräte profitieren von Investitionen in adaptive Apps
  • Nutzer von Foldables werden bei adaptiven Apps als besonders wertvolle Nutzergruppe eingestuft
  • In Android 17 wird für target SDK 37 die Möglichkeit abgeschafft, sich von orientation und resizability abzumelden
  • Der Desktop emulator in Android Studio Quail Canary unterstützt das Testen von Android-Apps in Desktop-Form
  • Mit der Continue On API in Android 17 können Nutzer ihre Arbeit von einem Gerät auf einem zweiten Gerät fortsetzen
  • Google verstärkt den Trend, Android-Apps Compose-first zu entwickeln
  • Compose 1.11 verbessert die Trackpad-Unterstützung auf Mouse- und Pointer-Niveau und fügt eine Testing-API für Non-Touch-Eingaben hinzu
  • Für zustandsbasiertes Styling wurde Compose eine experimentelle API hinzugefügt
  • Connected Displays wird über den Android Feature Drop allgemein verfügbar gemacht
  • Compose, Navigation 3 und die Compose Adaptive-Bibliothek unterstützen verschiedene Displays wie Foldables, Desktop, Auto, TV und XR

Sitzung 17 – Building the quantum-AI future with Hartmut Neven and James Manyika

  • Der zentrale Schwerpunkt ist, wie sich Quantencomputing und AI gegenseitig beschleunigen
  • Hartmut Neven startete 2012 Googles Quantum-AI-Team
  • superposition und qubit bilden die Grundlage des Quantencomputings
  • Die Zahl möglicher Bitstrings auf einem 105-qubit-Chip beträgt 2 hoch 105
  • Die Community hat derzeit mehr als 70 Algorithmen und Probleme identifiziert, die Quantencomputer sinnvoll lösen können
  • Diese Zahl könnte sich künftig mehr als verzehnfachen
  • quantum error correction ist eine Schlüsseltechnologie, um den Zustand der Superposition aufrechtzuerhalten
  • Google gelang es 2022, mit quantum error correction die Fehler realer Maschinen zu verringern
  • Quantum Echoes steht in Verbindung mit Verfahren zum Lernen aus Daten aus NMR oder MRI
  • Google vertritt die Ansicht, dass der Übergang zu post-quantum cryptography bis 2029 deutlich robuster vorangetrieben werden sollte

Sitzung 18 – Scale AI with Google’s TPU software stack

  • Behandelt wird ein Open-Source-Software-Stack zum Trainieren, Fine-Tuning und Ausführen von Inferenz für Modelle auf TPU
  • Der Modellentwicklungsprozess ist in Pre-Training, Post-Training und Serving/Inferenz unterteilt
  • Mit den kostenlosen TPUs in Kaggle und Colab lassen sich Post-Training und Inferenz ausprobieren
  • Die Demo vLLM on TPU führt das Modell Gemma 4 31B auf TPU aus und fasst anhand eines Essensbildes Nährwertinformationen zusammen
  • Gemma 4 ist ein multimodales Modell, das sich gut dafür eignet, Bilder zu verstehen und Inhalte zusammenzufassen
  • Durch die Integration von MTP in vLLM TPU inference wurde in mehreren Aufgaben eine Beschleunigung von rund 3x erreicht
  • Tunix ist ein leichtgewichtiges Framework für Post-Training
  • Statt eines großen Modells wird ein 4B-Modell feinabgestimmt, damit es dieselbe Aufgabe übernimmt, und auf einem einzelnen Trillium-Chip ausgeführt
  • MaxText, Tunix, vLLM, JAX, PyTorch und TPU sind als Werkzeuge entlang des Modelllebenszyklus angeordnet

Sitzung 19 – Supercharge your AI coding workflow with Chrome DevTools for agents

  • Chrome DevTools for agents ist ein Tool, mit dem Coding-Agenten die Browser-Runtime über DevTools direkt beobachten können
  • So wie menschliche Entwickler mit DevTools lernen und debuggen, sollten auch Coding-Agenten denselben geschlossenen Feedback-Loop haben
  • Agenten können eine echte Chrome-Instanz öffnen, Seiten durchsuchen, Formulare ausfüllen sowie console log und network request erfassen
  • Über den Zugriff auf source maps kann von Laufzeitproblemen direkt zur relevanten Quelldatei gesprungen werden
  • Das Tool wird als NPM package bereitgestellt und enthält zusammen einen MCP server und eine CLI
  • Sechs bereitgestellte Skills:
    • troubleshooting, Chrome DevTools und Chrome DevTools CLI skill helfen bei allgemeiner Nutzung und Konzepten
    • accessibility debugging, memory leak debugging und optimized LCP skill bringen spezialisiertes Fachwissen in den Agenten ein
  • Die Implementierung basiert auf Puppeteer; Agenten verwenden statt direktem Puppeteer-Zugriff den Tool-Wrapper
  • Standardmäßig wird ein separates anonymes Browser-Profil verwendet, ohne Zugriff auf den Chrome password manager
  • CyberAgent prüfte mit DevTools for agents 236 Storybook-Stories aus 32 Komponenten in weniger als einer Stunde

Sitzung 20 – A new era of discovery: AI and the frontiers of science with Demis Hassabis

  • Demis Hassabis definierte das ursprüngliche Ziel von DeepMind als „solve intelligence“
  • Zentrales Thema ist, wie AI wissenschaftliche Entdeckungen, Produkte und Forschungstools verändert
  • AlphaFold wird erneut als Beispiel dafür genannt, ein 50 Jahre altes Problem der Proteinstruktur gelöst zu haben
  • Gemini for Science knüpft an die im Keynote vorgestellte Entwicklung wissenschaftlicher Modelle an
  • Demis Hassabis beschreibt die Gegenwart als die „foothills of the singularity“ und sieht den Zeitpunkt, an dem intelligence gelöst wird, bei ungefähr 2030 ± 1 Jahr
  • Modelle der Genie-Reihe werden von Waymo genutzt, um in der Realität schwer beobachtbare 1 in a billion-Situationen zu testen
  • Die Fortschritte von Isomorphic Labs in der drug discovery dienen als Beispiel dafür, wie AI die Wissenschaft beschleunigt
  • Die Gemini-App hat monatlich 900 Millionen Nutzer, und AI Mode in Search ist ebenfalls zu einer wichtigen Produktoberfläche geworden
  • AI wird über Produktfunktionen hinaus als Werkzeug zur Lösung wissenschaftlicher und forschungsbezogener Probleme eingesetzt

Sitzung 21 – A fireside chat on the evolution of the developer craft

  • In der AI-Ära verlagert sich die Arbeit von Entwicklern vom Schreiben von Code hin zu Systemdesign, Dokumentation und Orchestrierung
  • Zwar erscheinen ständig neue Tools und Modelle, aber man muss nicht jedem Trend sofort folgen und sollte bewusst auswählen, was man lernen will
  • Agenten ins Team zu holen ist ähnlich, als würde man mehrere Junior Engineers einstellen; dadurch werden interne Dokumentation und Aufzeichnungen von Designentscheidungen wichtiger
  • Für einen guten agentic workflow muss festgelegt werden, wofür ein einzelner Agent verantwortlich ist, wie mehrere Agenten miteinander kommunizieren und an welcher Stelle Menschen die Aufsicht übernehmen
  • Die UX vieler Coding-Tools ähnelt sich zunehmend, sodass sich in einem Tool gelernte Muster auch auf andere übertragen lassen
  • Bei der Arbeit mit Agenten muss man einen Teil der Kontrolle über den Weg loslassen und stattdessen Ergebnisse und Designabsichten abstimmen
  • Technical debt, cognitive debt und intent debt können sich mit AI schneller verbessern oder schneller verschlechtern
  • 20 Agenten gleichzeitig laufen zu lassen kann die menschliche kognitive Kapazität übersteigen und muss daher bewusst gesteuert werden
  • Gute Prompt-Gewohnheiten entwickeln sich weg von Suchwortfragmenten hin zu vollständigen Zielen mit Kontext
  • Wichtiger als die Frage „Schreibe ich jeden Code selbst?“ ist, ob man Kontext und ein Validierungssystem geschaffen hat, in denen Agenten arbeiten können

Sitzung 22 – Build core skills to thrive as an AI-era developer

  • Auch im AI-Zeitalter werden grundlegende Software-Engineering-Fähigkeiten noch wichtiger
  • AI kann ein Force Multiplier sein, aber um Ergebnisse zu bewerten, zu integrieren und zu warten, ist tiefes Fachwissen nötig
  • Je autonomer Agenten arbeiten, desto mehr braucht es ein Shift-left, bei dem die Intent frühzeitig klar definiert wird
  • System Design weitet sich zu einem Konzept aus, das auch Umfeld, Menschen, Agenten, Tools und Kultur umfasst
  • Teams sollten Agenten nicht nur out of the box einsetzen, sondern Agent Role, Profile, Recipe, Rule und Skill selbst erstellen und pflegen
  • Specs, Agent Rules und Skills werden zur Source of Truth, die dem Agenten das What und Why des Systems vermittelt
  • Um realistische Evals zu erstellen, braucht es gemeinsam Kompetenzen in AI, Software Engineering, Nutzerverständnis und Business
  • Es muss ein Feedback-Loop aufgebaut werden, der durch die Analyse von Agent Traces die Tool-Usability, Agent Skills und das System Design verbessert
  • Menschliche Engineers wechseln von der Rolle des Conductors einzelner Agenten zur Rolle des Orchestrators mehrerer asynchroner Agenten-Teams
  • Um ein System aus der Perspektive böswilliger Akteure zu betrachten, kann explizit ein Red Team Agent eingesetzt werden

Session 23 - Software engineering at the tipping point

  • Wenn AI das Schreiben von Code beschleunigt, gerät das gesamte Entwicklungsökosystem auf der Ebene der Software Ecology unter Druck
  • Bei Google liegt der gesamte Code, einschließlich Android und Chrome, in einem gemeinsamen Monorepo und wird auf den Trunk committed
  • Google nutzt seit Langem interne Tools, mit denen ein einzelner Entwickler Millionen Zeilen Code ändern kann
  • Es ist sehr wahrscheinlich, dass das heutige Entwicklungsökosystem 10-fache Geschwindigkeit nicht bewältigen kann
  • Wenn Agenten mehr Kompilierungen, Tests, Commits und Token-Verbrauch erzeugen, steigen Infrastrukturkosten und Bottlenecks
  • Agenten können Code erzeugen, der leicht zu schreiben ist, aber nicht unbedingt Code, der für Menschen leicht wartbar ist
  • Es braucht agentische Skills für Component Reuse und Component Isolation, die Wiederverwendung und Isolation erzwingen
  • APIs und Datenzugriffe müssen so robust abgesichert werden, als wären sie für Agenten faktisch öffentlich
  • Der Satz „agents will find things you probably didn't want them to“ zeigt das Risiko beim Design von Berechtigungen
  • Im Entwicklungsökosystem des Jahres 2030 könnte die heutige Arbeitsweise so veraltet wirken wie die CD-ROM-Ära von 2001

Session 24 - Vibe once, run anywhere with Google Antigravity and Flutter

  • Mit Antigravity und Flutter zusammen lässt sich eine einmal entwickelte Idee auf mehrere Plattformen ausweiten
  • Seit der Einführung von Gemini 3 sind die Modellfähigkeiten stark gestiegen, und Antigravity unterstützt diese Fähigkeiten von Anfang an
  • Im Kern von Antigravity steht ein Feedback-Loop, in dem Planung, Ausführung und Verifizierung eng verzahnt sind
  • Antigravity erstellt eine Task List und einen Implementation Plan, hinterlässt während der Ausführung Screenshots und Videos und verfasst nach Abschluss einen Bericht mit der Implementierung und den Gründen dafür
  • In der Verifizierungsphase folgen aufeinander App-Start, Screenshot-Aufnahme, Klicks auf Chrome-Buttons und Testausführung
  • In Flutter liefern die starke Typisierung von Dart und der Analysis Server dem LLM objektive Fehlersignale wie Funktionssignaturen und Klassenstrukturen
  • Flutter ist ein Cross-Platform-UI-Toolkit, das dieselben Pixel und Funktionen auf mehreren Displays bereitstellt
  • Das Stateful Hot Reload von Flutter bietet eine Entwicklungserfahrung, bei der die laufende App in unter 1 Sekunde neu gebaut wird
  • Je mehr Code Agenten erzeugen, desto stärker müssen Menschen die Designziele und Produktrichtung vorgeben und die Ergebnisse der Agenten prüfen
  • Antigravity liefert den Ausführungs-Loop für Agenten, und Flutter sorgt plattformübergreifend für konsistente Ergebnisse, wodurch ein „vibe once, run anywhere“-Flow entsteht

1 Kommentare

 
hmmhmmhm 1 시간 전

Flash ist viel zu teuer, ich werde jetzt für immer beim Gemma-Hosting von OpenRouter bleiben