- Die zentralen Schwerpunkte sind Gemini 3.5 Flash, Gemini Omni Flash, Antigravity 2.0, Google AI Studio, Gemma 4, Android 17, Chrome/Web, Firebase, Google Play und Developer-Skills im AI-Zeitalter
- Google stellt nicht nur Modellankündigungen in den Mittelpunkt, sondern den Entwicklungsfluss, in dem Agenten tatsächlich auf Produkte, Browser, Cloud, Mobile-Apps, Daten, Dokumente und Testumgebungen zugreifen
- Entwickler-Tools gehen über das reine Schreiben von Code hinaus und erweitern sich auf Planung, Ausführung, Verifikation, Debugging, Deployment, Evaluierung und die Koordination mehrerer Agenten
- Android, Flutter, Chrome, Firebase und Google Play werden alle so erweitert, dass Gemini und Agenten-Tools in bestehende Entwicklungsabläufe integriert werden
- Größere Engpässe als das Schreiben von Code sind inzwischen Validierungskosten, Bereitstellung von Kontext, Zugriffsrechte auf Tools, Runtime-Beobachtung, Testinfrastruktur sowie die Dokumentation und Systemarchitektur einer Organisation
- Jeden Monat erstellen mehr als 8,5 Millionen Menschen Apps und Experiences mit Google-Modellen
- Die Modell-APIs von Google verarbeiten etwa 19 Milliarden Tokens pro Minute
- Nutzung von AI Search:
- AI Overviews werden monatlich von mehr als 2,5 Milliarden Menschen genutzt
- AI Mode wird monatlich von mehr als 1 Milliarde Menschen genutzt
- Die monatlich aktiven Nutzer der Gemini app stiegen seit der I/O im vergangenen Jahr von 400 Millionen auf mehr als 900 Millionen
- Mit dem Modell Nano Banana wurden mehr als 50 Milliarden Bilder erzeugt
- Gemini 3.5 Flash ist produktübergreifend und über die API verfügbar; die Kernmerkmale sind schnelle Ausführung und Kosteneffizienz
- Gemini Omni Flash ist das erste Modell der Omni-Familie und zielt darauf ab, multimodale Ein- und Ausgaben umfassender zu verarbeiten
- Antigravity 2.0 ist eine eigenständige Desktop-App, die weltweit verfügbar ist und Agentengespräche, Projekte und Aufgabenmanagement auf einem Bildschirm zusammenführt
- Große Antigravity-Demo:
- Mit 93 Sub-Agenten, mehr als 15.000 Modellanfragen und 2,6 Milliarden Tokens wurde aus einem leeren Projekt ein funktionsfähiger Betriebssystem-Kern erstellt
- Mithilfe der Leistung und Kosteneffizienz von Gemini 3.5 Flash lief dies mit API-Credits von unter 1.000 US-Dollar
- Google zeigt für Entwickler einen Ansatz, der Modelle, Agenten-Tools, Nutzerplattformen und Infrastruktur zusammenführt
- Managed agents kommen in die Gemini API, sodass sich ein Agenten-Harness wie Antigravity in API-Form nutzen lässt
- Google Antigravity 2.0 ist eine agentenzentrierte Desktop-App, in der mehrere Agenten Entwicklungsaufgaben übernehmen
- Mit dem Antigravity SDK lassen sich Agenten-Workflows direkt anpassen und bereitstellen
- In Google AI Studio können neue Nutzer ohne Kreditkarte direkt auf Cloud Run deployen
- Durch die Integration mit Google Workspace kann AI Studio Workspace-Daten im App-Erstellungs-Workflow verwenden
- In Google AI Studio ist nun ein Workflow möglich, der Ideen direkt in Android-Apps umsetzt
- Gemma 4:
- Wird unter der Apache-2-Lizenz angeboten
- Erreichte im ersten Monat 100 Millionen Downloads
- Die gesamten Gemma-Downloads stiegen auf mehr als 500 Millionen
- Chrome DevTools for Agents können in Antigravity und in mehr als 20 Coding-Agenten verwendet werden
- Gemma 4 wurde mit LoRA feinabgestimmt, um Bash-Befehlsantworten zu erzeugen, die direkt in CI-Pipelines nutzbar sind, und dann auf einem lokalen Notebook bereitzustellen
- In AI Studio erstellte Apps werden mit Cloud Run und Firebase deployt; anschließend wird auch Debugging und Analyse in der Produktionsphase in einen Agenten-Workflow eingebunden
- Über mehr als 50 verwaltete MCP-Server greifen Agenten auf Google-Cloud-Tools und Daten zu
- Developer Knowledge MCP speist aktuelle Informationen auf Basis der Google-Dokumentation in Agenten-Tools ein und reduziert so Probleme mit veralteten Dokumenten
- Aktuelle Dokumentations-Snapshots werden in etwa alle 8 bis 12 Stunden in Agenten-Tools eingespeist
- Mit Data Agent Kit und BigQuery MCP werden Firestore-, BigQuery- und Log-Daten analysiert und Dashboards erstellt
- Antigravity kann App-Fehler untersuchen, relevante Dateien finden und anpassen und den Prozess bis zu einem GitHub-Commit fortführen
- Ein auf Cloud Run bereitgestellter remediation agent und ein CI agent sind mit Eventarc, Pub/Sub und Gemini verbunden, um Fehler zu untersuchen und zu beheben
- Mehrere Agenten übergeben sich Aufgaben im A2A(agent-to-agent)-Verfahren
- Agentenentwicklung endet nicht bei der Prototyperstellung, sondern erweitert sich auf Deployment, Monitoring, Datenanalyse und automatische Wiederherstellung
- Android 17 ergänzt Speicherlimits und zugehörige Tools, damit übermäßiger Speicherverbrauch von Apps die User Experience nicht beeinträchtigt
- Android 17 nimmt Bedingungen wie excessive memory, cold start und excessive CPU automatisch in die Analyse auf
- Apps, die auf Android 17 abzielen, benötigen die Berechtigung ACCESS_LOCAL_NETWORK, um Geräte im lokalen Netzwerk zu finden und sich mit ihnen zu verbinden
- Google verstärkt den Kurs, Android-UIs mit Jetpack Compose zu erstellen
- Compose 1.10 und Compose 1.11 enthalten Verbesserungen bei Performance, hybrid UI und neuen APIs
- Die Integration von AppFunctions und Gemini befindet sich in der geschlossenen Preview; Apps können dabei zum Ziel der Gemini-Orchestrierung werden
- Mit der Developer Preview der ML Kit Prompt API lassen sich einige neue Funktionen testen
- Android 17 bietet Eclipsa Video, verbesserte HE-AAC-Sprachqualität sowie Kamera- und Medienverbesserungen auf Basis von CameraX und Media3
- Apps für große Bildschirme bewegen sich mit Navigation 3 und der Bibliothek Compose Adaptive in eine Richtung, die sich weniger an bisherigen Mobile-Beschränkungen orientiert
- Compose 1.6 für Wear OS unterstützt Navigation 3 und einen mode manager zur Verwaltung von Inhalten im Energiesparmodus
- Chrome konzentriert sich darauf, Websites so zu gestalten, dass sie für Nutzer mit Agenten und agentischen Tools gut funktionieren
- Statt sich nur auf das Grundwissen von Modellen zu verlassen, will Chrome aktuelles Baseline und Web-Features mit Entwickler-Tools verbinden
- Seit dem vergangenen Jahr haben 55 Funktionen den Status Baseline Widely Available erreicht
- Zum Zeitpunkt der Ankündigung befinden sich 52 Funktionen im Status Baseline Newly Available
- Da Chrome alle vier Wochen aktualisiert wird, erzeugen Coding-Agenten leicht veraltete Implementierungen, wenn ihnen aktuelle Web-Features nicht bekannt sind
- Die Prompt API von Chrome wird in Chrome 148 verfügbar sein
- Navigation API, View Transitions, HTML-in-Canvas und declarative partial updates werden in den Entwicklungsworkflow aufgenommen
- Entwickler von Chrome-Erweiterungen können Installation, Service Worker, side panel und popup automatisch prüfen und debuggen
- Chrome erweitert sich in die Richtung, Agenten High-Level-Skills für Web-Performance, identity und security sowie Leitfäden für mehr als 100 gängige Anwendungsfälle bereitzustellen
- Wenn Agenten mit aktuellen Web-Features und Informationen zur Browser-Unterstützung versorgt werden, lässt sich die Wiederholung veralteter Kompatibilitätsmuster reduzieren
- Die Gemini-Modellfamilie ist eine multimodale Modellfamilie, die Texte, Bilder, Audio, Video und Code als Eingaben sowie verschiedene Ausgabeformen verarbeiten kann
- Rollen von Gemini 3.5 Pro und Flash:
- Gemini 3.5 Pro ist auf das Lösen komplexer Probleme fokussiert
- Gemini 3.5 Flash übernimmt die Balance aus Leistung, Geschwindigkeit und Kosten
- Die Build-Funktion in AI Studio verwendet 3.5 Flash als Standardmodell
- Nano Banana 2 kann direkt in AI Studio ausprobiert werden
- Gemini Omni Flash ist ein Modell, das aus Eingaben Ausgaben einschließlich Video erzeugen kann
- Gemini Live und die Live API unterstützen sprachbasierte Interaktionen
- Die Interactions API ist eine Funktion für die Interaktion mit Agenten innerhalb von AI Studio
- Zugänglichkeit von Gemma 4:
- Kann im AI Studio playground getestet werden
- Teilweise sind auch kostenlose Aufrufe über die Gemini API möglich
- Verfügt über ein Kontextfenster von 256.000 Tokens und ist auf Hugging Face zu finden
- Ebenfalls vorgestellt wurden Gemini Robotics 1.6, Genie 3, Antigravity 2.0 sowie eine Strategie zur Kostensenkung durch die Mischung aus offenen und proprietären Modellen
- Google AI Studio erweitert sich über einen Model-Playground hinaus zu einem Ort, an dem Ideen in Apps verwandelt und bereitgestellt werden
- Modelle, Agenten, App-Erstellung, Workspace-Integration und Cloud-Run-Deployment sind in einem durchgängigen Ablauf zusammengeführt
- Der App-Bereich von AI Studio soll bald verfügbar sein und App-Erstellung sowie Deployment direkter abdecken
- Hinzugekommen ist eine Funktion, mit der in AI Studio erstellter Code mit einem Klick nach Antigravity exportiert werden kann
- Antigravity 2.0 übernimmt nicht nur das Schreiben von Code, sondern die Rolle einer Mission Control, die verschiedene Aufgaben über Agenten koordiniert
- Antigravity 2.0 stellt task list, implementation plan und die Prüfung geänderter Dateien in den Mittelpunkt des Ablaufs
- Code-Review und die Prüfung von Änderungen lassen sich direkt in Antigravity 2.0 erledigen
- Die Struktur ist darauf ausgelegt, schwere Aufgaben wie Browser-Tests, Planung, Funktionsentwicklung über mehrere Dateien und End-to-End-Validierung an Agenten zu übergeben
- Mit Google AI Studio lässt sich in etwa 20 Minuten eine neue Business-App erstellen und anschließend mit Antigravity weiterentwickeln
- Google AI Studio ist ein schneller Startpunkt für „prompt to app“, während Antigravity das Werkzeug ist, um daraus echte Entwicklungsarbeit zu machen
- Wenn Coding-Agenten moderne Web-Funktionen nicht kennen, erzeugen sie leicht Code nach veralteten Standards für Browser-Kompatibilität
- Chrome hat im vergangenen Jahr 50 neue Funktionen veröffentlicht, doch wegen des Knowledge-Cutoff vieler Modelle erreichen diese Funktionen die Modelle oft nicht
- Im Beispiel zur Interest Invokers API zeigte sich das Problem, dass ein Agent den alten Attributnamen
interesttarget verwendet
- Modern Web Guidance ist ein Wissenspaket, das Agenten dabei hilft, aktuelle Web-Funktionen und empfohlene Implementierungen zu finden
- Bevor ein Agent antwortet, führt er innerhalb eines lokalen Pakets eine semantische Suche durch
- Umfang und Struktur der Guidance:
- Derzeit gibt es mehr als 100 Guides
- Die Skills für einzelne Funktionen werden nicht alle als Top-Level-Tools offengelegt, sondern bei Bedarf gefunden und genutzt
- Die Guides liefern sowohl die ideale moderne Implementierung als auch empfohlene Fallbacks
- Wenn es keine Anforderungen an Browser-Support gibt, geht der Agent standardmäßig von Baseline Widely Available aus
- Wenn in
AGENTS.md Bedingungen wie „nur Unterstützung für Chrome 144 oder höher“ eingetragen sind, kann der Agent unnötige Fallbacks vermeiden
- Das Chrome-Team führt täglich Evaluierungen mit Modellen wie Gemini 3.1, Claude Opus 4.7 und GPT 5.5 durch
- Firebase entwickelt sich zu einer agent-native platform, auf der sowohl Menschen als auch Agenten Apps erstellen und skalieren können
- Firebase Data Connect entwickelt sich zu Firebase SQL Connect weiter, das SQL-basierte App-Entwicklung unterstützt
- Mit dem custom resolver von Firebase SQL Connect lassen sich Google-Cloud-Dienste wie Cloud Functions und BigQuery anbinden
- Firestore unterstützt Geo Search, native Full-Text-Suche und Semantic Match
- Firebase AI Logic unterstützt aktuelle Modelle und kann mit Maps Grounding ortsbezogene AI-Funktionen erstellen
- Auch die Bildgenerierungssteuerung von Nano Banana kann in Firebase AI Logic genutzt werden
- Firebase AI Logic unterstützt lokales und hybrides Inferencing auf iOS, Chrome und Android und fällt auf ein cloud-hosted model zurück, wenn kein lokales Modell vorhanden ist
- Dart support for Cloud Functions in Firebase wird als Experimental Preview bereitgestellt
- AI Studio ist mit Google Workspace verbunden, sodass Daten aus Sheets, Docs, Gmail und Calendar in Apps genutzt werden können
- Firebase agent skills sind auf Android, iOS, Web und Flutter nutzbar, außerdem wird die Unterstützung für Crashlytics erweitert
- Play Billing unterstützt in mehr als 65 Märkten mehr als 300 lokale Zahlungsmethoden
- Google Play hat mehr als 890 Millionen kaufbereite Nutzer
- Die Auswahl, Google Play Billing zusammen mit alternativen Zahlungen anzubieten, wird ausgeweitet, zudem wurden niedrigere Servicegebühren angekündigt
- App Discovery wird auf die Gemini app, Android und das Web ausgeweitet, sodass Nutzer Apps und Spiele innerhalb von Gemini finden können
- Statt einer statischen Linkliste empfiehlt Gemini Apps anhand ihrer tatsächlichen Funktionen und der Informationen im Store Listing
- Bei einigen Themen können Nutzer von Gemini und Play mehr als 450.000 Film- und TV-Inhalte durchsuchen
- In der Play Console kann Gemini Listings vorab ausfüllen, wenn strukturierte Dateien wie Eclipsa Video oder Google Sheets hochgeladen werden
- Gemini soll bei Aufgaben in der Play Console wie bulk price changes, import skills und metadata configuration helfen
- Mit der in-app subscription management API können Nutzer ihren Abo-Plan direkt in der App einfach ändern
- Im vergangenen Jahr hat Google Play Billing versuchten Betrug im Wert von 3,4 Milliarden US-Dollar und missbräuchliche Rückerstattungen im Wert von 130 Millionen US-Dollar verhindert
- Gemini, Search, die Gemini-App und Google DeepMind behandeln agentische KI in dieselbe Richtung
- Gemini 3.5 Flash kann auch innerhalb der Search genutzt werden
- Search muss ein Gleichgewicht zwischen schnellen Antworten und längeren agentischen Aufgaben finden
- Gemini Spark übernimmt die Rolle eines Always-on-Agenten, der im Hintergrund Aufgaben erledigt, die Nutzer ihm überlassen haben
- Modelle müssen über einfache Chat-Antworten hinaus auf die gesamte Google-Produktwelt und das externe Ökosystem aufsetzen
- Internes Tool, das von Python nach Go übersetzt wurde:
- Die Aufgabe, ein bestehendes Programm mit Tests in eine andere Sprache zu übersetzen, ist für Modelle ein klarer umrissenes Problem
- Einige interne Tools wurden über Nacht 10- bis 20-mal schneller
- Auch Googles interne Software-Infrastruktur kann sich passend zur neuen agentischen Welt schneller verändern
- Hardware, Modellgröße, Produkteinsatz und Feedback-Loop müssen zusammenpassen, damit Gemini in die gesamte Google-Produktpalette eingebaut werden kann
- Der Fokus der Fragen verschiebt sich von „Was kann das Modell?“ zu „Wie platziert man das Modell in Produkten und Workflows?“
- Android-Entwicklungstools werden nicht nur für menschliche Entwickler, sondern auch für AI Agents entworfen, die in Codebasen eingesetzt werden
- Android Studio Otter unterstützt Gemini-Enterprise- und Google-One-Konten
- Android Studio kann lokale und entfernte Modelle einbinden und verwenden
- Android Bench dient als Maßstab dafür, welches Modell für Android-Entwicklungsaufgaben geeignet ist
- Direkt in Compose Preview kann man UI-Änderungen anfordern, damit der Agent mit besserem Kontext arbeiten kann
- Mit dem agent-basierten Assistenten für neue Projekte lassen sich allein per Prompt adaptive Android-Apps erstellen
- Android Studio enthält etwa 10 Skills, die bei Aufgaben wie adaptiver API-Integration oder der Umwandlung von XML in Compose helfen
- Die neue Android CLI unterstützt LLM-Workflows und reduziert beim Erstellen neuer Projekte den Token-Verbrauch gegenüber anderen Gradle-LLM-Tools um mehr als 70 %
- Antigravity CLI, Android CLI und Android Skills lassen sich bündeln, sodass sich auch in Antigravity mit der Android-App-Entwicklung beginnen lässt
- In Android Studio Quail und auf Android-17-Geräten bleibt die Geräteverbindung erhalten, selbst wenn man das Netzwerk wechselt oder den Laptop neu startet
- Flutter 3.44 und Dart 3.12 erscheinen gemeinsam
- Am Flutter-Projekt haben in diesem Jahr mehr als 1.700 Contributors mitgewirkt
- Jeden Monat entwickeln mehr als 1,5 Millionen Entwickler mit Flutter
- In Flutter 3.44 kann auf Geräten mit Vulkan-Unterstützung ab Android API 34 ein neuer Rendering-Modus ausprobiert werden
- Flutter wird im Infotainment-System des Toyota 2026 RAV4 eingesetzt
- Bei Dart-basierten Cloud Functions for Firebase sinkt der Cold Start dank AOT-Kompilierung in manchen Fällen auf 10 ms
- Firebase AI Logic erhält serverseitige Prompt-Templates, sodass Prompts nicht direkt in die App eingebettet werden müssen
- Firebase Agent Skills for Flutter liefern Agents Anleitungen zum Aufbau von Full-Stack-Apps mit Flutter und Firebase
- Unterstützung für LiteRT-LM soll bald in das Paket
flutter_gemma aufgenommen werden
- Bei Flutter Desktop ist Canonical als Lead Maintainer und strategischer Steward beteiligt
- Gemma 4 etabliert sich als das leistungsstärkste öffentliche Modell der Gemma-Familie
- Es wird in mehreren Größen von 2B bis 31B angeboten und kann auf Mobilgeräten, Laptops und in der Cloud genutzt werden
- Gemma startete 2024 als Modellfamilie, die von 1B bis 27B reichte
- Gemma 4 ist ein Open-Weights-Modell und mit dem Open-Source-Ökosystem kompatibel
- Mit MTP und Speculative Decoding lässt sich die Decoding-Geschwindigkeit um bis zu das Dreifache erhöhen
- Für das Android-Ökosystem steht eine Day-zero-Implementierung von Gemma 4 bereit
- Über Android-APIs lassen sich kleinere Gemma-Modelle direkt auf dem Smartphone ausführen, oder Android-Apps mit lokalen Gemma-Modellen entwickeln, wenn der Zugriff auf die Gemini API schwierig ist
- Mit dem ADK (Agent Development Kit) auf Cloud Run und Gemma 31B werden Agents gebaut, die Datenbanken verstehen und Antworten finden
- Gemma 4 lässt sich über die OpenAI-kompatiblen Schnittstellen von Transformers.js, Ollama und LM Studio im Browser oder lokal ausführen
- Enterprise-Cloud, lokale Maschinen, Browser und Mobilgeräte werden alle zu Laufzeitumgebungen für Gemma
- Die Web-UI-Updates 2026 behandeln wichtige Funktionen zusammen mit ihrem Baseline-Status
- Alle Funktionen erhalten Kompatibilitätskennzeichnungen wie Baseline Widely Available, Newly Available oder Limited Available
- Mit der contrast-color API lassen sich in CSS leichter Farben mit passendem Kontrast wählen
- Die Funktion
meta name="text-scale" in Chrome 146 reagiert auf die systemweiten Einstellungen für die Schriftgröße
- Bei Nutzern von Android und iOS ändern jeweils mehr als 30 % die Standard-Schriftgröße
- Seit Chrome 134 unterstützt das Dialog-Element Funktionen wie Declarative Light Dismiss von Popover
- Two-phase View Transitions können in Chrome Canary getestet werden
- Scroll-driven Animations wurden 2023 in Chrome eingeführt und verbessern über Interop 2026 die Interoperabilität
- Die HTML-in-Canvas API ermöglicht es, echte DOM-Inhalte in Canvas einzubetten
- In Chrome 149 kommen Gap Decorations und neue Einsatzmöglichkeiten für Shape Outside hinzu
- Android ist nicht mehr nur ein Ökosystem für Smartphones; mehr als 580 Millionen aktive Großbildgeräte profitieren von Investitionen in adaptive Apps
- Nutzer von Foldables werden bei adaptiven Apps als besonders wertvolle Nutzergruppe eingestuft
- In Android 17 wird für target SDK 37 die Möglichkeit abgeschafft, sich von orientation und resizability abzumelden
- Der Desktop emulator in Android Studio Quail Canary unterstützt das Testen von Android-Apps in Desktop-Form
- Mit der Continue On API in Android 17 können Nutzer ihre Arbeit von einem Gerät auf einem zweiten Gerät fortsetzen
- Google verstärkt den Trend, Android-Apps Compose-first zu entwickeln
- Compose 1.11 verbessert die Trackpad-Unterstützung auf Mouse- und Pointer-Niveau und fügt eine Testing-API für Non-Touch-Eingaben hinzu
- Für zustandsbasiertes Styling wurde Compose eine experimentelle API hinzugefügt
- Connected Displays wird über den Android Feature Drop allgemein verfügbar gemacht
- Compose, Navigation 3 und die Compose Adaptive-Bibliothek unterstützen verschiedene Displays wie Foldables, Desktop, Auto, TV und XR
- Der zentrale Schwerpunkt ist, wie sich Quantencomputing und AI gegenseitig beschleunigen
- Hartmut Neven startete 2012 Googles Quantum-AI-Team
- superposition und qubit bilden die Grundlage des Quantencomputings
- Die Zahl möglicher Bitstrings auf einem 105-qubit-Chip beträgt 2 hoch 105
- Die Community hat derzeit mehr als 70 Algorithmen und Probleme identifiziert, die Quantencomputer sinnvoll lösen können
- Diese Zahl könnte sich künftig mehr als verzehnfachen
- quantum error correction ist eine Schlüsseltechnologie, um den Zustand der Superposition aufrechtzuerhalten
- Google gelang es 2022, mit quantum error correction die Fehler realer Maschinen zu verringern
- Quantum Echoes steht in Verbindung mit Verfahren zum Lernen aus Daten aus NMR oder MRI
- Google vertritt die Ansicht, dass der Übergang zu post-quantum cryptography bis 2029 deutlich robuster vorangetrieben werden sollte
- Behandelt wird ein Open-Source-Software-Stack zum Trainieren, Fine-Tuning und Ausführen von Inferenz für Modelle auf TPU
- Der Modellentwicklungsprozess ist in Pre-Training, Post-Training und Serving/Inferenz unterteilt
- Mit den kostenlosen TPUs in Kaggle und Colab lassen sich Post-Training und Inferenz ausprobieren
- Die Demo vLLM on TPU führt das Modell Gemma 4 31B auf TPU aus und fasst anhand eines Essensbildes Nährwertinformationen zusammen
- Gemma 4 ist ein multimodales Modell, das sich gut dafür eignet, Bilder zu verstehen und Inhalte zusammenzufassen
- Durch die Integration von MTP in vLLM TPU inference wurde in mehreren Aufgaben eine Beschleunigung von rund 3x erreicht
- Tunix ist ein leichtgewichtiges Framework für Post-Training
- Statt eines großen Modells wird ein 4B-Modell feinabgestimmt, damit es dieselbe Aufgabe übernimmt, und auf einem einzelnen Trillium-Chip ausgeführt
- MaxText, Tunix, vLLM, JAX, PyTorch und TPU sind als Werkzeuge entlang des Modelllebenszyklus angeordnet
- Chrome DevTools for agents ist ein Tool, mit dem Coding-Agenten die Browser-Runtime über DevTools direkt beobachten können
- So wie menschliche Entwickler mit DevTools lernen und debuggen, sollten auch Coding-Agenten denselben geschlossenen Feedback-Loop haben
- Agenten können eine echte Chrome-Instanz öffnen, Seiten durchsuchen, Formulare ausfüllen sowie console log und network request erfassen
- Über den Zugriff auf source maps kann von Laufzeitproblemen direkt zur relevanten Quelldatei gesprungen werden
- Das Tool wird als NPM package bereitgestellt und enthält zusammen einen MCP server und eine CLI
- Sechs bereitgestellte Skills:
- troubleshooting, Chrome DevTools und Chrome DevTools CLI skill helfen bei allgemeiner Nutzung und Konzepten
- accessibility debugging, memory leak debugging und optimized LCP skill bringen spezialisiertes Fachwissen in den Agenten ein
- Die Implementierung basiert auf Puppeteer; Agenten verwenden statt direktem Puppeteer-Zugriff den Tool-Wrapper
- Standardmäßig wird ein separates anonymes Browser-Profil verwendet, ohne Zugriff auf den Chrome password manager
- CyberAgent prüfte mit DevTools for agents 236 Storybook-Stories aus 32 Komponenten in weniger als einer Stunde
- Demis Hassabis definierte das ursprüngliche Ziel von DeepMind als „solve intelligence“
- Zentrales Thema ist, wie AI wissenschaftliche Entdeckungen, Produkte und Forschungstools verändert
- AlphaFold wird erneut als Beispiel dafür genannt, ein 50 Jahre altes Problem der Proteinstruktur gelöst zu haben
- Gemini for Science knüpft an die im Keynote vorgestellte Entwicklung wissenschaftlicher Modelle an
- Demis Hassabis beschreibt die Gegenwart als die „foothills of the singularity“ und sieht den Zeitpunkt, an dem intelligence gelöst wird, bei ungefähr 2030 ± 1 Jahr
- Modelle der Genie-Reihe werden von Waymo genutzt, um in der Realität schwer beobachtbare 1 in a billion-Situationen zu testen
- Die Fortschritte von Isomorphic Labs in der drug discovery dienen als Beispiel dafür, wie AI die Wissenschaft beschleunigt
- Die Gemini-App hat monatlich 900 Millionen Nutzer, und AI Mode in Search ist ebenfalls zu einer wichtigen Produktoberfläche geworden
- AI wird über Produktfunktionen hinaus als Werkzeug zur Lösung wissenschaftlicher und forschungsbezogener Probleme eingesetzt
- In der AI-Ära verlagert sich die Arbeit von Entwicklern vom Schreiben von Code hin zu Systemdesign, Dokumentation und Orchestrierung
- Zwar erscheinen ständig neue Tools und Modelle, aber man muss nicht jedem Trend sofort folgen und sollte bewusst auswählen, was man lernen will
- Agenten ins Team zu holen ist ähnlich, als würde man mehrere Junior Engineers einstellen; dadurch werden interne Dokumentation und Aufzeichnungen von Designentscheidungen wichtiger
- Für einen guten agentic workflow muss festgelegt werden, wofür ein einzelner Agent verantwortlich ist, wie mehrere Agenten miteinander kommunizieren und an welcher Stelle Menschen die Aufsicht übernehmen
- Die UX vieler Coding-Tools ähnelt sich zunehmend, sodass sich in einem Tool gelernte Muster auch auf andere übertragen lassen
- Bei der Arbeit mit Agenten muss man einen Teil der Kontrolle über den Weg loslassen und stattdessen Ergebnisse und Designabsichten abstimmen
- Technical debt, cognitive debt und intent debt können sich mit AI schneller verbessern oder schneller verschlechtern
- 20 Agenten gleichzeitig laufen zu lassen kann die menschliche kognitive Kapazität übersteigen und muss daher bewusst gesteuert werden
- Gute Prompt-Gewohnheiten entwickeln sich weg von Suchwortfragmenten hin zu vollständigen Zielen mit Kontext
- Wichtiger als die Frage „Schreibe ich jeden Code selbst?“ ist, ob man Kontext und ein Validierungssystem geschaffen hat, in denen Agenten arbeiten können
- Auch im AI-Zeitalter werden grundlegende Software-Engineering-Fähigkeiten noch wichtiger
- AI kann ein Force Multiplier sein, aber um Ergebnisse zu bewerten, zu integrieren und zu warten, ist tiefes Fachwissen nötig
- Je autonomer Agenten arbeiten, desto mehr braucht es ein Shift-left, bei dem die Intent frühzeitig klar definiert wird
- System Design weitet sich zu einem Konzept aus, das auch Umfeld, Menschen, Agenten, Tools und Kultur umfasst
- Teams sollten Agenten nicht nur out of the box einsetzen, sondern Agent Role, Profile, Recipe, Rule und Skill selbst erstellen und pflegen
- Specs, Agent Rules und Skills werden zur Source of Truth, die dem Agenten das What und Why des Systems vermittelt
- Um realistische Evals zu erstellen, braucht es gemeinsam Kompetenzen in AI, Software Engineering, Nutzerverständnis und Business
- Es muss ein Feedback-Loop aufgebaut werden, der durch die Analyse von Agent Traces die Tool-Usability, Agent Skills und das System Design verbessert
- Menschliche Engineers wechseln von der Rolle des Conductors einzelner Agenten zur Rolle des Orchestrators mehrerer asynchroner Agenten-Teams
- Um ein System aus der Perspektive böswilliger Akteure zu betrachten, kann explizit ein Red Team Agent eingesetzt werden
- Wenn AI das Schreiben von Code beschleunigt, gerät das gesamte Entwicklungsökosystem auf der Ebene der Software Ecology unter Druck
- Bei Google liegt der gesamte Code, einschließlich Android und Chrome, in einem gemeinsamen Monorepo und wird auf den Trunk committed
- Google nutzt seit Langem interne Tools, mit denen ein einzelner Entwickler Millionen Zeilen Code ändern kann
- Es ist sehr wahrscheinlich, dass das heutige Entwicklungsökosystem 10-fache Geschwindigkeit nicht bewältigen kann
- Wenn Agenten mehr Kompilierungen, Tests, Commits und Token-Verbrauch erzeugen, steigen Infrastrukturkosten und Bottlenecks
- Agenten können Code erzeugen, der leicht zu schreiben ist, aber nicht unbedingt Code, der für Menschen leicht wartbar ist
- Es braucht agentische Skills für Component Reuse und Component Isolation, die Wiederverwendung und Isolation erzwingen
- APIs und Datenzugriffe müssen so robust abgesichert werden, als wären sie für Agenten faktisch öffentlich
- Der Satz „agents will find things you probably didn't want them to“ zeigt das Risiko beim Design von Berechtigungen
- Im Entwicklungsökosystem des Jahres 2030 könnte die heutige Arbeitsweise so veraltet wirken wie die CD-ROM-Ära von 2001
- Mit Antigravity und Flutter zusammen lässt sich eine einmal entwickelte Idee auf mehrere Plattformen ausweiten
- Seit der Einführung von Gemini 3 sind die Modellfähigkeiten stark gestiegen, und Antigravity unterstützt diese Fähigkeiten von Anfang an
- Im Kern von Antigravity steht ein Feedback-Loop, in dem Planung, Ausführung und Verifizierung eng verzahnt sind
- Antigravity erstellt eine Task List und einen Implementation Plan, hinterlässt während der Ausführung Screenshots und Videos und verfasst nach Abschluss einen Bericht mit der Implementierung und den Gründen dafür
- In der Verifizierungsphase folgen aufeinander App-Start, Screenshot-Aufnahme, Klicks auf Chrome-Buttons und Testausführung
- In Flutter liefern die starke Typisierung von Dart und der Analysis Server dem LLM objektive Fehlersignale wie Funktionssignaturen und Klassenstrukturen
- Flutter ist ein Cross-Platform-UI-Toolkit, das dieselben Pixel und Funktionen auf mehreren Displays bereitstellt
- Das Stateful Hot Reload von Flutter bietet eine Entwicklungserfahrung, bei der die laufende App in unter 1 Sekunde neu gebaut wird
- Je mehr Code Agenten erzeugen, desto stärker müssen Menschen die Designziele und Produktrichtung vorgeben und die Ergebnisse der Agenten prüfen
- Antigravity liefert den Ausführungs-Loop für Agenten, und Flutter sorgt plattformübergreifend für konsistente Ergebnisse, wodurch ein „vibe once, run anywhere“-Flow entsteht
1 Kommentare
Flash ist viel zu teuer, ich werde jetzt für immer beim Gemma-Hosting von OpenRouter bleiben