3 Punkte von ragingwind 3 시간 전 | 2 Kommentare | Auf WhatsApp teilen

Diese Keynote von Paul Kinlan, Leiter des Chrome-Developer-DevRel-Teams, behandelte umfassend die rasanten Veränderungen in der Webentwicklungslandschaft der vergangenen sechs Monate sowie die neuen Technologien, die Chrome vorbereitet. Der Kern lässt sich in drei Achsen zusammenfassen: Websites auf eine Ära vorbereiten, in der Agenten (KI-Assistenten) das Web im Namen der Nutzer erkunden, Entwicklungstools dabei helfen, mit modernen Webstandards Schritt zu halten, und die Plattform-Roadmap der nächsten ein bis zwei Jahre frühzeitig teilen.

WebMCP, eine neue Art, wie Agenten mit dem Web interagieren

  • Konzept WebMCP ist eine vorgeschlagene Spezifikation, die HTML-Formulare und JavaScript-Funktionen als Werkzeuge verfügbar macht, die Agenten nutzen können. Es ist eine Struktur, mit der eine Website einem Agenten mitteilen kann: „Hier kann gesucht werden, hier kann man etwas in den Warenkorb legen, und hier ist eine Bezahlung möglich.“
  • Funktionsweise Es übernimmt nur den Tool-Teil von MCP (Model Context Protocol), und der aktuelle Browser-Tab teilt die Liste der Werkzeuge direkt, ganz ohne separaten Server. Auch eine imperative Registrierung über die API navigator.modelContext.registerTool ist möglich.
  • Unterschied Da es im Browser-Kontext ausgeführt wird, können Login-Status, Cookies und Local Storage unverändert genutzt werden. Das ist ein Vorteil, der mit einem externen MCP-Server-Ansatz schwer zu erreichen ist.
  • Status Expedia experimentiert bereits mit Szenarien wie „Finde ein Hotel in der Nähe von Omas Haus“, und in Chrome 149 (geplant für den 2. Juni 2026) wird es als Origin Trial angeboten.

Modern Web Guidance, aktueller Web-Leitfaden für KI-Coding-Tools

  • Problembewusstsein KI-Modelle werden mit Webwissen von vor einem Jahr trainiert, während Chrome alle vier Wochen (bald alle zwei Wochen) aktualisiert wird. Diese Zeitlücke wird als Ursache für sinkende Codequalität gesehen.
  • Lösungsansatz Ein Skill Pack, das sich mit einer einzigen Zeile npx modern-web-guidance install installieren lässt und empfohlene Muster für übergeordnete Bereiche wie Performance, Sicherheit und Identität sowie für rund 100 konkrete Anwendungsfälle bereitstellt.
  • Baseline-Anbindung Ausgerichtet am browserübergreifenden Kompatibilitätsmaßstab Baseline werden für noch nicht breit unterstützte Funktionen auch Fallbacks und Progressive Enhancement mitgeliefert. Über die Google-Analytics-Integration lassen sich zudem Baseline-Ziele auf Basis realer Besucherdaten festlegen.

Chrome DevTools for Agents, KI mit Entwicklertools ausstatten

  • Bereitgestellte Funktionen KI-Tools können direkt auf Konsolenprotokolle, Netzwerkverkehr, Memory Traces und den Accessibility Tree zugreifen und damit Performance-Profiling sowie Lighthouse-Audits durchführen.
  • Neu hinzugekommen Neu sind DevTools-Skills, eine tokeneffiziente CLI, eine TypeScript-API für CI-Umgebungen, die Verbindung zu laufenden Chrome-Instanzen, Multi-Agent-Workflows (gleichzeitige Steuerung mehrerer Chrome-Instanzen) sowie Funktionen zur automatischen Installation und zum Debugging von Chrome-Erweiterungen.

Neue Plattformfunktionen, 52 Neuzugänge bei Baseline

  • View Transitions und Navigation API Sanfte Übergänge zwischen Seiten und ein integriertes Management des Navigationsstatus haben sich als Standard etabliert.
  • LoAF (Long Animation Frames) Die Messung der Interaktions-Performance ist nun in allen Browsern möglich, einschließlich für iOS-Nutzer.
  • Deklarative partielle Updates HTML-Fragmente können ohne JavaScript unabhängig von ihrer Reihenfolge in das DOM gepatcht werden, was Optimierungen ermöglicht, bei denen langsame Datenbereiche erst später befüllt werden (Chrome 148).
  • Streaming HTML API Mit streamHTML und streamHTMLUnsafe lässt sich dynamisches Markup ohne JSON-Konvertierung einfügen.
  • HTML-in-Canvas Standard-DOM kann innerhalb eines Canvas gerendert werden, sodass sich auch in 3D-Game-Engines oder Umgebungen wie PlayCanvas und Three.js UIs mit funktionierender Suche, Übersetzung und Barrierefreiheit umsetzen lassen. Die 3D-Schlafzimmer-Demo zu Beginn der Keynote wurde mit dieser Funktion erstellt.

On-Device-AI (Built-in AI)

  • Prompt API Unterstützt in Chrome 148 Multimodalität und ermöglicht Bildanalyse sowie strukturierte JSON-Ausgabe. Die Sprachunterstützung wurde über Englisch hinaus auf Französisch, Deutsch, Japanisch und Spanisch erweitert.
  • Ausblick Mit der Einführung der Gemma-Modellfamilie wird Native Function Calling möglich, sodass sich autonom arbeitende Agenten clientseitig erstellen lassen. Reddit, Drupal und Temu setzen dies bereits per Progressive Enhancement schrittweise ein.

Insgesamt vermittelt die Ankündigung die Botschaft, dass das Web an einem Wendepunkt steht: weg von einem Medium, das Menschen selbst durchsuchen und bedienen, hin zu einem Medium, in dem Aufgaben an Agenten delegiert werden — und zwar in deutlich höherem Tempo als beim Übergang zu Mobile. Chrome verfolgt dabei eine doppelte Strategie: Einerseits öffnet WebMCP den Weg dafür, dass Websites in Agenten-Workflows eingebunden werden, andererseits sollen Modern Web Guidance und DevTools for Agents die Qualität von KI-Entwicklungstools verbessern. Die Sichtweise, dass eine Rückbesinnung auf Grundlagen wie semantisches HTML, Barrierefreiheit und Baseline auch im Zeitalter der Agenten Vorteile bringt, wurde trotz aller spektakulären neuen Technologien durchgängig betont.

2 Kommentare

 
jhk0530 2 시간 전

Ich habe das Gefühl, dass Chrome immer schwerfälliger wird.

 
ragingwind 3 시간 전

Es dürfte sich lohnen, auch die Position von Firefox zur Prompt API mit anzusehen. https://x.com/FirefoxWebDevs/status/2056382433516286173