Playwright MCP – MCP-Server für Webbrowser-Automatisierung für LLMs

(github.com/microsoft)

20 Punkte von GN⁺ 2025-03-27 | 4 Kommentare | Auf WhatsApp teilen

Ein MCP(Model Context Protocol)-Server auf Basis von Playwright
Bietet strukturierte Accessibility-Snapshots, damit LLMs mit Webseiten interagieren können, und ist dadurch schnell und leichtgewichtig
Ermöglicht Web-Automatisierung ausschließlich mit strukturierten textbasierten Daten, ohne Screenshots oder Vision-Modelle
Einsatzzwecke: Navigation auf Webseiten und automatisches Ausfüllen von Formularen, Datenextraktion aus strukturierten Inhalten, LLM-basierte Automatisierungstests, agentenbasierte allgemeine Steuerung von Webbrowsern

Installation

config

{  
  "mcpServers": {  
    "playwright": {  
      "command": "npx",  
      "args": [  
        "@playwright/mcp@latest"  
      ]  
    }  
  }  
}

Kann direkt in VSCode installiert werden: Install in VS Code Insiders
- Nach der Installation kann Playwright MCP im GitHub-Copilot-Agenten von VSCode verwendet werden

Liste der Snapshot-Mode-Tools

browser_navigate: Zu einer URL wechseln
browser_go_back / go_forward: Zurück / vorwärts navigieren
browser_click / hover / drag: Element anklicken, Hover, Drag
browser_type: Text in ein Eingabefeld eingeben (Option: submit)
browser_select_option: Dropdown auswählen
browser_press_key: Tastatureingabe
browser_snapshot: Accessibility-Snapshot erfassen
browser_save_as_pdf: Seite als PDF speichern
browser_wait: Für eine festgelegte Zeit warten (time maximal 10 Sekunden)
browser_close: Seite schließen

Liste der Vision-Mode-Tools

browser_navigate / go_back / go_forward
browser_screenshot: Screenshot erfassen
browser_move_mouse / click / drag: Maussteuerung auf Koordinatenbasis
browser_type: Text an einer Koordinatenposition eingeben
browser_press_key
browser_save_as_pdf
browser_wait
browser_close

4 Kommentare

yangeok 2025-04-21

Ich habe versucht, Playwright MCP mit Cursor zu verbinden, aber die NamuWiki-Seite kann überhaupt nicht gelesen werden..

asheswook 2025-04-21

Wahrscheinlich liegt das an der Bot-Sperre.

crawler 2025-03-28

Als ich es gestern gesehen habe, wusste ich nicht, dass es von Microsoft ist, wow. Das muss ich ausprobieren.

GN⁺ 2025-03-27

Hacker-News-Kommentare

Dieses Tool ist wirklich großartig. Ich habe großen Erfolg damit in Kombination mit Claude Code.
- Ich hinterlasse in CLAUDE.md die Anweisung, Änderungen mit Playwright zu verifizieren.
- Es startet automatisch den Entwicklungsserver, navigiert zur geänderten Seite und prüft, ob die Änderungen funktionieren.
- Wenn es etwas Unerwartetes gibt, behebt es das selbst.
- Es fühlt sich an, als würde man mit einem wirklich hervorragenden Mid-Level-Ingenieur zusammenarbeiten.
- Wir leben gerade wirklich in einer erstaunlichen Zeit.
Es verwendet ariaSnapshot, um eine barrierefrei zugängliche Darstellung des DOM bereitzustellen.
- Wenn man jedoch zu etwas wie Gmail navigiert, ist der Modellkontext schnell aufgebraucht.
- Ich experimentiere mit einer kompakteren textuellen Darstellung der Seite.
- Es verwendet die eigene Chrome-Sitzung und benötigt keine große Kontextgröße.
- Man könnte es auch in eine Aria-Schnittstelle refaktorieren, die für CDP nutzbar ist.
Ich werde es mit JIRA MCP kombinieren, um die „Reproduktionsschritte“ in Bug-Tickets zu lesen und zu prüfen, ob sie sich tatsächlich reproduzieren lassen.
- Ich verstehe die Kritik an MCP nicht.
- Es ist wirklich spannend, diese kambrische Explosion von „Konnektoren“ zu beobachten.
- Das wird der „App Store“ für Modelle, der OpenAIs Custom GPTs nie geworden sind.
Microsofts neues Tool scheint ein Konkurrent zu MCP-Playwright zu sein.
- Microsofts Tool wirkt einfacher, während das andere mehr Funktionen hat.
Großartige Veröffentlichung. Ich frage mich allerdings, warum nicht die ursprüngliche Playwright-API unterstützt wird, sondern nur eine Teilmenge der Aktionen.
Ich kenne Playwright nicht, frage mich aber, wie es sich von Puppeteer unterscheidet.
- Das Problem bei Puppeteer ist, dass es manchmal nicht sofort das richtige JavaScript hinbekommt, um einfache Aufgaben wie das Akzeptieren von Cookie-Consent-Bannern abzuschließen.
Ich habe das schon mehrfach eingereicht und würde gern mehr Geschichten dazu hören.
- Es gibt auch Fetch-MCP, das ebenfalls auf Playwright basiert und Batch-Verarbeitung unterstützt. Ein Vergleich wäre interessant.
Wir brauchen ein MCP für Capybara, damit LLMs meine Rails-Systemtests schreiben und debuggen können, wenn sie nicht funktionieren.
code --add-mcp
- Ich frage mich, ob VS Code einen integrierten MCP-Client hat.
Ich frage mich, ob dieses Tool für Testautomatisierung gedacht ist oder dafür, Playwright in einem Agenten als „Operator“ zu verwenden.