20 Punkte von GN⁺ 2025-03-27 | 4 Kommentare | Auf WhatsApp teilen
  • Ein MCP(Model Context Protocol)-Server auf Basis von Playwright
  • Bietet strukturierte Accessibility-Snapshots, damit LLMs mit Webseiten interagieren können, und ist dadurch schnell und leichtgewichtig
  • Ermöglicht Web-Automatisierung ausschließlich mit strukturierten textbasierten Daten, ohne Screenshots oder Vision-Modelle
  • Einsatzzwecke: Navigation auf Webseiten und automatisches Ausfüllen von Formularen, Datenextraktion aus strukturierten Inhalten, LLM-basierte Automatisierungstests, agentenbasierte allgemeine Steuerung von Webbrowsern

Installation

  • config
    {  
      "mcpServers": {  
        "playwright": {  
          "command": "npx",  
          "args": [  
            "@playwright/mcp@latest"  
          ]  
        }  
      }  
    }  
    
  • Kann direkt in VSCode installiert werden: Install in VS Code Insiders
    • Nach der Installation kann Playwright MCP im GitHub-Copilot-Agenten von VSCode verwendet werden

Liste der Snapshot-Mode-Tools

  • browser_navigate: Zu einer URL wechseln
  • browser_go_back / go_forward: Zurück / vorwärts navigieren
  • browser_click / hover / drag: Element anklicken, Hover, Drag
  • browser_type: Text in ein Eingabefeld eingeben (Option: submit)
  • browser_select_option: Dropdown auswählen
  • browser_press_key: Tastatureingabe
  • browser_snapshot: Accessibility-Snapshot erfassen
  • browser_save_as_pdf: Seite als PDF speichern
  • browser_wait: Für eine festgelegte Zeit warten (time maximal 10 Sekunden)
  • browser_close: Seite schließen

Liste der Vision-Mode-Tools

  • browser_navigate / go_back / go_forward
  • browser_screenshot: Screenshot erfassen
  • browser_move_mouse / click / drag: Maussteuerung auf Koordinatenbasis
  • browser_type: Text an einer Koordinatenposition eingeben
  • browser_press_key
  • browser_save_as_pdf
  • browser_wait
  • browser_close

4 Kommentare

 
yangeok 2025-04-21

Ich habe versucht, Playwright MCP mit Cursor zu verbinden, aber die NamuWiki-Seite kann überhaupt nicht gelesen werden..

 
asheswook 2025-04-21

Wahrscheinlich liegt das an der Bot-Sperre.

 
crawler 2025-03-28

Als ich es gestern gesehen habe, wusste ich nicht, dass es von Microsoft ist, wow. Das muss ich ausprobieren.

 
GN⁺ 2025-03-27
Hacker-News-Kommentare
  • Dieses Tool ist wirklich großartig. Ich habe großen Erfolg damit in Kombination mit Claude Code.

    • Ich hinterlasse in CLAUDE.md die Anweisung, Änderungen mit Playwright zu verifizieren.
    • Es startet automatisch den Entwicklungsserver, navigiert zur geänderten Seite und prüft, ob die Änderungen funktionieren.
    • Wenn es etwas Unerwartetes gibt, behebt es das selbst.
    • Es fühlt sich an, als würde man mit einem wirklich hervorragenden Mid-Level-Ingenieur zusammenarbeiten.
    • Wir leben gerade wirklich in einer erstaunlichen Zeit.
  • Es verwendet ariaSnapshot, um eine barrierefrei zugängliche Darstellung des DOM bereitzustellen.

    • Wenn man jedoch zu etwas wie Gmail navigiert, ist der Modellkontext schnell aufgebraucht.
    • Ich experimentiere mit einer kompakteren textuellen Darstellung der Seite.
    • Es verwendet die eigene Chrome-Sitzung und benötigt keine große Kontextgröße.
    • Man könnte es auch in eine Aria-Schnittstelle refaktorieren, die für CDP nutzbar ist.
  • Ich werde es mit JIRA MCP kombinieren, um die „Reproduktionsschritte“ in Bug-Tickets zu lesen und zu prüfen, ob sie sich tatsächlich reproduzieren lassen.

    • Ich verstehe die Kritik an MCP nicht.
    • Es ist wirklich spannend, diese kambrische Explosion von „Konnektoren“ zu beobachten.
    • Das wird der „App Store“ für Modelle, der OpenAIs Custom GPTs nie geworden sind.
  • Microsofts neues Tool scheint ein Konkurrent zu MCP-Playwright zu sein.

    • Microsofts Tool wirkt einfacher, während das andere mehr Funktionen hat.
  • Großartige Veröffentlichung. Ich frage mich allerdings, warum nicht die ursprüngliche Playwright-API unterstützt wird, sondern nur eine Teilmenge der Aktionen.

  • Ich kenne Playwright nicht, frage mich aber, wie es sich von Puppeteer unterscheidet.

    • Das Problem bei Puppeteer ist, dass es manchmal nicht sofort das richtige JavaScript hinbekommt, um einfache Aufgaben wie das Akzeptieren von Cookie-Consent-Bannern abzuschließen.
  • Ich habe das schon mehrfach eingereicht und würde gern mehr Geschichten dazu hören.

    • Es gibt auch Fetch-MCP, das ebenfalls auf Playwright basiert und Batch-Verarbeitung unterstützt. Ein Vergleich wäre interessant.
  • Wir brauchen ein MCP für Capybara, damit LLMs meine Rails-Systemtests schreiben und debuggen können, wenn sie nicht funktionieren.

  • code --add-mcp

    • Ich frage mich, ob VS Code einen integrierten MCP-Client hat.
  • Ich frage mich, ob dieses Tool für Testautomatisierung gedacht ist oder dafür, Playwright in einem Agenten als „Operator“ zu verwenden.