16 Punkte von GN⁺ 2025-01-10 | 1 Kommentare | Auf WhatsApp teilen
  • Stagehand ist ein einfaches und skalierbares AI-Framework für das Web-Browsing und vollständig mit Playwright kompatibel
    • Es bietet drei einfache AI-APIs namens act, extract und observe, die Web-Automatisierung per natürlicher Sprache ermöglichen
    • Dadurch wird die Zugänglichkeit auch für nichttechnische Nutzer erhöht und die Anfälligkeit gegenüber kleinen Änderungen an UI/DOM verringert
    • Beispiele: Top-News auf Hacker News extrahieren, auf Amazon nach AirPods suchen und sie kaufen, auf ESPN die Statistiken von Steph Currys letzten 10 Spielen abrufen
  • Robuster und performanter Code für die Browser-Automatisierung lässt sich leicht schreiben.
  • In Kombination mit Browserbase stehen hervorragende Debugging-Tools wie Session-Replay und schrittweises Debugging zur Verfügung.
  • Stagehand befindet sich in einem frühen Release-Status und sammelt aktiv Feedback aus der Community.
  • MIT-Lizenz

1 Kommentare

 
GN⁺ 2025-01-10
Hacker-News-Kommentare
  • Es gibt die Meinung, dass es beim Extrahieren von Daten aus einer Seite mit Stagehand gut wäre, XPath-Elemente zurückzugeben, mit denen sich die Seite auch ohne LLM erneut scrapen lässt.

    • Beim Scrapen neuer Seiten könnte man nichtdeterministische LLM-Tools verwenden und beim erneuten Scrapen für Inhaltsaktualisierungen auf traditionelle Scraping-Methoden setzen.
    • Es wird infrage gestellt, wie stabil der Wechsel von der LLM-Version zur XPath-Version ist und ob man zur LLM-Version zurückfallen kann, falls das XPath-Skript fehlschlägt.
    • Es gibt die Meinung, dass es nützlich wäre, nach dem Scrapen mit smarten Tools im Laufe der Zeit eine Bibliothek einfacher Scraping-Skripte aufzubauen.
  • Der Idee, dass Stagehand Playwright und Ähnliches ersetzen sollte, wird nicht zugestimmt.

    • Persönlich würde man es gern als Zwischen-Workflow zum Erzeugen deterministischen Playwright-Codes nutzen, aber dieses Tool scheint eher für die direkte Ausführung gedacht zu sein.
    • Es gibt die Meinung, dass es schwer sein dürfte, den Einsatz eines LLM zur Laufzeit in einer Test-Suite in Arbeit zu rechtfertigen.
  • Es wurde versucht, mit einem ähnlichen Framework Workflow-Automatisierung umzusetzen, aber unsichtbare CAPTCHAs haben das Vorhaben gestoppt.

    • Die Art, wie eine Playwright-Instanz mit dem DOM interagiert, kann zur Erkennung führen.
    • Crawling und Scraping geraten zunehmend außer Kontrolle, weshalb das als möglicher Standard angesehen wird.
  • Es gibt die Meinung, dass der Name "create-browser-app" zu allgemein ist und man es besser "stagehand" genannt hätte.

  • Vor dem Aufbau einer Testplattform für testdriver.ai wurde mit Goodlooks ein ähnliches SDK erstellt, das jedoch keine große Resonanz erhalten hat.

    • Für Interessierte wird ein Link geteilt.
  • Nach dem Ausprobieren von Stagehand wurde es als nützliche Abstraktion empfunden.

    • Beim Aufbau eines Scrapers für feindlich gesinnte Websites ist es nützlich, dass Proxys und CAPTCHAs integriert sind.
    • Es wird gefragt, ob ähnliche Abstraktionen für MCP und die Nutzung von Computern geplant sind.
  • Es gefällt, dass sich Stagehand darauf konzentriert, Browser-Automatisierung robuster gegenüber DOM-Änderungen zu machen.

    • Die Methoden act, extract und observe sind sehr sauber gestaltet.
    • Empfohlen wird Lightpanda, ein Open-Source-Leichtgewichts-Headless-Browser.
  • Es wird gefragt, ob es eine Möglichkeit gibt, bereits geöffnete Browser-Tabs zu automatisieren.

  • Auf Slack wird die erstaunliche Geschwindigkeit der Produktentwicklung dieses Teams verfolgt, und man freut sich auf die weitere Entwicklung.

  • Es wird gefragt, ob die AI-Methoden so funktionieren, dass sie in untergeordnete Methoden von Playwright umgewandelt werden, und ob sich die tatsächlich umgewandelten Methoden debuggen lassen.

    • Es wird infrage gestellt, ob bei jedem Testlauf andere Befehle herauskommen können oder ob es ein deterministisches Verhalten gibt.