12 Punkte von xguru 2020-12-11 | 1 Kommentare | Auf WhatsApp teilen
  • Ein Tool, das Websites lokal crawlt und bei der SEO-Analyse hilft

→ H1-, H2-Tags und Metadaten prüfen

→ Informationen jeder Seite per XPath und CSS-Selektoren extrahieren

→ Status mit einem robots.txt-Parser prüfen

→ Defekte Links und Statuscodes (3xx, 4xx, 5xx) prüfen

→ URLs per Filter ausschließen

  • Ausführbare Dateien für Windows/Mac/Linux verfügbar

  • Crawling-Ergebnisse als CSV exportieren (werden intern in SQLite gespeichert)

  • Läuft auch auf schwacher Hardware, ohne Größenbeschränkung

→ Bereits auf Websites mit mehr als 4 Millionen Seiten getestet

  • Auch als Python-Code und PyPI-Paket verfügbar (pip install greenflare)

1 Kommentare

 
xguru 2020-12-11

Ich habe es getestet, und es ruft die URLs ziemlich schnell ab und verarbeitet sie.

Das Einlesen von 5000 URLs dauert nicht lange.

Auf der Serverseite kann dabei allerdings Last entstehen, daher bitte behutsam einsetzen. ^^