9 Punkte von xguru 2020-05-12 | 3 Kommentare | Auf WhatsApp teilen
  • Erfasst nicht per Crawling, sondern durch Mitschnitt des Netzwerkverkehrs des Browsers

→ Dadurch lassen sich auch im eingeloggten Zustand sämtliche Mediendateien sowie komplexes JavaScript und dynamische Inhalte erfassen

  • Zeichnet im WARC-Standard auf, sodass sich die Aufnahmen später interaktiv wiedergeben lassen

  • Automatisierung der Erfassung bekannter Websites mit AutoPilot

  • Online-Version sowie mit Electron erstellte Desktop-Anwendung / Player verfügbar (Windows/Mac/Linux)

3 Kommentare

 
galadbran 2020-05-13

Wow, ich wusste gar nicht, dass es dafür auch einen Standard gibt … Aber wenn es ein netzwerkbasierter Ansatz ist, wird dann SSL unterstützt?

 
kunggom 2020-05-12

Dafür gab es also auch einen Standard?

Ich meine mich zu erinnern, dass früher einmal eine ähnliche Funktion zu den Firefox-Entwicklertools hinzugefügt wurde, aber das Problem war, dass es auf meinem MacBook viel zu langsam war und praktisch kaum nutzbar. Auch die Dateigröße war wirklich groß. Mal sehen, ob das hier besser ist.

 
xguru 2020-05-12

Wenn man auf Instagram AutoPilot anwendet, scrollt es automatisch und erfasst den Nutzer-Feed fortlaufend.

Für Seiten mit unendlichem Scrollen ist es nicht ganz ideal, daher lässt sich das diesmal geänderte Facebook nicht besonders gut erfassen.

WARC-Standard https://iipc.github.io/warc-specifications/