Wayback-Machine-Downloader
(github.com)-
Open-Source-Tool zum Herunterladen einer Website ganz oder teilweise aus den vom Internet Archive Wayback Machine archivierten Daten
-
Lädt die neuesten Dateien einer Website / alle Dateien nach Datum / Dateien für einen bestimmten Zeitraum (
from ~ to) in der Verzeichnisstruktur herunter -
Erstellt automatisch eine
index.html-Seite, die sich mit Apache/Nginx verwenden lässt -
Lädt die Originalversion herunter, nicht die von der Wayback Machine modifizierte Version
-
Mit der Option
--listkönnen ohne Download nur die URLs als JSON gespeichert werden -
Ruby-Open-Source
4 Kommentare
Ich würde gern einen lokalen Wayback-Machine-Dienst bauen … aber ich muss erst das Projekt abschließen, an dem ich gerade arbeite, bevor ich weitermachen kann =m = … wirklich schade.
Bei der Wayback Machine sind Bilder kaputt und die UI ist mies (...), und Pocket speichert nicht die Seite selbst, sondern den Originalinhalt, wobei es auch Seiten gibt, bei denen das Speichern gar nicht funktioniert. Ich würde gern ein Open-Source-Projekt machen, das Seiten zuschneidet und dann auf dem lokalen Rechner des Nutzers oder an einem entfernten Ort speichert, die bislang gespeicherten Seiten anschließend wie bei Pocket hübsch als Liste anzeigt und beim Anklicken zur archivierten Seite führt.
Es scheint, dass Bilder in manchen Fällen nur dann korrekt funktionieren, wenn man beim Speichern die Option „Save outlinks“ aktiviert.
Ich warte erst einmal ab .. hehe
Ich werde auch warten.
Außerdem ... wenn ihr zusätzlich auch mit React erstellte Websites gut archivieren könntet ... hohoho
Ich werde warten, hehe