- Die englischsprachige Wikipedia hat Archive.today auf die Blacklist gesetzt und mit der Entfernung von Links begonnen
- Es wurde bestätigt, dass die Seite DDoS-Angriffe auf Blogs ausgelöst und Web-Snapshots manipuliert hat
- Wikipedia-Autoren einigten sich auf die Einstellung der Nutzung, da die Zuverlässigkeit der Seite beeinträchtigt ist und das Risiko besteht, Geräte von Nutzern zu missbrauchen
- In rund 400.000 Artikeln sind 695.000 Links enthalten; die meisten davon lassen sich nach Einschätzung durch andere Archivdienste ersetzen
- Autoren wird empfohlen, sie durch Internet Archive, Ghostarchive, Megalodon usw. zu ersetzen oder zu entfernen
Wikipedias Entscheidung zur Sperrung von Archive.today
- Die englischsprachige Wikipedia hat beschlossen, Archive.today auf die Blacklist zu setzen
- Hintergrund der Entscheidung ist, dass die Seite für DDoS-Angriffe auf Blogs verwendet wurde
- Im Verlauf der Wikipedia-Diskussion wurde ein Fall entdeckt, in dem die Seite Webseitensnapshots manipulierte und den Namen eines angegriffenen Bloggers einfügte
- Wikipedia-Autoren gehen davon aus, dass die Manipulation eine Vergeltungsmaßnahme für einen Blogbeitrag war, der beschrieb, wie der Betreiber der Seite mehrere Pseudonyme nutzte, um seine Identität zu verschleiern
Inhalt des Konsenses in der Wikipedia-Community
- Laut einem offiziellen Wikipedia-Update wurde beschlossen, Archive.today mit sofortiger Wirkung nicht mehr zu verwenden (deprecate) und die Seite auf die Spam-Blacklist zu setzen oder über Edit-Filter zu blockieren
- Außerdem wurde entschieden, alle bestehenden Links zu entfernen
- Die Community verwies als Begründung auf die Richtlinie (WP:ELNO#3), dass man „Leser nicht auf Seiten führen sollte, die die Computer von Nutzern kapern, um DDoS-Angriffe auszuführen“
- Da Belege für manipulierte Inhalte archivierter Seiten vorgelegt wurden, gilt die Zuverlässigkeit der Seite als beschädigt
Umfang der Links und Möglichkeiten zum Ersatz
- Archive.today-Links kommen in über 695.000 Fällen in rund 400.000 Artikeln vor
- Die Seite wurde häufig zum Umgehen von Paywalls bei Nachrichtenangeboten genutzt
- Es gab zwar Stimmen für den Status quo, doch eine Analyse ergab, dass die meisten Links durch andere Archive ersetzt werden können
- Einige Autoren haben bereits damit begonnen, das Verfahren zur Entfernung und Ersetzung der Links zu konkretisieren
Richtlinien für Autoren
- Das neu veröffentlichte Dokument Wikipedia:Archive.today_guidance erklärt Autoren, wie sie Links entfernen und ersetzen können
- Betroffene Domains sind unter anderem archive.today, archive.is, archive.ph, archive.fo, archive.li, archive.md, archive.vn
- Ist die Originalquelle weiterhin online und inhaltlich unverändert, kann der Archive.today-Link entfernt werden
- Alternativ ist ein Ersatz durch andere Archivdienste wie Internet Archive, Ghostarchive, Megalodon möglich
- Existiert das Original als Druckwerk oder handelt es sich nur um einen Link aus Bequemlichkeit, kann der Archivlink selbst entfernt werden
Maßnahmen zur Stärkung von Zuverlässigkeit und Sicherheit in Wikipedia
- Die Maßnahme wird als Schritt zur Stärkung der Zuverlässigkeit von Wikipedia und zum besseren Schutz der Nutzer bewertet
- Die Community sieht darin eine Gelegenheit, klare Reaktionsmaßstäbe für Manipulationen und böswilliges Verhalten von Websites festzulegen
- Künftig soll weiter darüber beraten werden, wie die Entfernung der Links effizient umgesetzt werden kann
1 Kommentare
Hacker-News-Kommentare
Ich habe kürzlich einen Beitrag über eine mögliche organisierte Kampagne gegen archive.today gesehen.
Ich frage mich, ob es tiefergehende Materialien dazu gibt, wie die technische Struktur von archive.today tatsächlich funktioniert. Ich brauche mehr als bloße AI-Suchergebnisse oder frühere HN-Threads.
Da archive.org Löschanfragen befolgt, frage ich mich, ob archive.today angegriffen wird, gerade weil es Inhalte bewahrt, deren Löschung verweigert wird.
Ich halte es für sinnlos, jemanden zu doxxen. Erst recht, wenn es sich um jemanden handelt, der normalen Nutzern einen nützlichen Dienst anbietet.
Aber wenn archive.today seine Nutzer zu einem Botnetz macht, um DDoS-Angriffe auszuführen, oder den Inhalt archivierter Seiten verändert, dann ist das ein Problem.
Solches Verhalten lässt die Seite wie mit Malware infiziert erscheinen und untergräbt die Glaubwürdigkeit archivierter Inhalte. Ich kann verstehen, warum Wikipedia es blockiert hat.
Wenn jemand nur mit öffentlichen Informationen recherchiert hat, würde ich das nicht als unethisch ansehen.
Das Problem bei archive.today ist, dass diese Änderungen wie absichtliche Manipulation wirken.
Ich habe festgestellt, dass einige X/Twitter-Snapshots von archive.today gespeichert wurden, während sie im „advancedhosters“-Konto eingeloggt waren.
Dieses Konto ist mit einem Webhosting-Unternehmen in Zypern verbunden und verlinkte kürzlich einen Beitrag, der private E-Mails zwischen dem Betreiber von archive.today (der das Pseudonym „Volth“ verwendet) und dem Eigentümer der Seite veröffentlichte.
Ein früherer Beitrag war ein archive.today-Link zu prorussischen und antiukrainischen Artikeln. Das wirkt wie eine interessante Spur.
Allerdings ist diese Art des Betriebs im Unterschied zum legalen Non-Profit Internet Archive schwer von kriminellem Verhalten zu unterscheiden.
Letztes Jahr habe ich bei archive.today gesehen, dass archivierte Seiten nachträglich verändert wurden.
Früher stand bei archivierten Reddit-Seiten oben rechts der Benutzername, irgendwann verschwand er. Das Problem ist, dass diese Änderung auch rückwirkend in ältere Snapshots übernommen wurde.
Im Screenshot-Tab ist der Name weiterhin zu sehen, sodass ein Unterschied zum Original bleibt. Zuerst hielt ich das für eine Kleinigkeit, aber angesichts der jüngsten Ereignisse scheint es das nicht zu sein.
Wenn sie den eigentlichen Inhalt eines Reddit-Posts verändert hätten, wäre das etwas ganz anderes, aber bei reinen Kontoinformationen ist es nachvollziehbar.
Viele wissen es nicht, aber Perma.cc ist ein offizielles Archivierungswerkzeug, das sich für Orte wie Wikipedia gut eignet.
Mehr dazu steht auch im Wikipedia-Artikel.
Ich frage mich, ob es einen selbst gehosteten Archivserver für den persönlichen Gebrauch gibt.
ArchiveBox scheint der bekannteste zu sein, und ich will ihn ausprobieren. Allerdings dürfte er ohne URL-Rewrite-Funktion unpraktisch sein.
Es wäre schön, wenn es eine Funktion gäbe, die mehrere Seiten eines Artikels automatisch miteinander verbindet.
Mit der Content-Scripts-Funktion kann man URL-Transformationsskripte selbst schreiben.
Laut einem Ars-Technica-Artikel wurde archive.today bei Wikipedia wegen DDoS-Angriffen und Inhaltsmanipulation gesperrt.
Ich persönlich nutze archive.today kaum, weil es umständlich ist. Auf HN scheint es aber oft zur Paywall-Umgehung verwendet zu werden.
Das Problem sind die Vergangenheit des Betreibers und seine Anonymität. Er sitzt in einer Position, in der er viele Daten über die Lesegewohnheiten von HN-Nutzern sammeln kann.
Interessanterweise ist dies nicht das erste Mal, dass archive.today mit DDoS in Verbindung gebracht wird.
Laut einem HN-Beitrag von vor 3 Jahren gab es bei archive.ph einen Fall, in dem ein DDoS-Angriff durch XmlHttpRequest-Code ausgeführt wurde.
Ziel war damals northcountrygazette.org, und die Seite wurde so langsam, dass der Angriff offenbar tatsächlich Wirkung zeigte.
Diese Seite hatte früher damit gedroht, Paywall-Umgeher zu verfolgen, und verwendete eine robots.txt, die Archivierung blockierte. Inzwischen scheint sie geschlossen worden zu sein.
Ich frage mich, ob es möglich ist, lokal ein unumkehrbares Webarchiv zu erstellen, ohne auf Drittanbieterseiten angewiesen zu sein.
Vielleicht könnte man die vollständige TLS-Transaktion aufzeichnen und später erneut verifizieren. Natürlich bestünde bei kompromittierten Zertifikaten das Risiko von Fälschungen.
Technisch ist auch die Wayback Machine in dieser Hinsicht nicht wirklich besser als archive.today.
Es gibt mehrere Self-Hosting-Archivlösungen, aber ihr Reifegrad ist sehr unterschiedlich.
Man würde erwarten, dass es wenigstens eine Standardimplementierung gibt, die sowohl den privaten als auch den öffentlichen Einsatz unterstützt, aber das scheint noch nicht der Fall zu sein.