2 Punkte von GN⁺ 2026-02-22 | 1 Kommentare | Auf WhatsApp teilen
  • Die englischsprachige Wikipedia hat Archive.today auf die Blacklist gesetzt und mit der Entfernung von Links begonnen
  • Es wurde bestätigt, dass die Seite DDoS-Angriffe auf Blogs ausgelöst und Web-Snapshots manipuliert hat
  • Wikipedia-Autoren einigten sich auf die Einstellung der Nutzung, da die Zuverlässigkeit der Seite beeinträchtigt ist und das Risiko besteht, Geräte von Nutzern zu missbrauchen
  • In rund 400.000 Artikeln sind 695.000 Links enthalten; die meisten davon lassen sich nach Einschätzung durch andere Archivdienste ersetzen
  • Autoren wird empfohlen, sie durch Internet Archive, Ghostarchive, Megalodon usw. zu ersetzen oder zu entfernen

Wikipedias Entscheidung zur Sperrung von Archive.today

  • Die englischsprachige Wikipedia hat beschlossen, Archive.today auf die Blacklist zu setzen
    • Hintergrund der Entscheidung ist, dass die Seite für DDoS-Angriffe auf Blogs verwendet wurde
    • Im Verlauf der Wikipedia-Diskussion wurde ein Fall entdeckt, in dem die Seite Webseitensnapshots manipulierte und den Namen eines angegriffenen Bloggers einfügte
  • Wikipedia-Autoren gehen davon aus, dass die Manipulation eine Vergeltungsmaßnahme für einen Blogbeitrag war, der beschrieb, wie der Betreiber der Seite mehrere Pseudonyme nutzte, um seine Identität zu verschleiern

Inhalt des Konsenses in der Wikipedia-Community

  • Laut einem offiziellen Wikipedia-Update wurde beschlossen, Archive.today mit sofortiger Wirkung nicht mehr zu verwenden (deprecate) und die Seite auf die Spam-Blacklist zu setzen oder über Edit-Filter zu blockieren
    • Außerdem wurde entschieden, alle bestehenden Links zu entfernen
  • Die Community verwies als Begründung auf die Richtlinie (WP:ELNO#3), dass man „Leser nicht auf Seiten führen sollte, die die Computer von Nutzern kapern, um DDoS-Angriffe auszuführen
  • Da Belege für manipulierte Inhalte archivierter Seiten vorgelegt wurden, gilt die Zuverlässigkeit der Seite als beschädigt

Umfang der Links und Möglichkeiten zum Ersatz

  • Archive.today-Links kommen in über 695.000 Fällen in rund 400.000 Artikeln vor
  • Die Seite wurde häufig zum Umgehen von Paywalls bei Nachrichtenangeboten genutzt
  • Es gab zwar Stimmen für den Status quo, doch eine Analyse ergab, dass die meisten Links durch andere Archive ersetzt werden können
  • Einige Autoren haben bereits damit begonnen, das Verfahren zur Entfernung und Ersetzung der Links zu konkretisieren

Richtlinien für Autoren

  • Das neu veröffentlichte Dokument Wikipedia:Archive.today_guidance erklärt Autoren, wie sie Links entfernen und ersetzen können
    • Betroffene Domains sind unter anderem archive.today, archive.is, archive.ph, archive.fo, archive.li, archive.md, archive.vn
  • Ist die Originalquelle weiterhin online und inhaltlich unverändert, kann der Archive.today-Link entfernt werden
  • Alternativ ist ein Ersatz durch andere Archivdienste wie Internet Archive, Ghostarchive, Megalodon möglich
  • Existiert das Original als Druckwerk oder handelt es sich nur um einen Link aus Bequemlichkeit, kann der Archivlink selbst entfernt werden

Maßnahmen zur Stärkung von Zuverlässigkeit und Sicherheit in Wikipedia

  • Die Maßnahme wird als Schritt zur Stärkung der Zuverlässigkeit von Wikipedia und zum besseren Schutz der Nutzer bewertet
  • Die Community sieht darin eine Gelegenheit, klare Reaktionsmaßstäbe für Manipulationen und böswilliges Verhalten von Websites festzulegen
  • Künftig soll weiter darüber beraten werden, wie die Entfernung der Links effizient umgesetzt werden kann

1 Kommentare

 
GN⁺ 2026-02-22
Hacker-News-Kommentare
  • Ich habe kürzlich einen Beitrag über eine mögliche organisierte Kampagne gegen archive.today gesehen.
    Ich frage mich, ob es tiefergehende Materialien dazu gibt, wie die technische Struktur von archive.today tatsächlich funktioniert. Ich brauche mehr als bloße AI-Suchergebnisse oder frühere HN-Threads.

    • Falls sie Ziel einer organisierten Verleumdungskampagne sind, hilft es ihnen kaum, die Blogs anderer per DDoS anzugreifen oder archivierte Seiten zu verändern.
    • archive.today funktioniert für mich ziemlich gut. Oft klappt es sogar dann, wenn archive.org versagt.
      Da archive.org Löschanfragen befolgt, frage ich mich, ob archive.today angegriffen wird, gerade weil es Inhalte bewahrt, deren Löschung verweigert wird.
    • Es gab kürzlich auch Nachrichten darüber, dass mehrere Websites begonnen haben, das Internet Archive zu blockieren. Das fühlt sich wie die nächste Phase des Informationskriegs an.
    • Der Text klingt, als wäre er von AI geschrieben. Er ist stark auf Zusammenfassungen ausgerichtet und enthält keine Autoreninformationen. Mein AI-Detektor schlägt an.
  • Ich halte es für sinnlos, jemanden zu doxxen. Erst recht, wenn es sich um jemanden handelt, der normalen Nutzern einen nützlichen Dienst anbietet.
    Aber wenn archive.today seine Nutzer zu einem Botnetz macht, um DDoS-Angriffe auszuführen, oder den Inhalt archivierter Seiten verändert, dann ist das ein Problem.
    Solches Verhalten lässt die Seite wie mit Malware infiziert erscheinen und untergräbt die Glaubwürdigkeit archivierter Inhalte. Ich kann verstehen, warum Wikipedia es blockiert hat.

    • Früher bedeutete Doxxing, nicht öffentliche Informationen offenzulegen. Inzwischen aber schon das bloße Sammeln öffentlich verfügbarer Informationen als Doxxing zu bezeichnen, geht zu weit.
      Wenn jemand nur mit öffentlichen Informationen recherchiert hat, würde ich das nicht als unethisch ansehen.
    • Ironischerweise ist es interessant, dass eine Seite, die mit dauerhafter Archivierung wirbt, Beiträge entfernen lassen will, in denen sie selbst erwähnt wird. Das ist eine Art „Wer zum Schwert greift, wird durch das Schwert umkommen“.
    • Solche Probleme ließen sich vielleicht mit einem blockchainbasierten dezentralen Verifikationssystem lösen. So könnte man die Änderungshistorie verwalten, ohne das Original zu verlieren.
    • Webarchiv-Seiten müssen HTML oft leicht verändern. Für die Benutzbarkeit sind Änderungen wie das Umschreiben von Linkpfaden ganz natürlich.
      Das Problem bei archive.today ist, dass diese Änderungen wie absichtliche Manipulation wirken.
    • Die Authentizität archivierter Seiten ist der zentrale Streitpunkt. Künftig sollte genau das im Mittelpunkt der Diskussion stehen.
  • Ich habe festgestellt, dass einige X/Twitter-Snapshots von archive.today gespeichert wurden, während sie im „advancedhosters“-Konto eingeloggt waren.
    Dieses Konto ist mit einem Webhosting-Unternehmen in Zypern verbunden und verlinkte kürzlich einen Beitrag, der private E-Mails zwischen dem Betreiber von archive.today (der das Pseudonym „Volth“ verwendet) und dem Eigentümer der Seite veröffentlichte.
    Ein früherer Beitrag war ein archive.today-Link zu prorussischen und antiukrainischen Artikeln. Das wirkt wie eine interessante Spur.

    • Das Konto könnte allerdings auch ein gespendetes Konto sein. Die archive.today-Seitenfamilie nutzt manchmal kostenpflichtige Abokonten, um Paywalls zu umgehen.
      Allerdings ist diese Art des Betriebs im Unterschied zum legalen Non-Profit Internet Archive schwer von kriminellem Verhalten zu unterscheiden.
    • Man nennt es eine „interessante Spur“, aber es ist unklar, wozu das tatsächlich führen soll.
  • Letztes Jahr habe ich bei archive.today gesehen, dass archivierte Seiten nachträglich verändert wurden.
    Früher stand bei archivierten Reddit-Seiten oben rechts der Benutzername, irgendwann verschwand er. Das Problem ist, dass diese Änderung auch rückwirkend in ältere Snapshots übernommen wurde.
    Im Screenshot-Tab ist der Name weiterhin zu sehen, sodass ein Unterschied zum Original bleibt. Zuerst hielt ich das für eine Kleinigkeit, aber angesichts der jüngsten Ereignisse scheint es das nicht zu sein.

    • Das könnte allerdings eher eine Maßnahme gewesen sein, um die Offenlegung eingeloggter Konten zu verhindern, statt etwas Böswilliges.
      Wenn sie den eigentlichen Inhalt eines Reddit-Posts verändert hätten, wäre das etwas ganz anderes, aber bei reinen Kontoinformationen ist es nachvollziehbar.
  • Viele wissen es nicht, aber Perma.cc ist ein offizielles Archivierungswerkzeug, das sich für Orte wie Wikipedia gut eignet.
    Mehr dazu steht auch im Wikipedia-Artikel.

    • Allerdings braucht man nach 10 Links ein kostenpflichtiges Abo oder ein institutionelles Konto. Für eine Enzyklopädie, die jeder bearbeiten kann, ist das ungeeignet.
    • Ich denke, Wikipedia wäre besser beraten, so eine Funktion selbst zu bauen. Ein eigenes CDN betreiben sie ja bereits, also dürfte das möglich sein. Paywall-Umgehung wäre allerdings riskant.
    • Ich bin diese Woche auch zu Perma.cc gewechselt, aber bei seiten mit vielen Bildern treten Fehler auf, und Reddit wird komplett blockiert. Trotzdem gibt es Verbesserungspotenzial, weil es Open Source ist.
  • Ich frage mich, ob es einen selbst gehosteten Archivserver für den persönlichen Gebrauch gibt.
    ArchiveBox scheint der bekannteste zu sein, und ich will ihn ausprobieren. Allerdings dürfte er ohne URL-Rewrite-Funktion unpraktisch sein.
    Es wäre schön, wenn es eine Funktion gäbe, die mehrere Seiten eines Artikels automatisch miteinander verbindet.

    • Ich bevorzuge Readeck. Es ist Open Source und hat auch Apps für iOS und Android.
      Mit der Content-Scripts-Funktion kann man URL-Transformationsskripte selbst schreiben.
    • Eine weitere Alternative ist Omnom. Das GitHub-Repository ist ebenfalls öffentlich.
  • Laut einem Ars-Technica-Artikel wurde archive.today bei Wikipedia wegen DDoS-Angriffen und Inhaltsmanipulation gesperrt.
    Ich persönlich nutze archive.today kaum, weil es umständlich ist. Auf HN scheint es aber oft zur Paywall-Umgehung verwendet zu werden.
    Das Problem sind die Vergangenheit des Betreibers und seine Anonymität. Er sitzt in einer Position, in der er viele Daten über die Lesegewohnheiten von HN-Nutzern sammeln kann.

    • Ich nutze archive.today häufig. Zum Beispiel gibt es beim Lesen von Paywall-Artikeln wie denen von The Economist oft keine Alternative.
    • Wenn die .today-Domain blockiert ist, kann man einfach auf eine andere TLD wie archive.ph, archive.is oder archive.md ausweichen.
    • Es ist sinnlos, über einen Artikel zu diskutieren, ohne seinen Inhalt gelesen zu haben; deshalb ist Paywall-Umgehung auch für die Qualität der HN-Diskussionen notwendig.
    • „archive.today“ ist eigentlich nur ein Sammelbegriff für mehrere archive.tld-Domains. Wenn man sagt, es werde auf HN „beworben“, heißt das nur, dass Links dorthin oft geteilt werden.
    • Viele Nutzer verwenden archive.today einfach nur mit dem Ziel, dass alle den Inhalt lesen können.
  • Interessanterweise ist dies nicht das erste Mal, dass archive.today mit DDoS in Verbindung gebracht wird.
    Laut einem HN-Beitrag von vor 3 Jahren gab es bei archive.ph einen Fall, in dem ein DDoS-Angriff durch XmlHttpRequest-Code ausgeführt wurde.
    Ziel war damals northcountrygazette.org, und die Seite wurde so langsam, dass der Angriff offenbar tatsächlich Wirkung zeigte.
    Diese Seite hatte früher damit gedroht, Paywall-Umgeher zu verfolgen, und verwendete eine robots.txt, die Archivierung blockierte. Inzwischen scheint sie geschlossen worden zu sein.

  • Ich frage mich, ob es möglich ist, lokal ein unumkehrbares Webarchiv zu erstellen, ohne auf Drittanbieterseiten angewiesen zu sein.
    Vielleicht könnte man die vollständige TLS-Transaktion aufzeichnen und später erneut verifizieren. Natürlich bestünde bei kompromittierten Zertifikaten das Risiko von Fälschungen.

    • Zumindest wenn eine Archivseite Content-Hashes veröffentlicht, könnte man später prüfen, ob Manipulationen stattgefunden haben.
      Technisch ist auch die Wayback Machine in dieser Hinsicht nicht wirklich besser als archive.today.
    • Eine TLS-Sitzung zur Verifikation erneut abzuspielen, ist jedoch nicht möglich. Ein öffentliches Transparenzlog-System könnte stattdessen eine Alternative sein, wäre aber wegen der dynamischen Natur des Webs kaum perfekt.
  • Es gibt mehrere Self-Hosting-Archivlösungen, aber ihr Reifegrad ist sehr unterschiedlich.
    Man würde erwarten, dass es wenigstens eine Standardimplementierung gibt, die sowohl den privaten als auch den öffentlichen Einsatz unterstützt, aber das scheint noch nicht der Fall zu sein.

    • Ich sehe das genauso. Ich hätte auch gern eine einfache Alternative für den persönlichen Gebrauch.