NYT, Atlantic und USA Today dazu auffordern, die Wayback Machine zuzulassen
(savethearchive.com)- Große Medienhäuser wie New York Times, The Atlantic, USA Today blockieren die Bewahrung von Nachrichten in der Wayback Machine, weshalb Forderungen nach einem Stopp laut werden
- Führende Medienverantwortliche sollten öffentlich zusagen, mit dem Internet Archive zusammenzuarbeiten, damit alle Nachrichten in der Wayback Machine bewahrt werden
- 2026 wird als das erste Jahr seit 30 Jahren dargestellt, in dem am World Press Freedom Day die Arbeit großer Medienhäuser nicht im Internet Archive bewahrt ist
- Die von Verlagen als Begründung genannte AI-Sorge ist hypothetisch, und im Zeitalter generativer AI wird unabhängige Bewahrung noch wichtiger
- In einer Lage zunehmender Zensur, Autoritarismus und Morddrohungen gegen Journalist:innen sorgt neutrale Drittarchivierung dafür, dass Berichterstattung nicht verschwindet
Hintergrund der Blockade
- 2026 wird als das erste Jahr seit 30 Jahren dargestellt, in dem am World Press Freedom Day die Arbeit großer Medienhäuser wie New York Times, The Atlantic und USA Today nicht bei der unabhängigen Non-Profit-Organisation Internet Archive bewahrt ist
- Die New York Times fordert das Internet Archive seit Februar dieses Jahres dazu auf, die Arbeit ihrer Reporter:innen nicht mehr in der Wayback Machine zu bewahren
- Laut einem Bericht von Wired veröffentlichte USA Today starke Recherchen, die auf die Wayback Machine angewiesen waren, blockiert aber zugleich, dass genau diese Berichte in der Wayback Machine bewahrt werden
- Nachdem mehr als 100 Journalist:innen einen Brief zur Unterstützung der Nachrichtenarchivierung des Internet Archive übergeben hatten, äußerte sich der CEO von The Atlantic, sagte jedoch keine Lösung zu
AI-Sorgen und die Rolle der Wayback Machine
- Die von diesen Medien als Grund für das Verbot der Wayback Machine genannten AI-Sorgen werden als rein hypothetisch behandelt
- Generative AI kann kein Grund sein, prinzipientreue Berichterstattung vor Faktenprüfer:innen zu verbergen; vielmehr erhöht sie den Bedarf an der Wayback Machine
- AI-Unternehmen könnten Regeln ignorieren und ohne Zustimmung Nachrichten von Verlagswebsites übernehmen, ähnlich wie nachgeahmte Archivseiten, und es gebe kaum Mittel, dies zu verhindern
- Die Wayback Machine ist etwas anderes als Dienste, die das Wort „archive“ verwenden und dem Internet Archive ähneln wollen, und sie ist kein vorübergehender Dienst
- Die Wayback Machine bewahrt Nachrichten schon länger, als viele Unterzeichnende der Petition alt sind
- Die Wayback Machine ist kein Dienst zur Umgehung von Paywalls, sondern ein unabhängiges gemeinnütziges öffentliches Gut für die Bewahrung von Journalismus
- Dass das Internet Archive sich nicht wie der Großteil des Silicon Valley verhält, liege an seiner Integrität; genau das mache es vertrauenswürdig und zu einer Institution mit langfristiger Perspektive
Nachrichtenarchivierung und Öffentlichkeit
- Pressefreiheit umfasst nicht nur die Freiheit, Artikel zu schreiben, sondern auch die Freiheit, dass diese Arbeit über Generationen hinweg gelesen und erinnert werden kann
- Mit zunehmender Zensur und Autoritarismus wächst auch der Druck, Berichte zu verändern oder Fakten zu löschen
- Journalist:innen erhalten häufig Morddrohungen, und im vergangenen Jahr seien mehrere Journalist:innen wegen ihrer Arbeit gestorben
- In einer solchen Lage müsse die neutrale Drittarchivierung der Wayback Machine gestärkt werden, damit die Arbeit von Journalist:innen nicht verschwindet
- Berichterstattung sollte nicht nur Kolleg:innen und Hinterbliebenen, sondern auch dem Blick der Geschichte zugänglich sein
- Die Wayback Machine hilft Online-Nachrichtenmedien, Druck besser standzuhalten, Artikel zu löschen, die Mächtige bedrohen
- Für Nachrichtenmedien, die tatsächlichen Journalismus betreiben, entspricht die Unterstützung einer solchen Allianz auch dem eigenen Interesse
Forderungen und Referenzen
- Die Führung großer Medienhäuser sollte öffentlich zusagen, mit dem Internet Archive zusammenzuarbeiten, um alle Nachrichten in der Wayback Machine zu bewahren
- Es sollte nicht so schwierig sein, Wege zu finden, Nachrichten unabhängig zu bewahren
-
Referenzen
1 Kommentare
Hacker-News-Kommentare
Ich frage mich, ob das passiert ist, weil archive.org robots.txt respektiert und diese Seiten die Indexierung durch Crawler blockiert haben.
Es ist frustrierend, dass das „richtige Verhalten“, robots.txt zu befolgen, dazu führt, Petitionen beantworten zu müssen, während diejenigen profitieren, die dieselben Anweisungen ignorieren.
Das ist nicht bloß eine moralische Entscheidung, sondern fast die einzig vernünftige; dass „die andere Seite profitiert“, liegt daran, dass die Verpflichtung, die einem Versprechen nahekommt, für sehr kleine oder wenig sichtbare Akteure zu schwach ist, um Klagen zu rechtfertigen.
User-agent: archive.org_bot/Disallow: /Hätten sie aktuelle Nachrichten nicht abgreifen können, wären alle großen Sprachmodelle deutlich weniger nützlich gewesen.
Man wird praktisch dazu gedrängt, Pirat zu werden, weil Piraten frei sind.
Das Problem scheint zu sein, dass man, wenn Archive.org auf Inhalte von NYT und anderen Verlagen zugreifen kann, NYT-Inhalte in großem Umfang über Archive.org sammeln kann, selbst wenn ein direktes massenhaftes Scraping bei der NYT verhindert wird.
Wenn Archive.org Scraper blockieren würde, könnten die Verlage sich anders entscheiden und den Zugang für Archive.org erlauben.
Idee: Was wäre, wenn man Scraping erlaubt, aber eine öffentliche Freigabe für ein Jahr verhindert?
So wie die Financial Times im NewsBank-Dienst mit einem 30-Tage-Escrow bereitgestellt wird, könnten auch diese einen Escrow einführen.
Wenn ich den Aluhut aufsetze, ist ein Teil des Grundes vielleicht auch, dass sie den Zustand mögen, in dem sie heimlich Änderungen vornehmen und so tun können, als hätten frühere Artikelversionen nie existiert.
Wollen Leute, die nie Werbung dieser Organisationen gesehen und nie ein Abo bezahlt haben, ernsthaft dafür kämpfen, dass diese Organisationen eine Hintertür offenhalten?
Ich kenne diese Debatte auf Seiten der Times und des Atlantic ein wenig. Dafür könnte ich Gegenwind bekommen, aber ich habe eine hochrangige Person auf der digitalen Seite gefragt, was sie von den auf HN üblichen Methoden zur Umgehung von Paywalls hält, und war wirklich überrascht, dass man dort davon noch nie gehört hatte.
Am Ende bestand Einigkeit, dass eine Freigabe nach 30 Tagen plus Zugriffsbeschränkungen für den Fall künftiger Relevanz — etwa nicht mehr als N Abrufe pro Tag — ein angemessenes Gleichgewicht wären. Soweit ich weiß, hat das Internet Archive zu diesem Thema nicht aktiv den Kontakt gesucht, und man sollte nicht nur die Verlage, sondern auch das Internet Archive zu Verhandlungen drängen.
Trotzdem werden Magazine wohl ihren Backkatalog kontrollieren wollen. Sie verkaufen schon jetzt Zugänge an Bibliotheken und Universitäten, und wie auf HN schon oft erwähnt wurde, wollen manche Nachrichtenorganisationen Artikel vielleicht ohne öffentlich sichtbare „Änderungshistorie“ ändern oder aktualisieren.
Ich frage mich, ob irgendwo ein unglückliches digitales Statistik-Dashboard offen ist und die Anbetung dieser Zahlen den eigentlichen Geist des Journalismus ersetzt hat.
Sie verhalten sich immer noch so, als lebten sie in einer Welt, in der Daten und Informationen knapp sind und sie die einzige Quelle der Wahrheit darstellen. Heute ist es umgekehrt: Es gibt keine einzelne maßgebliche Wahrheit mehr, aber Daten und Informationen im Überfluss — einschließlich falscher Daten und Lügen. Die investigativen Recherchen, die NYT und Atlantic an ihren besten Tagen leisten, schaffen echten Wert für die Welt, aber obwohl Journalistinnen und Journalisten Zugänglichkeit wollen, versuchen die Institutionen, diese Arbeit zu verstecken und zu isolieren. Idealerweise könnte jedes Kind mit NYT und Atlantic Englisch lernen, mit diesen Aufzeichnungsmedien aufwachsen und so die Welt sehen, doch das aktuelle Modell erlaubt das nicht. Eine Mischung aus Förderung und einer Wikimedia-artigen Stiftung wäre vielleicht passender: Lesende, die die Institution und ihre Mission lieben, zahlen, so viel sie möchten, erhalten je nach Betrag Vorteile, und die Beiträge fließen in einen Fonds, werden investiert und die Erträge decken einen Teil des Betriebsbudgets. Ich glaube, dass klassischer Journalismus in einer informationsreichen Welt ohne einen förderbasierten Ansatz kaum überleben kann.
Viel zu oft wurden Details und Zitate selektiv wiedergegeben oder Tatsachen aus unzuverlässigen Quellen berichtet, die sich später als völlig falsch herausstellten. Im letzteren Fall wird der Artikel stillschweigend zurückgezogen, sodass die meisten Leserinnen und Leser die Unwahrheit weiter glauben. Vielleicht wollen sie deshalb nicht archiviert werden. Dann lieber einen kleinen Blogpost verlinken: Der kann zwar voreingenommen und unzuverlässig sein, enthält aber originelle Gedanken, unterstützt Einzelpersonen und ist womöglich werbefrei. Natürlich ist es ein anderes Problem, dass hier so viele offensichtliche LLM-Blogs auftauchen.
Darauf freue ich mich: (https://news.ycombinator.com/item?id=48070516)
Wir brauchen ein kryptografisch verifizierbares Internetarchiv. Ohne so etwas wie web3 oder nostr oder gpg/pgp ist das vielleicht gar nicht möglich.
Mit einer Verankerung in Bitcoin wie bei opentimestamps ließen sich Zeitstempel kryptografisch verifizieren.
Ich habe unterschrieben, aber wir sollten ehrlich sein.
Wenn man ein Kreisdiagramm daraus machen würde, wie oft ich alte NYT-Artikel über die Wayback Machine gelesen habe, verglichen mit den Fällen, in denen ein HN-Topkommentar auf einen relativ neuen Artikel verlinkt hat und alle vorbeischauten, um die Paywall zu umgehen, dann wäre das ein perfekter Kreis.