1 Punkte von GN⁺ 2024-02-14 | 1 Kommentare | Auf WhatsApp teilen

Versuch, die Originaldatei des WWW-Vorschlags zu öffnen

  • Auf der W3C-Website gibt es den ursprünglichen WWW-Vorschlag, den Tim Berners-Lee verfasst hat.
  • Die Originaldatei des Vorschlags ist eine Word-Datei für Macintosh 4.0 und wurde vermutlich 1990 erstellt.
  • Das Originaldokument ist 68.608 Byte groß; bei der Prüfung des Dateityps auf einem Mac wurde es als Microsoft Word for Macintosh 4.0-Datei erkannt.

Öffnungsversuche mit verschiedener Software

  • Microsoft Word: Die Originaldatei wurde auf OneDrive hochgeladen und mit der Erweiterung .doc in Microsoft Word geöffnet.
  • Apple Pages: Kann alte Microsoft-Word-for-Macintosh-Dateien nicht interpretieren.
  • Apache OpenOffice: Kann die Datei öffnen, aber die Formatierung geht verloren und Diagramme fehlen.
  • LibreOffice: Öffnet die Datei, und auch die Diagramme sind klar sichtbar; allerdings gibt es Probleme mit Rändern und anderer Formatierung.

Vergleich zwischen dem CERN-PDF und dem mit LibreOffice erzeugten PDF

  • Das von CERN bereitgestellte PDF wurde 1998 erstellt und umfasst 20 Seiten.
  • Die mit LibreOffice importierte Version umfasst 24 Seiten.
  • Beim Vergleich der beiden PDFs zeigen sich Unterschiede bei Rändern, Schriftgrößen, Headern und Footern sowie Seitenumbrüchen.

Überprüfung des Originaldokuments per Emulation

  • Durch die Emulation eines Macintosh aus den 1990er Jahren wurde das echte Word for Macintosh 4.0 ausgeführt, um zu sehen, wie das Originaldokument aussah.
  • Das Originaldokument und das CERN-PDF unterscheiden sich deutlich; das Originaldokument erscheint auf A4-Papier mit 22 Seiten.

Fazit

  • Die Konvertierung des Originaldokuments mit moderner Software ist ein Sieg für Open-Source-Software und zeigt zugleich die Schwierigkeiten der Dokumentenbewahrung.
  • Um das Dokument zu bewahren, wurde eine .odt-Version auf GitHub hochgeladen.
  • Es ist etwas enttäuschend, dass ein 34 Jahre altes Dokument noch immer schwer zu öffnen ist und selbst nach dem Öffnen nicht exakt dem Original entspricht.

Meinung von GN⁺

  • Dieser Blogpost betont die Bedeutung digitaler Bewahrung und Zugänglichkeit des ursprünglichen WWW-Vorschlagsdokuments.
  • Er zeigt, wie wichtig Open-Source-Software beim Umgang mit alten Dokumentformaten ist.
  • Er hilft dabei, die Schwierigkeiten der Dokumentenbewahrung zu verstehen, und macht deutlich, wie wichtig es ist, mit dem technischen Fortschritt Kompatibilität und langfristige Zugänglichkeit mitzudenken.

1 Kommentare

 
GN⁺ 2024-02-14
Hacker-News-Kommentare
  • Freigabe eines in ein modernes Word-Format konvertierten Dokuments

    • Es wurde ein Dokument freigegeben, das in ein modernes Word-Format konvertiert wurde und bei dem alle Vektorgrafiken und Schriftarten erhalten blieben.
    • Zum Konvertieren des Dokuments wurde es zunächst mit Word 98 geöffnet und erneut gespeichert, das auf einem per QEMU emulierten Power Mac lief.
    • Allerdings fehlten Bilder, und Word behauptete, es gebe nicht genug Speicher oder Festplattenplatz, um die Bilder anzuzeigen oder zu drucken.
    • Um die Bilder wiederherzustellen, wurde in Word 98 mit Acrobat als PDF gedruckt und anschließend jedes Bild mit Adobe Illustrator als separates PDF extrahiert.
    • Die Originalbilder zu löschen und die PDF-Ersatzdateien im Finder per Drag-and-drop einzufügen, um die Bilder wiederherzustellen, war unkompliziert.
    • Zum Vergleich wurden ein auf dem Power Mac mit Word 98 erstelltes PDF und ein mit modernem Word unter macOS Sonoma erzeugtes PDF geteilt.
  • Schriftarten und Layout prüfen

    • Wenn die originalen Schriftarten vorhanden sind, lässt sich überprüfen, wie das Dokument aussehen soll.
    • Word 4.0 hatte für unterschiedliche Ausgabeauflösungen getrennte Schriftdateien für Bildschirm und Drucker.
    • Fehlten die Druckerschriften, wurde eine skalierte Darstellung der Bildschirmschriften gedruckt; fehlten die Bildschirmschriften, wurden sie durch Systemschriften ersetzt.
    • In diesem Fall wurden die bekannten Schriftarten Palatino und Courier benötigt, aber LibreOffice ersetzte sie trotz installiertem Palatino Linotype durch Times New Roman.
  • Die Nützlichkeit des file-Befehls

    • Der file-Befehl ist sehr nützlich, um Unklarheiten über Dateien aufzulösen und hilfreiche Informationen bereitzustellen.
  • Die hervorragende Unterstützung alter Dokumentdateiformate durch LibreOffice

    • LibreOffice unterstützt alte Dokumentdateiformate sehr gut, weshalb es dafür verwendet wurde.
    • Auch die Nutzung der Emulatoren BasiliskII und InfiniteMac macht Spaß.
  • Abwärtskompatibilität von Microsoft Word

    • In der Windows-Version von Word lässt sich die Datei größtenteils gut öffnen, und das Layout entspricht dem PDF aus dem Artikel.
    • Bilder konnten wegen eines fehlenden Grafikfilters nicht geöffnet werden, aber in Word 2003 dürfte das möglich sein.
  • Die erstaunlichen Fähigkeiten von LibreOffice

    • LibreOffice kann nicht nur verschiedene Dokumentformate öffnen, sondern über Kommandozeilenoptionen auch Automatisierungsaufgaben ausführen.
  • Dokumente aus dem Emulator drucken

    • In einem Emulator mit Mac 4.0 lässt sich eine Druckwarteschlange einrichten, die .ps-Dateien (Postscript) erzeugen kann, die sich dann in PDF umwandeln lassen.
  • Enttäuschung über die Dokumentkompatibilität von Microsoft Word

    • Es wurde die Ansicht geäußert, Microsoft müsse die Verantwortung übernehmen, dass Microsoft Word Dokumente öffnen kann, die mit jeder beliebigen Word-Version erstellt wurden.
    • Wenn es Bedenken wegen Sicherheitslücken gibt, sollte eine Funktion angeboten werden, die solche Dateien in einem vom Hauptsystem isolierten Sandbox-Prozess ausführt und in eine neue Version konvertiert.
  • Mögliche Probleme mit Backups bei unbegrenzter Aufbewahrung

    • Manche Unternehmen haben Backups mit unbegrenzter Aufbewahrung, was zu Problemen führt, weil der Unterschied zwischen „lesbar“ und „nutzbar“ nicht verstanden wird.
  • Alte Macs und Word

    • Jemand besitzt einen Mac SE/30 mit System 7.1 und installiertem Word 5 und könnte helfen, das Dokument auf Office 2001 zu aktualisieren, wenn es zugeschickt wird.