Hauptpreis des Vesuvius Challenge 2023 vergeben: Erste Schriftrolle erfolgreich gelesen

(scrollprize.org)

1 Punkte von GN⁺ 2024-02-06 | 1 Kommentare | Auf WhatsApp teilen

Die Vesuvius Challenge 2023 hat Teile des seit 2.000 Jahren unsichtbaren Textes der verkohlten Herculaneum-Papyri wiederhergestellt, indem sie gelesen wurden, ohne die Rollen zu entrollen
Das Team aus Youssef Nader, Luke Farritor und Julian Schilliger erhielt den Hauptpreis von 700.000 US-Dollar, nachdem es die Vorgabe von 4 Passagen mit jeweils 140 Zeichen und einer Zeichenrekonstruktionsrate von über 85 % erfüllt hatte; die Einreichung enthielt 15 Spalten und mehr als 2.000 Zeichen Text
Die wiederhergestellte Schriftrolle scheint kein Duplikat eines bekannten Werks zu sein, sondern ein bislang unveröffentlichter antiker Text, der als epikureischer philosophischer Text über Musik, Nahrung, Sinne und Lust gelesen wird
Die Schlüsseltechnologie kombiniert Röntgentomographie, 3D-Segmentierung der Papyruslagen und ML-basierte Tintenerkennung; der prämierte Code und die Trainingsdaten sind öffentlich verfügbar, sodass Reproduktion und Verifikation möglich sind
Ziel für 2024 ist die Ausweitung von der Entzifferung von etwa 5 % der ersten Schriftrolle auf die Entzifferung von 90 % der 4 gescannten Rollen; der größte Engpass ist die Automatisierung der arbeitsintensiven Segmentierung

Eine 2.000 Jahre alte Schriftrolle lesen, ohne sie zu öffnen

Die Herculaneum-Papyri sind verkohlte Papyrusrollen, die beim Ausbruch des Mount Vesuvius im Jahr 79 n. Chr. karbonisiert wurden; sie wurden im 18. Jahrhundert entdeckt und heute werden Hunderte davon in einer Bibliothek in Naples, Italien, aufbewahrt
Da sie sich in Form verkohlter Ascheklumpen befinden, könnten sie beim physischen Entrollen schwer beschädigt werden, weshalb zum Lesen der inneren Schrift eine zerstörungsfreie Methode nötig war
Nat Friedman, Daniel Gross und Brent Seales starteten am 15. März 2023 die Vesuvius Challenge
- Schriftrollen des Institut de France wurden am Teilchenbeschleuniger Diamond Light Source nahe Oxford per hochauflösender CT aufgenommen
- Auf Basis der veröffentlichten CT-Scans kombinierten Teilnehmende weltweit Computer Vision, Machine Learning und manuelle Arbeit, um das Problem zu lösen
- Das Gesamtpreisgeld betrug mehr als 1 Million US-Dollar, bereitgestellt von mehreren Spendern
Im Dezember 2023 gelang es den Teilnehmenden, einen Teil der ersten Schriftrolle zu lesen
- In PHerc.Paris. 4 wurde ein seit 2.000 Jahren unsichtbarer Text sichtbar
- Noch immer sind etwa 95 % der Schriftrolle ungelesen

Ergebnis des Grand Prize 2023

Einreichungen für den Grand Prize gingen bis kurz vor Ablauf der Frist am 1. Januar 2024 um Mitternacht ein und wurden im Januar vom Papyrologie-Team und dem Technik-Team geprüft
- Das Papyrologie-Team prüfte den Text von 15 Spalten aus anonymisierten Einreichungen
- Das Technik-Team auditierte und reproduzierte den eingereichten Code und die Methoden
Der Hauptpreis ging an das Team aus Youssef Nader, Luke Farritor und Julian Schilliger
- Das Preisgeld betrug 700.000 US-Dollar
- Die Vorgabe waren 4 Passagen mit jeweils 140 Zeichen und mindestens 85 % Wahrscheinlichkeit der Zeichenrekonstruktion
- Viele im Organisationsteam hielten die Erfolgswahrscheinlichkeit bei Bekanntgabe der Kriterien für unter 30 %
- Die prämierte Einreichung enthielt zusätzlich 11 weitere Spalten und insgesamt mehr als 2.000 Zeichen Text
Alle drei trugen seit den Anfangstagen der Vesuvius Challenge zur Community bei
- Youssef Nader ist ein ägyptischer PhD-Student in Berlin und erhielt im Oktober 2023 den 2. Platz beim First Letters Prize, nachdem er einige Spalten gelesen hatte
- Luke Farritor ist ein 21-jähriger Student aus Nebraska und SpaceX-Praktikant; er gewann den 1. Platz beim First Letters Prize, nachdem er erstmals das ganze Wort ΠΟΡΦΥΡΑϹ ("purple") im Inneren einer Herculaneum-Schriftrolle gelesen hatte
- Julian Schilliger ist ein Schweizer Robotikstudent an der ETH Zürich und gewann mit seiner Arbeit an Volume Cartographer drei Auszeichnungen für Segmentation Tooling

Technischer Aufbau der prämierten Einreichung

Die Einreichung enthielt Ergebnisse aus drei Modellarchitekturen, die sich gegenseitig stützten
- Die stärksten Bilder kamen häufig aus einem auf TimeSformer basierenden Modell
- Um Overfitting und Halluzinationen zu vermeiden, wurden Ergebnisse mehrerer Architekturen, Untersuchungen zu Ein- und Ausgabefenstergrößen, Label Smoothing und Variationen der Validierungs-Folds eingesetzt
- Der Code zur Tintenerkennung ist als Open Source auf GitHub veröffentlicht
Neben starker Tintenerkennung war auch der stärkste Ansatz zur automatischen Segmentierung enthalten
- Julians ThaumatoAnakalyptor erzeugt große Papyrussegmente aus mehreren Schriftrollen
- Bereits bekannte Bereiche wurden erneut segmentiert, um frühere Tintenfunde zu verifizieren
- Auch in neuen Bereichen wie den äußersten Wicklungen der Schriftrolle wurden Buchstaben sichtbar
- Das Tool ist vielversprechend, benötigt aber noch erhebliche Verbesserungen

Zweitplatzierte und veröffentlichte Methoden

Unter den verbleibenden Einreichungen erreichten nach Bewertung des Papyrologie-Teams drei Teams gemeinsam den zweiten Platz
- Jedes Team erhielt 50.000 US-Dollar
- Die drei Einreichungen zeigten eine ähnliche Lesbarkeit und waren deutlich leichter lesbar als die übrigen Einreichungen
Veröffentlichte Einreichungen der zweitplatzierten Teams:
- Elian Rafael Dal Prá, Sean Johnson, Leonardo Scabini, Raí Fernando Dal Prá, João Vitor Brentigani Torezan, Daniel Baldin Franceschini, Bruno Pereira Kellm, Marcelo Soccol Gris, Odemir Martinez Bruno: GitHub
- Louis Schlessinger, Arefeh Sherafati: GitHub
Die zweitplatzierten Teams brachten neue Ansätze für Detailprobleme bei Tinten-Labeling und Sampling ein
In der Discord-Community kann unter einer Datenvereinbarung auf CT-Daten und zusätzliche Bilder zugegriffen werden; Entdeckungen und Zusammenarbeit der Teilnehmenden gehen weiter

Inhalt des wiederhergestellten Textes

Bislang wurden etwa 5 % der ersten Schriftrolle entfaltet und gelesen
Das Papyrologie-Team hat für alle sichtbar gewordenen Spalten vorläufige Transkriptionen erstellt
Diese Schriftrolle ist kein Duplikat eines bekannten Werks, sondern ein bislang unbekannter antiker Text
Nach erster Lesung ist das Gesamtthema die in der epikureischen Philosophie als höchstes Gut verstandene Lust
- Teile zweier aufeinanderfolgender Spalten behandeln, wie sich die Verfügbarkeit von Gütern wie Nahrung auf Lust auswirkt
- Der Autor schreibt sinngemäß, man solle nicht sofort glauben, dass Seltenes notwendigerweise angenehmer sei als Reichliches
- Danach folgt der Gedankengang, dass solche Fragen häufig geprüft werden würden
Da es sich um das Ende der Schriftrolle handelt, könnte die Diskussion in einem Folgeband desselben Werks weitergeführt worden sein
Am Anfang des ersten Textes wird eine Person namens Xenophantus erwähnt
- Möglicherweise handelt es sich um einen Musiker, der auch in Philodemus’ On Music erwähnt wird
Philodemus war eine Figur der epikureischen Schule und gilt als Philosoph, der in der kleinen Bibliothek der Villa tätig war, in der die Schriftrollen gefunden wurden
Richard Janko hält es für sehr wahrscheinlich, dass der Autor der Philosoph und Dichter Philodemus war, der als Lehrer Vergils gilt
- Er hält es für gut möglich, dass der Text die Wirkung von Musik auf Hörer mit anderen Freuden wie Essen und Trinken vergleicht
- Ebenso könnte es sich um einen Text aus einer vierteiligen Abhandlung über Musik handeln, von der bereits ein bekanntes Buch 4 existiert
Federica Nicolardi sieht in dem Text einen vom Epikureismus geprägten Text voller Musik, Nahrung, Sinneswahrnehmung und Lust
Bob Fowler meint, Philodemus habe Lust hoch geschätzt, dabei aber nicht bloße Ausschweifung gemeint, sondern richtig verstandene Lust

Wie die Genauigkeit der Ergebnisbilder verifiziert wurde

Die Möglichkeit von Halluzinationen, bei denen ein ML-Modell Buchstaben oder Bilder erzeugt, die den Trainingsdaten ähneln, war ein Prüfpunkt
Das technische Review-Team der Vesuvius Challenge reproduzierte die prämierte Einreichung manuell
- Es verstand jeden Teil des Codes und prüfte, ob bei unabhängiger Ausführung ähnliche Ausgabebilder entstehen
- Da Code und Trainingsdaten veröffentlicht sind, können auch andere dieselbe Verifikation durchführen
Mehrere Einreichungen lieferten in denselben Bereichen der Schriftrolle sehr ähnliche Ergebnisse
- Das Segmentierungs-Team der Veranstalter veröffentlichte 3D-gemappte Papyrusblätter im CT-Scan, also Segmente
- Die Teilnehmenden verwendeten unterschiedliche ML-Modelle und Trainingslabels, erzeugten aber ähnliche Ausgabebilder
- Diese Übereinstimmung zeigte sich nicht nur beim Gewinnerteam und den Zweitplatzierten, sondern auch bei anderen Einreichungen
Die Modelle zur Tintenerkennung basieren nicht auf griechischen Buchstaben, OCR oder Sprachmodellen
- Stattdessen erkennen sie winzige Tintenpunkte im CT-Scan unabhängig voneinander
- Buchstaben erscheinen erst später, wenn sich diese kleinen Erkennungsergebnisse zusammensetzen
- In manchen Fällen ist die Ausgabe binär: „Tinte“ oder „keine Tinte“
- Aufgrund dieser Struktur gilt die Wahrscheinlichkeit als sehr gering, dass das Modell buchstabenähnliche Formen halluziniert

Die drei Schritte des virtuellen Entrollens

Das virtuelle Entrollen besteht im Wesentlichen aus Scan, Segmentierung und Tintenerkennung
Scan
- Schriftrollen oder Fragmente werden per Röntgentomographie als 3D-Scan erfasst
- Diamond Light Source ermöglicht mit einem parallelen Röntgenstrahl hoher Flussdichte schnelle und präzise hochauflösende Bildgebung
- Die Röntgenaufnahmen werden durch tomographische Rekonstruktionsalgorithmen in voxelbasierte 3D-Volumina umgewandelt, wodurch Stapel von Schnittbildern entstehen
Segmentierung
- Einzelne Lagen des in 3D-Raum eingerollten und zerknitterten Papyrus werden verfolgt, dann entfaltet und planarisiert
- Hauptsächlich wird Volume Cartographer verwendet, das unter anderem von Seth Parker aus dem Labor von Brent Seales entwickelt wurde
- Julian Schilliger und Philip Allgaier erweiterten das Tool
- Ein festes Segmentierungs-Team aus Ben Kyles, David Josey und Konrad Rosenberg nutzte automatische Algorithmen zusammen mit manuellen Anpassungen
- Die Segmentierung ganzer Schriftrollen ist weiterhin extrem mühsam und bietet viel Raum für Verbesserungen
Tintenerkennung
- Stephen Parsons zeigte, dass Herculaneum-Tinte in CT-Scans theoretisch erkennbar ist, zuvor war dies aber nur bei kleinen Fragmenten möglich
- Das Erkennen von Tinte in großen Scans vollständiger Schriftrollen war bis dahin noch nicht erreicht

Durchbruch bei der Tintenerkennung

Der erste Durchbruch war die Entdeckung des crackle pattern
- Casey Handmer entdeckte im Sommer 2023 beim Betrachten der Rohdaten planarisierter Oberflächenvolumina ein auffälliges crackle pattern, das wie Buchstaben aussah
- Für diese Entdeckung erhielt er den First Ink Prize und teilte sie mit der Community
- Luke Farritor fand in den vom Segmentierungs-Team erzeugten planariserten Oberflächenvolumina weitere crackles, trainierte damit ein Modell und gewann im Oktober den First Letters Prize
Die zweite Entwicklung war der Kaggle competition
- Hunderte Teams entwickelten Machine-Learning-Modelle zur Tintenerkennung in geöffneten Fragmenten
- Diese Fragmente waren Stücke, die vor Jahrhunderten beim physischen Entrollen abgefallen waren
- Die Teilnehmenden konnten Ground-Truth-Daten aus Fotos dieser Fragmente verwenden
- Die Modelle erzielten starke Leistung, schienen aber anfangs auf den vom Segmentierungs-Team erzeugten planariserten Segmenten nicht gut zu funktionieren
- Youssef Nader erzielte mit Domain-Adaptation-Techniken den 2. Platz beim First Letters Prize
Nach dem First Letters Prize rückte der Grand Prize in greifbare Nähe, und Youssef, Luke und Julian bildeten ein Team

Arbeitsweise, die zum Erfolg 2023 beitrug

Das Projekt zog dank seines klaren und ungewöhnlichen Ziels früh Berichterstattung, Spenden und eine stark intrinsisch motivierte Community an
Die über 20 Jahre aufgebaute Grundlage von Brent Seales und seinem Team war entscheidend
- der erste Scan einer Schriftrolle
- der Aufbau von Volume Cartographer
- der erste erfolgreiche Fall virtuellen Entrollens
- der Nachweis, dass Herculaneum-Tinte in CT erkennbar ist
Um Wettbewerb und Zusammenarbeit zu verbinden, wurden Progress Prizes eingeführt
- Ungefähr alle zwei Monate gab es kleinere Preise im Bereich von 1.000 bis 10.000 US-Dollar
- Voraussetzung für einen Progress Prize war die Open-Source-Veröffentlichung von Code oder Forschung
- Das hob das Niveau der gesamten Community und unterstützte Investitionen in Geräte, Compute, Zeit und Teamaufbau
Ebenfalls zentral war die Entscheidung, ein festes Segmentierungs-Team anzustellen
- Um die Gewinnchancen zu erhöhen, wurde die Engpassarbeit des Papyrustrackings intern erledigt
- Die Qualität der Segmentierung lässt sich vor der Tintenerkennung schwer beurteilen, und Belohnung nach Menge hätte die Qualität gefährden können
- Labeling-Arbeit ist monoton, zeitaufwendig und hat eine lange Lernkurve, weshalb sie sich nur schwer allein durch Preisgelder vergüten ließ
- Diese Entscheidung führte direkt zur Entdeckung des crackle pattern durch Casey Handmer und trug zusammen mit der Community zur Entwicklung besserer Segmentierungssoftware bei
Der Erfolg war das Ergebnis vieler kleiner Durchbrüche verschiedener Menschen; um in einem großen Suchraum funktionierende Ideen zu finden, waren zahlreiche Beiträge nötig

Ziele der Stage 2 im Jahr 2024

2023 wurde bei einer Schriftrolle von 0 % auf 5 % gesteigert
Ziel für 2024 ist es, 90 % aller 4 gescannten Schriftrollen zu lesen; das erste Team, das dies schafft, erhält den Grand Prize 2024
- Genaue Bewertungskriterien sollen im März veröffentlicht werden
Der derzeit größte Engpass ist das Verfolgen der Papyrusoberflächen im Inneren der Schriftrollen
- Um heute lesbaren Text zu erzeugen, lagen die manuellen Kosten bei mehr als 100 US-Dollar pro Quadratzentimeter
- Bei dieser Kostenstruktur könnte die Segmentierung aller Schriftrollen Hunderte Millionen oder sogar Milliarden US-Dollar kosten
- Zwar haben Tool-Verbesserungen die Effizienz erhöht, doch der Prozess ist weiterhin zu manuell und zu teuer
Das Kernziel der Stage 2 ist die Fertigstellung der automatischen Segmentierung
- Wenn sie zuverlässig funktioniert, könnten auch schwierige Bereiche gelesen werden, die stark komprimiert, gerissen, delaminiert oder beschädigt sind
- Dazu gehören auch Bereiche, in die die aktuellen Tools nicht vordringen
2024 soll der Grand Prize bestehen bleiben, zugleich soll der Anteil der Preisgelder für Community-Beiträge erhöht werden
Zusätzlich zum festen Segmentierungs-Team soll ein kleines Software- und ML-Team eingestellt werden, das offen mit der Community zusammenarbeitet

Größeres Ziel und verbleibendes Potenzial

Das spätere Ziel ist es, alle Schriftrollen zu scannen und zu lesen
Die Schriftrollen in Naples enthalten schätzungsweise mehr als 16 MB Text
Teile des Papyrologie-Teams halten die Veröffentlichung dieses Textes für die größte Revolution der Klassischen Altertumswissenschaft seit der Renaissance
In der Villa of the Papyri verbleiben noch zwei nicht ausgegrabene Stockwerke
- Zumindest in Schränken und Transportkisten könnten sich weitere Papyri befinden
- Die Hauptbibliothek der Villa wurde noch nicht gefunden
- Dort könnten ein breiteres Spektrum griechischer und lateinischer Literatur sowie Tausende oder Zehntausende von Schriftrollen begraben liegen
Details zu den nächsten Plänen stehen im Master Plan

1 Kommentare

GN⁺ 2024-02-06

Hacker-News-Meinungen

Als ich dieses Projekt Anfang letzten Jahres zum ersten Mal auf HN gesehen habe, war ich erstaunt, wie nahezu unmöglich es wirkte und wie klug die Beteiligten waren.
Obwohl ein paar herausragende Namen dabei waren, dachte ich unbewusst, dass es mindestens 5 bis 10 Jahre dauern würde, bis ein Durchbruch gelingt.
Heute empfinde ich dieselbe Bewunderung und bin erneut verblüfft, wie absurd großartig das ist. Glückwunsch an die Gewinner und an alle Beteiligten.
- Vieles, was völlig unrealistisch wirkte, wird Realität. Einen vollständig verkohlten Scroll zu sehen und auf die Idee zu kommen, ihn lesen zu wollen, schien absurd.
  Dass ein Computer zu meinen Fotos einmal unheimlich präzise Alt-Texte schreibt, sogar mit rhetorischem Ausschmücken, hätte ich auch erst in 20 Jahren erwartet – und jetzt ist es schon so weit.
- Letztlich ist es eine Frage der Anreizstruktur. Eine Million Dollar ist viel Geld, und bei den meisten schwierigen Problemen passt die Belohnung im Verhältnis zum Aufwand nicht, sodass sich nicht viele kluge Köpfe daran setzen.
  In Machine Learning, Mathematik und angrenzenden Bereichen gibt es bereits viele gut bezahlte Karrieren, daher ist es schwer, die Aufmerksamkeit der besten Fachleute für etwas zu gewinnen, das am Ende scheitern könnte.
  Es geht nicht nur um die Geldprämie selbst; eine Herausforderung mit einem großen Preis erhöht auch das Prestige, eine Lösung zu finden. Auch der Nobelpreis ist letztlich mit rund einer Million Dollar dotiert.
  Wenn jemand 100 Millionen Dollar auf die Entzifferung des Voynich-Manuskripts oder von Linear A ausloben würde, wäre ich ziemlich sicher, dass es innerhalb von drei Jahren eine Lösung gäbe.
Als die ersten Ergebnisse etwa im Oktober letzten Jahres allmählich auftauchten, war ich beim Lesen extrem begeistert. Besonders die Methodik war faszinierend.
Beeindruckend war der Prozess: Zuerst wurde die Schriftrolle digital entrollt, dann stellte man fest, dass Spuren wie Risse im Papier Signale der Tinte waren, und anschließend baute man ein Modell, das diese Stück für Stück erkennt.
Um genau zu wissen, was sie gemacht haben, muss man sich das finale Repository ansehen, aber es sieht so aus, als hätten sie TimeSFormer verwendet. Ich kannte das als etwas für Videos und frage mich, wie sie es auf Bilder angewendet haben.
Auf jeden Fall ist das ein wirklich großartiger Tag für die Archäologie, und diese jungen Talente verdienen großen Applaus für das, was sie erreicht haben.
- So wie ich es verstanden habe, hat der Scan der Schriftrolle offenbar die Schichten selbst zurückgegeben.
  Grob sieht die Struktur so aus:
```
xxxxxxxxxx <- Oberfläche der Schriftrolle

xxxxxxxxxx

...

xxxxxxxxxx <- Unterseite der Schriftrolle  
```
  Wenn man also das Oberflächenbild in Kacheln aufteilt, erhält man Daten der Größe size_x * size_y * n_layers.
  Man kann es also als Videostream der Form size_x * size_y * 1 channel * n_layers betrachten, wobei die Schichten hier die Zeitdimension ersetzen.
Der Satz „Jede hinreichend fortgeschrittene Technologie ist von Magie nicht zu unterscheiden“ passt hier perfekt.
Die magische technische Leistung, einen schwarzen, versengten und verbrannten Klumpen Schriftrolle in lesbaren Text zu verwandeln, ist wirklich absurd.
Ich kenne Machine Learning nur sehr oberflächlich und frage mich, ob die im Artikel beschriebenen Techniken erst kürzlich entdeckt wurden oder ob es sie schon seit geraumer Zeit gibt.
Außerdem frage ich mich, ob diese Algorithmen einen Wendepunkt erreicht haben und dadurch breiter eingesetzt werden, sodass sie nun häufiger auf neue Weise auf alte Probleme angewendet werden.
- Es gab definitiv einen positiven Kreislauf zwischen universell einsetzbarer GPU-Rechenleistung, Algorithmen, Bibliotheken und Software, die diese Hardware nutzen, sowie den Forschern, die mit diesen Werkzeugen arbeiten.
- Wenn wir bereits auf dem Niveau sind, schwarz verkohlte Schriftrollen in lesbaren Text zu verwandeln, fragt man sich, was wir in 100 Jahren mit dem Gehirn lebender oder toter Menschen tun können.
  In 10.000 Jahren rekonstruieren wir vielleicht Lichtkegel. Vielleicht sind wir genau solche Wesen. Nicht ernst gemeint, aber ein interessantes Gedankenexperiment.
Es gibt einen Link zum „Masterplan“, um alle ausgegrabenen Schriftrollen zu lesen: https://scrollprize.org/master_plan
Die wichtigsten Engpässe für das Lesen weiterer Schriftrollen scheinen zwei zu sein: Bei der Segmentierung gescannter Schriftrollen ist manuelle Mitarbeit nötig, und das Scannen neuer Schriftrollen ist teuer.
- Betrachtet man nur das Scannen, wirken 30 Millionen Dollar für das Scannen von 800 Schriftrollen mit unbekannter Geschichte und unbekannten Werken im Vergleich zu anderen Budgetposten nicht wie eine gewaltige Summe.
  Es scheint vorstellbar, dass jemand diese Kosten spendet und die Schriftrollen auf einmal oder in einigen großen Chargen in die Nähe eines Teilchenbeschleunigers bringt. Für eine weitere Million Dollar könnte man wohl auch so etwas wie einen Container mit Temperatur- und Feuchtigkeitskontrolle bauen und alles zusammen transportieren.
  Wenn ich 30 Millionen Dollar hätte, würde ich definitiv dafür spenden. Es wirkt wie eine der besten Verwendungen für so viel Geld. Damit könnte man die Notwendigkeit umgehen, einen Desktop-Scanner oder andere Lösungen zu entwickeln, und Crowdfunding scheint ebenfalls möglich.
  Für die Segmentierung müsste man eine kollektive Lösungsform wie Seti@Home schaffen – nur nicht für Computer, sondern für Menschen, die sich langweilen und den ganzen Tag Reddit oder Twitter scrollen.
  Man könnte es vielleicht wie ein CAPTCHA gestalten und kostenlos erledigen lassen. Wenn ich könnte, würde ich selbst ein paar Stunden im Monat an der Segmentierung arbeiten.
  Dieses Projekt ist bis hierher eine großartige Gemeinschaftsleistung gewesen; es gibt keinen Grund, die Gemeinschaft der Menschen, die die Schriftrollen verstehen wollen, nicht weiter zu öffnen und zu vergrößern. Wenn man Millionen Menschen einbindet, muss man sich nicht nur auf technische Krücken und Entwicklung verlassen. Natürlich ist technische Entwicklung auch kein schlechter Weg.
- Auch die Finanzierung ist enorm wichtig. Geld ist das Rad, das dieses Projekt antreibt. Das sage ich als jemand, der eine Zeit lang in der Nähe der Projektleute war.
  Wenn ihr jemanden kennt, der zu Phase 2 des Projekts, also zur Skalierungsphase, beitragen kann, wäre es gut, Nat Bescheid zu geben. Ich habe keinen direkten Bezug zum Projektteam, verweise nur auf diese Kontaktperson, weil sie großartig ist.
- Ein wirklich erfrischend klarer und gut strukturierter Plan. Dieses Projekt gibt einem ehrlich gesagt viel Hoffnung.
Als ich mit meiner Frau durch Italien gereist bin, war Herculaneum einer der beeindruckendsten Orte
Mir war das Ausmaß nicht wirklich klar, wie viel Asche und Erde für die Ausgrabungen weggeräumt werden musste: Es waren Dutzende Meter [1]
Es ist wirklich schade, dass der Ort nur einen Bruchteil der Aufmerksamkeit bekommt, die Pompeii erhält. Der Erhaltungszustand ist viel besser, und es war wirklich ehrfurchtgebietend [2]
Ich kann sehr empfehlen, ein paar Stunden über das Gelände zu laufen. Es ist ein wirklich erstaunlicher Ort
1: https://www.icloud.com/photos/#08dJAA5eM9jpbhlEa3fzkl5ng
2: https://www.icloud.com/photos/#076Pof4FziA7WgcI8hZrGZmzg
- Ich hatte viel Spaß mit dem Abschnitt über Herculaneum im Computerspiel Rome: Pathway to Power von 1992
  Das Spiel beginnt damit, dass man als Sklave aus Herculaneum fliehen muss, bevor der Vesuvius ausbricht. Als Kind habe ich dieses Spiel wirklich geliebt; es war so etwas wie eine immersive Simulation in isometrischer Perspektive mit klobigem Interface
  Durch dieses Spiel bekam ich Interesse am antiken Rom, und irgendwann möchte ich Herculaneum besuchen
- Die moderne italienische Stadt Ercolano liegt direkt über Herculaneum, was es ziemlich schwierig macht, den Rest der antiken Stadt auszugraben
  Bisher ist nur etwa ein Viertel ausgegraben, im Gegensatz zu Pompeii, von dem rund zwei Drittel freigelegt sind
Das ist das Coolste, was ich dieses Jahr gelesen habe. Es liest sich fast wie Science-Fiction
Wer hätte sich vorstellen können, dass es möglich sein würde, Buchstaben auf 2.000 Jahre altem, zusammengerolltem und verkohltem Papier zu lesen
- Das ist die Frucht von 270 Jahren Archäologie und Technik. Die Schriftrollen wurden 1752 ausgegraben
  Die gesamte Anhäufung der industriellen Revolution, der Wissenschaft, der Ingenieurskunst und der Fertigungskompetenz hat es ermöglicht, die Schriftrollen zu finden, zu bewahren und zu scannen, und am Ende kam die aktuelle KI-Revolution wie eine Verzierung obendrauf, die Schlussfolgerungen und Verbindungen jenseits menschlichen Verständnisses herstellt
  So ist gewissermaßen 2.000 Jahre alte antike Weisheit hervorgesprungen
- Vor mehr als zehn Jahren habe ich zum ersten Mal über die Herculaneum Papyri gelesen und mir vorgestellt, dass sie eines Tages gelesen werden könnten
  Tatsächlich läuft Forschung zum virtuellen Entrollen solcher Schriftrollen schon seit 2007 (https://en.wikipedia.org/wiki/Herculaneum_papyri#Virtual_unr...), aber ich hätte absolut nicht erwartet, dass es so schnell gehen würde
  Das zeigt einmal mehr, dass die exponentielle Beschleunigung der Technologie real ist
- Apropos „liest sich wie Science-Fiction“: Ich kann mich nicht erinnern, in welchem Roman Bücher zerstörerisch in eine Art Buchschredder gesteckt wurden, um sie komplett zu scannen
  Es gab eine Szene, in der Bücher in kleine Stücke geschnitten wurden, diese Stücke eingesaugt und im Vorbeifließen gescannt wurden, und anschließend wurden die Scans wie ein Puzzle zusammengesetzt, um den Originaltext wiederherzustellen
  Es war eine Nebenhandlung, aber mir fällt der Titel des Buchs partout nicht ein
- Früher habe ich Leute, die ihre Körper einfrieren lassen, in der vagen Hoffnung auf eine künftige Wiederbelebung, leichtfertig abgetan; jetzt bin ich etwas ins Wanken geraten
  Science-Fiction mit so einer Prämisse fände ich ziemlich reizvoll
  Ein Milliardär lässt seinen Körper, statt sich auf Maschinen zu verlassen, gefriertrocknen und in einem Krater am Südpol des Mondes lagern. Dann gründet er eine Stiftung, die Forschung zu interstellarem Antrieb fördern soll, seinen Körper auf dem Weg zum 1-Kelvin-Punkt im Boomerang Nebula an die jeweils kältesten und stabilsten gefundenen Orte bringen soll und außerdem die Forschung daran fortsetzt, ihn aus einem verkohlten Zustand wiederzubeleben
  Wegen ihres quijotischen Ziels, diese Mission zu erfüllen, stößt diese Stiftung alle möglichen Fortschritte an: praktische Kernfusion, exotischere Energieerzeugung, allgemeine künstliche Intelligenz, Gravitationsmanipulation, Nanotechnologie nach Drexler, Dyson swarm, star wisps und sich selbst modifizierende Körper
Einer der wirklich faszinierenden Aspekte der Archäologie ist die Praxis, manche Artefakte absichtlich unerforscht zu lassen
Die Leute, die die ersten Schriftrollen fanden, versuchten offenbar, einige zu entrollen, stellten dann aber fest, dass das nicht möglich war, ohne sie vollständig zu zerstören, und ließen den Rest so, wie er war
Statt es zu erzwingen und alles zu ruinieren, ließen sie sie also als Mysterium für eine zukünftige Zeit zurück
Erst zwei Jahrhunderte später können wir mit Hilfe von Technologien, die sie sich überhaupt nicht hätten vorstellen können, endlich beginnen, sie zu verstehen
- Da sie am Anfang vermutlich nichts gewonnen hätten, selbst wenn sie es erzwungen hätten, brauchte es wohl keine so enorme Selbstbeherrschung, aufzuhören
  Eher bewundere ich die Menschen der 1990er- oder frühen 2000er-Jahre. Damals hätte es vielleicht schon eine Chance gegeben, aber das Risiko war immer noch zu groß, also warteten sie, bis die Erfolgsaussichten sicherer wurden
- Ein Merkmal jener Zeit war, dass die Menschen die Römer beinahe verehrten
  Ein großer Teil der damaligen Bildung bestand im Lernen von Latein, und zugleich wusste man sehr gut, dass nur ein winziger Teil der klassischen Texte erhalten geblieben war
  Daher ist es sehr plausibel, dass sie verstanden, wie wichtig es war, diese Schriftrollen zu bewahren und sie eines Tages öffnen zu können
- Es gibt ein Beispiel, das dasselbe im makroskopischen Maßstab zeigt: https://www.smithsonianmag.com/smart-news/archaeologists-reb...
- Ebenso sind große Bereiche von Pompeii noch immer nicht ausgegraben und für die Zukunft belassen
Es ist eine erstaunliche Leistung, dass die Schriftrollen in Naples schätzungsweise mehr als 16 MB Text enthalten
Einige im Team der Papyrologie meinen, die Veröffentlichung dieses Textes werde die größte Revolution der Klassischen Philologie seit der Renaissance sein; ich hoffe, dass die italienische Regierung weitere Ausgrabungen der Villa erlaubt
- Wahrscheinlich wird sie das erlauben. Pompeii und Herculaneum werden auch zwei Jahrhunderte später noch weiter ausgegraben; die Lage ist nicht zum Stillstand gekommen
  Allerdings haben wir nur 5% dieser Schriftrollen gelesen, und es ist bereits enorm viel ausgegraben, sodass es vermutlich Jahre dauern wird, allein das zu verarbeiten, was wir schon haben
- Das große Problem ist, dass die Villa of the Papyri unter modernen Gebäuden liegt
  Das heißt nicht, dass Ausgrabungen ohne Abriss unmöglich sind, aber selbst wenn es Beispiele wie die Scavi unter dem Petersdom gibt, wird es dadurch deutlich schwieriger
Wirklich beeindruckende Arbeit, auch angesichts der Tatsache, dass das Modell, das ursprünglich den Durchbruch brachte, auf einer GTX 1070 trainiert wurde: https://twitter.com/LukeFarritor/status/1754532281690243339
- Durch große Sprachmodelle ist unser Gefühl dafür verzerrt worden, wie viel Rechenleistung nötig ist, um mit Machine Learning nützliche Dinge zu tun.
Verwandte Beiträge:
First word discovered in unopened Herculaneum scroll by CS student - https://news.ycombinator.com/item?id=37857417 - Oktober 2023, 207 Kommentare
The Vesuvius Challenge - https://news.ycombinator.com/item?id=35322809 - März 2023, 32 Kommentare
Vesuvius Challenge - https://news.ycombinator.com/item?id=35169869 - März 2023, 32 Kommentare
- Dieser heute veröffentlichte Beitrag scheint ebenfalls mehr Hintergrund zu behandeln. Ich habe ihn nicht geprüft.
  Can AI Unlock the Secrets of the Ancient World? - https://news.ycombinator.com/item?id=39261465 - Februar 2024, 1 Kommentar
  Außerdem gibt es einen Tweet, der vermutlich denselben Inhalt wie der OP behandelt.
  The $700k Vesuvius Challenge prize has been won - https://news.ycombinator.com/item?id=39261933 - Februar 2024, 2 Kommentare

Hauptpreis des Vesuvius Challenge 2023 vergeben: Erste Schriftrolle erfolgreich gelesen

Eine 2.000 Jahre alte Schriftrolle lesen, ohne sie zu öffnen

Ergebnis des Grand Prize 2023

Technischer Aufbau der prämierten Einreichung

Zweitplatzierte und veröffentlichte Methoden

Inhalt des wiederhergestellten Textes

Wie die Genauigkeit der Ergebnisbilder verifiziert wurde

Die drei Schritte des virtuellen Entrollens

Scan

Segmentierung

Tintenerkennung

Durchbruch bei der Tintenerkennung

Arbeitsweise, die zum Erfolg 2023 beitrug

Ziele der Stage 2 im Jahr 2024

Größeres Ziel und verbleibendes Potenzial

Verwandte Beiträge

1 Kommentare

Hacker-News-Meinungen