1 Punkte von GN⁺ 2024-02-06 | 1 Kommentare | Auf WhatsApp teilen

Vesuvius Challenge 2023 Grand Prize gewonnen: Erste Schriftrolle erfolgreich gelesen

  • In Herculaneum wurden Papyrus-Schriftrollen entdeckt, die vor 2000 Jahren bei einem Vulkanausbruch verschüttet wurden.
  • Diese Schriftrollen sind verkohlt und können ohne Hitze nicht geöffnet werden, ohne beschädigt zu werden.
  • Am 15. März 2023 starteten Nat Friedman, Daniel Gross und Brent Seales die Vesuvius Challenge.
  • Hochauflösende CT-Scans wurden veröffentlicht, und es wurden Preisgelder von über 1 Million US-Dollar ausgelobt.
  • Eine weltweite Community machte sich mithilfe von Computer Vision und Machine Learning an die Lösung des Problems.
  • Im Dezember 2023 konnte erstmals seit 2000 Jahren ein Teil einer Schriftrolle gelesen werden, obwohl noch 95 % der Schriftrolle erhalten sind.

Grand Prize

  • Für den Grand Prize der Vesuvius Challenge gab es viele hervorragende Einreichungen.
  • Das Jury-Team bewertete die Einreichungen den gesamten Januar über.
  • Das Team aus Youssef Nader, Luke Farritor und Julian Schilliger wurde als Gewinner des Grand Prize ausgewählt.
  • Dieses Team stellte unabhängig voneinander die größte Menge an Text wieder her.
  • Der eingereichte Code und die Methoden wurden vom technischen Team verifiziert und reproduziert.
  • Preisgeld: 700.000 US-Dollar.

Zweitplatzierte

  • Die Zweitplatzierten erhielten jeweils 50.000 US-Dollar.
  • Sie präsentierten neue Ansätze für die Feinheiten von Ink Labeling und Sampling.

Was sagt die Schriftrolle?

  • Es gelang, etwa 5 % der ersten Schriftrolle virtuell zu entrollen und zu lesen.
  • Diese Schriftrolle ist keine Duplikation bereits bekannter Werke, sondern enthält einen antiken Text.
  • Der Text behandelt das Thema Lust und enthält eine philosophische Diskussion über die Freude an Essen und Musik.

Wie genau sind die Bilder?

  • Es wurden verschiedene Maßnahmen ergriffen, um zu verhindern, dass das Machine-Learning-Modell „Halluzinationen“ erzeugt.
  • Eingesetzt wurden technische Reproduzierbarkeit, verschiedene Einreichungen für denselben Bereich sowie kleine Eingabe-/Ausgabefenster.

Wie entrollt man eine Schriftrolle?

  • Das virtuelle Entrollen besteht aus drei Schritten: Scannen, Segmentierung und Tintentdeckung.
  • Mit Röntgentomografie an der Diamond Light Source werden 3D-Scans erzeugt.
  • Segmentierung ist der Prozess, bei dem die Schichten der komplexen Schriftrolle identifiziert und entfaltet werden.
  • Die Tintentdeckung nutzt ein Machine-Learning-Modell, um in den entfalteten Bereichen Zonen mit Tinte zu identifizieren.

Was war dafür nötig?

  • Die Vesuvius Challenge hofft, das Problem des Lesens der Herculaneum-Papyri zu lösen und ähnliche Projekte zu inspirieren.
  • Wichtig waren eine klare Zielsetzung, ein robuster Ausgangspunkt, die Balance aus Wettbewerb und Zusammenarbeit, die Anstellung eines internen Segmentierungsteams und die Maximierung der Angriffsfläche für Durchbrüche.

Was kommt als Nächstes? Bekanntgabe des Vesuvius Challenge Grand Prize 2024.

  • Das Ziel für 2024 ist, von 5 % einer Schriftrolle auf 90 % von vier Schriftrollen zu kommen.
  • Der Grand Prize 2024 soll an das erste Team vergeben werden, das dies erreicht.
  • Die Automatisierung des Segmentierungsprozesses ist ein zentrales Ziel.

Danksagung

  • Dank gilt allen Mitwirkenden des Projekts, den Spendern, dem Organisationsteam, den Partnern, den Wissenschaftlerinnen und Wissenschaftlern, dem Support-Personal und den Gewinnern des Grand Prize.

GN⁺-Meinung:

  • Dieses Projekt ist ein bedeutender Fortschritt, der durch die Verbindung von digitaler Restaurierung antiker Dokumente und Machine Learning ein neues Verständnis der Menschheitsgeschichte ermöglicht.
  • Die Vesuvius Challenge kann als Best Practice gelten, um innovative Forschung an der Schnittstelle von Technologie und Geisteswissenschaften zu fördern.
  • Solche Bemühungen könnten kulturelles und philosophisches Wissen wiederherstellen, das potenziell über Jahrtausende vergessen war, und der modernen Gesellschaft neue Einsichten liefern.

1 Kommentare

 
GN⁺ 2024-02-06
Hacker-News-Kommentare
  • Zusammenfassung des ersten Kommentars:

    • Faszinierend sind die Technik des digitalen Entrollens der Schriftrolle, die Methode, Risse im Papier als Tintendignal zu erkennen, und der Prozess, dafür ein Modell Stück für Stück zusammenzusetzen.
    • Es besteht Verwirrung über den Einsatz von TimeSFormer. Er war als Modell für Videos bekannt, daher stellt sich die Frage, wie er auf Bilder angewendet wurde.
    • Ein großartiger Tag für die Archäologie, und ein großer Applaus für die jungen Köpfe für diese Leistung.
  • Zusammenfassung des zweiten Kommentars:

    • Erstaunen darüber, wie unmöglich das Projekt wirkte und wie klug die beteiligten Menschen sind.
    • Anfangs wurde gedacht, dass es 5–10 Jahre dauern würde, doch nun gibt es Überraschung und Glückwünsche zu dem Erreichten.
  • Zusammenfassung des dritten Kommentars:

    • Die Technologie ist so erstaunlich weit entwickelt, dass sie kaum noch von Magie zu unterscheiden ist.
    • Es wird die Frage aufgeworfen, ob diese Machine-Learning-Technik erst vor Kurzem entdeckt wurde oder schon lange existiert und nun mit der Popularität solcher Algorithmen auf neue Probleme angewendet wird.
  • Zusammenfassung des vierten Kommentars:

    • Eines der beeindruckendsten Dinge, die dieses Jahr gelesen wurden: Dass man Text aus einer 2000 Jahre alten verkohlten Schriftrolle lesen kann, wirkt wie Science-Fiction.
  • Zusammenfassung des fünften Kommentars:

    • Die manuelle Trennung der gescannten Schriftrollen und die Kosten für das Scannen neuer Schriftrollen sind die größten Engpässe, um mehr Text lesen zu können.
  • Zusammenfassung des sechsten Kommentars:

    • Ein faszinierender Aspekt der Archäologie ist die Praxis, manche Artefakte absichtlich nicht zu untersuchen und sie für die Technologie der Zukunft aufzubewahren.
    • Die ursprünglichen Entdecker versuchten, die Schriftrollen zu entrollen, erkannten jedoch, dass es unmöglich war, und ließen den Rest unberührt.
  • Zusammenfassung des siebten Kommentars:

    • Erstaunliche Arbeit, wenn man bedenkt, dass das ursprüngliche Modell auf einer 1070-Grafikkarte trainiert wurde.
  • Zusammenfassung des achten Kommentars:

    • Große Begeisterung über die Möglichkeit, dass diese Sammlung von Schriftrollen verlorene Geschichten enthalten könnte.
  • Zusammenfassung des neunten Kommentars:

    • Philodemos schrieb in einer Villa, die von der Lava des Vesuvs verschüttet wurde, und 2000 Jahre später nutzen wir Spitzentechnologie, um seine Texte zu rekonstruieren.
    • Da er ein denkender Mensch war, möchte man ihm gern sagen können, dass wir seine Schriften lesen können.
  • Zusammenfassung der relevanten Links:

    • Es werden ein Artikel über einen Informatikstudenten, der das erste Wort in den Herculaneum-Schriftrollen entdeckte, sowie ein Diskussionslink zur Vesuvius Challenge bereitgestellt.