- Beim Versuch, eine saubere und praktische App zur Erfassung gelesener Bücher wie die Film-Tracking-App Letterboxd zu bauen, erwiesen sich die strukturellen Probleme des ISBN-Systems als zentrales Hindernis
- Es zeigte sich, dass die Google Books API für die Buchsuche mehrere ISBN-Versionen desselben Werks jeweils als eigene Einträge zurückgibt
- Das liegt an der bibliografischen Struktur (FRBR-Modell), die zwischen „Werk“ (work), „Expression“ (expression) und „Manifestation“ (manifestation) unterscheidet; dadurch sind die Daten stark aufgegliedert, obwohl Nutzer oft nur festhalten wollen, dass sie ein Buch gelesen haben
- OpenLibrary bietet zwar eine werkzentrierte Datenstruktur, enthält aber weiterhin Duplikate und Unvollständigkeiten und ist deshalb keine vollständige Alternative
- Anders als bei Filmdatenbanken wie TMDB fehlt im Buchbereich eine hochwertige öffentliche Metadaten-Infrastruktur, was ein zentrales Hindernis für die Entwicklung sozialer, buchzentrierter Plattformen ist
Vergleich von Letterboxd und Buchplattformen
- Letterboxd ermöglicht mit einer sauberen Oberfläche und nicht aufdringlichen Social-Funktionen eine einfache Verwaltung des Filmkonsums
- Nutzer können unkompliziert festhalten, welche Filme sie gesehen haben und wann
- GoodReads hingegen macht das Erfassen von Büchern durch eine komplexe UI und mehrstufige Klickpfade umständlich
- „Gelesene Bücher“ und „Noch zu lesen“ sind auf einer Seite vermischt, und Lesenchallenges, Newsletter und andere Zusatzelemente nehmen Platz ein
- Dass GoodReads so unkomfortabel ist, liegt daran, dass es ein Nebenprodukt mit niedriger Priorität im Buchverkaufsgeschäft von Amazon ist
- Auch Storygraph hat ähnliche Probleme, sodass Nutzer ihre persönlichen Aufzeichnungen am Ende oft in Obsidian-Dateien verwalten
Google Books API und das ISBN-Problem
- Für die Buchsuche wurde die Google Books API verwendet, dabei tauchte jedoch das Problem auf, dass dasselbe Werk unter mehreren ISBNs doppelt in den Suchergebnissen erscheint
- Sucht man zum Beispiel nach „The Last Unicorn“, werden Hardcover, Taschenbuch, eBook, überarbeitete Ausgabe usw. jeweils mit unterschiedlicher ISBN als eigene Einträge zurückgegeben
- Jede ISBN steht für ein anderes Format oder eine andere Ausgabe, Nutzer möchten aber oft nur festhalten, dass sie „das Buch gelesen haben“
- Diese Struktur erschwert Suche und Datenintegration und eignet sich daher schlecht für ein Erfassungssystem auf Ebene einzelner Werke
Das FRBR-Modell und ein werkbasierter Ansatz
- Das in der Bibliothekswissenschaft verwendete FRBR-Modell unterteilt Buchdaten in vier Ebenen
- Work (Werk): das abstrakte schöpferische Werk selbst (z. B. der Roman "The Last Unicorn")
- Expression (Expression): eine bestimmte Fassung
- Manifestation (Manifestation): das physische Format einer bestimmten Ausgabe (Taschenbuch, Hardcover usw.)
- Item (Exemplar): ein einzelner physischer Gegenstand innerhalb einer Sammlung
- Google Books liefert überwiegend Daten auf Ebene von „Expression“ oder „Manifestation“, während Nutzer eine abstrakte Einheit auf Ebene des „Werks“ brauchen
- OpenLibrary bietet eine werkzentrierte Datenstruktur, enthält aber weiterhin doppelte Einträge
- Beispiel: Bei der Suche nach Hotel Iris von Yoko Ogawa erscheint dasselbe Werk viermal
Grenzen von Datenqualität und Ökosystem
- Letterboxd basiert auf The Movie Database (TMDB), und TMDB umfasst rund 1 Million Filmdatensätze
- OpenLibrary dagegen enthält mehr als 40 Millionen Werke, aber viele der Daten sind unvollständig und nicht bereinigt
- Filmdaten sind qualitativ hochwertig, weil kommerzielle Plattformen und Community-Beiträge zusammenwirken; bei Buchdaten sind Größe und fehlende Finanzierung das Problem
- Dadurch fehlt die Datengrundlage, um einen Letterboxd-ähnlichen Dienst für Bücher aufzubauen
Fazit und weitere Versuche
- Da es keine vollständige Open-Source-Infrastruktur für Buchmetadaten gibt, ist die Entwicklung einer Plattform zur Bucherfassung deutlich schwieriger als im Filmbereich
- Der Autor will dennoch weiter versuchen, ein unabhängiges System zur Bucherfassung aufzubauen
- Wie bei der Suche nach dem eigenen Filmgeschmack braucht auch das Erfassen von Büchern einen personalisierten Ansatz
Noch keine Kommentare.