Setze immer auf Text (2014)
(graydon2.dreamwidth.org)- Text ist die mächtigste Kommunikationstechnologie der Menschheitsgeschichte und besitzt eine Ausdruckskraft und Effizienz, die alle anderen Medien übertrifft
- Er ist besser geeignet als Bilder, Videos oder Sprache, um abstrakte Konzepte und komplexe Gedanken präzise zu vermitteln
- Es ist eine Technologie, deren Langlebigkeit und Stabilität belegt sind, so sehr, dass wir noch Aufzeichnungen von vor Jahrtausenden lesen können
- Bei Speicher- und Übertragungskosten ist Text überwältigend effizient und war immer wieder der Ausgangspunkt für Fortschritte in der Kommunikationstechnik
- Beim gesellschaftlichen Umfang und der Tiefe der Nutzung – etwa für Suche, Übersetzung, Zusammenfassung und Zusammenarbeit – kann kein anderes Medium mithalten
Grundhaltung zu Text
- Bei Fragen zu Video, 3D, Spielen und dynamischen Multimediasystemen wurde immer wieder dieselbe Position vertreten
- Der Wert von Bildern, Fotos, Filmen und Musik wird nicht bestritten, doch die Überlegenheit von Text ist absolut
- Text wird als die mächtigste, nützlichste und effektivste Kommunikationstechnologie definiert
Die älteste und stabilste Technologie
- Sprache und Gebärden sind natürlicher Teil menschlicher Gesellschaften, aber Text ist eine Technologie, die durch Lernen und Weitergabe erworben wird
- Er besitzt eine zeitliche Beständigkeit, die so groß ist, dass wir heute noch Aufzeichnungen von vor etwa 5.000 Jahren lesen können
- In physische Träger wie Stein eingraviert, kann er sogar länger bestehen als die Menschheit selbst
Das flexibelste Ausdrucksmittel
- Bilder sind in bestimmten Situationen stark, aber beliebige abstrakte Sätze lassen sich visuell nicht ausdrücken
- Konzeptionelle Aussagen wie eine Definition von Menschenrechten können nicht durch Bilder ersetzt werden
- Mit Text lassen sich Ideen vermitteln, wobei sich Präzision und Grad der Mehrdeutigkeit steuern lassen
- Dass Literatur, Philosophie, Geschichte, Mathematik, Logik, Programmierung und Ingenieurwesen auf Text basieren, ist kein Zufall
Die effizienteste Form der Kommunikation
- Text besitzt bei Speicherplatz und Übertragungskosten eine Effizienz in einer ganz anderen Größenordnung
- Einige tausend Bytes Text können kleiner sein als selbst ein einfaches Icon-Bild
- Von optischer Telegrafie über elektrische Telegrafie und Fernschreiber bis zu frühen Computernetzwerken: Text war immer zuerst da
- Sprache, Bilder und Video kamen erst, als Bandbreite ausreichend günstig geworden war
- Text ist so dicht, dass sich die gesamte Wikipedia auf einem Smartphone speichern lässt
Die gesellschaftlich nützlichste Technologie
- Für 1:1-, 1:N- und M:N-Kommunikation funktioniert Text in allen Fällen effizient
- Suche und Indexierung sind möglich, auch manuell
- Für algorithmische Verarbeitung wie Übersetzung, Vergleich, Diff, Clustering, Korrektur, Zusammenfassung und Filterung ist Text optimal geeignet
- Er lässt sich asynchron nutzen, und das Tempo kann frei angepasst werden
- Er unterstützt gemeinsames Editieren, Zitieren, Anmerkungen, verzweigte Diskussionen, Zusammenfassungen, Reviews und sogar abgeleitete Werke
- Es gibt keine Technologie, die die soziale und kognitive Komplexität von Bibliotheken und Internetbeiträgen ersetzen könnte
Fazit
- Deshalb ist die Haltung zu Text eindeutig: Man sollte immer zuerst Text wählen (always pick text first)
- Um einen früheren Vorgesetzten zu zitieren: Man sollte immer auf Text setzen (always bet on text)
- Wenn sich etwas mit Text erledigen lässt, sollte man es so tun. Text enttäuscht fast nie
3 Kommentare
Text ist zwar eindeutig stabil, aber ich bin mir nicht sicher, ob er intuitiv ist.
Hacker-News-Kommentare
Ich verstehe diese Dichotomie in der Diskussion nicht
Warum sollte ich mich zwischen UTF-8 und einer Aufnahme eines Klaviervortrags entscheiden müssen?
Es wirkt, als würde jemand, der vom Thema begeistert ist, nur in einer simplen „Ford vs. Chevy“-Gegenüberstellung sprechen
Wir mögen doch alle Text, also muss man mich davon nicht extra überzeugen
Ich stimme der unendlichen Flexibilität und Haltbarkeit von Text zu, aber nachdem ich die Arbeiten von Bret Victor gesehen habe, habe ich auch die Grenzen von Text gespürt
Beim Klavierlernen gab es eine unmittelbare Feedback-Schleife, und so eine Art des Lernens lässt sich mit Text nur schwer umsetzen
Victors Kernidee ist, dieses feedbackzentrierte Lernen auch auf Ingenieurwesen und Bildung insgesamt anzuwenden
Text bleibt wichtig, aber ich denke, dass auch Ansätze mit anderer sensorischer Intuition viel Potenzial haben
Bret Victors Demos sind beeindruckend, aber die tatsächliche Umsetzung erfordert enormen Aufwand
Die Idee selbst ist großartig, aber man muss verstehen, dass ihre Realisierung große Investitionen und Hingabe verlangt
Daten oder Ergebnisse in Text zu erklären ist schwierig, aber Grafiken vermitteln auf einen Schlag viele Informationen
Text ist gut, weil er asynchron ist, aber Menschen bevorzugen instinktiv gesprochene oder visuelle Ausdrucksformen
Letztlich ist ein gemischter Ansatz natürlicher als ein einzelner Kommunikationsmodus
Ein Kind schaut einfach zu und lernt es, und versteht es durch physische Intuition
Wissen, das man wie Fahrradfahren mit dem Körper lernt, lässt sich durch Text kaum vermitteln
Text ist symbolisch, Bilder sind sinnlich
Es ist unmöglich, ein Gemälde von Norman Rockwell perfekt in Text auszudrücken
Textbasierte Symbolsysteme wie Notenschrift oder Feynman-Diagramme bleiben dennoch mächtig
Ich habe den Beitrag des OP in 30 Sekunden zusammengefasst, aber Bret Victors Video ist 54 Minuten lang, also werden die meisten es nicht ansehen
Bei Effizienz und Transformierbarkeit ist Text immer noch das optimale Medium
Andere Medien nutzt man meiner Meinung nach am besten als ergänzende Mittel
Ich bezeichne mich selbst als Text-Maximalisten
Text ist die natürliche Schnittstelle zwischen Mensch und Maschine und der Gleichgewichtspunkt zwischen Effizienz und Transparenz
Alles kann als String gespeichert und in base64, JSON, HTML, CSS, SQL usw. ausgedrückt werden
Letztlich war die Silver Bullet, nach der die Branche gesucht hat, der String
Komplexe Binärformate verlieren an Lesbarkeit, und nach GZIP-Komprimierung verschwindet der Vorteil fast vollständig
Textbasierte Protokolle werden wegen Problemen mit dem Postel’schen Gesetz instabil
Ein Unterschied von 30 % bei der Bandbreite ist keineswegs klein, und HTTP3 ist genau deshalb auf Binärformate umgestiegen
Selbst wenn man base64 komprimiert, ist die Lesbarkeit ohnehin schon verloren
Verwandte Referenzen: Robustness principle, Regex-Probleme, ReDoS
Gzip-komprimiertes JSON kann sowieso niemand direkt lesen, also ist der Einsatz von Werkzeugen kein großes Problem
Für Konfigurationsdateien, die Menschen bearbeiten, sind text proto oder JSON besser geeignet
grep, git und Konvertierung sind alle unkompliziert
Alte Arbeiten habe ich in Lotus Word Pro geschrieben und kann sie heute nicht mehr lesen; als Text wäre das kein Problem gewesen
In großen Systemen zirkulieren viele Textdateien, aber Transparenz gibt es dabei kaum
In Umgebungen im großen Maßstab führen ein paar gesparte Bits zu erheblichen Kostensenkungen, daher werden self-labeled Felder ausgeschlossen
Text ist letztlich nur eine Darstellung von Bytes
Dass man dennoch an Text festhält, liegt an der Geschlossenheit von Binärformaten und am Mangel an Werkzeugen
Selbst wenn eine CSV Millionen base64-Spalten enthält, ist sie ohne passende Tools kaum besser als ein Binärformat
Dank Standardisierung können Bedeutungen geteilt werden, und Modelle wie LLMs können das lernen
So wie man nicht „einen zufälligen Wiki-Satz als Bild ausdrücken“ kann, kann man auch nicht alles durch Text ersetzen
Umgekehrt ist es ebenso unmöglich, einen Filmclip perfekt in Text zu beschreiben
Text ist keine Obermenge aller Medien, sondern einfach eine andere Art von Darstellung
Zum Beispiel: Flight management system, NOTAM
Zur Behauptung, „Text sei die älteste und stabilste Kommunikationstechnologie“
Tatsächlich ist Sprache selbst eine ältere Technologie
Mündliche Traditionen haben Wissen über Generationen hinweg weitergegeben, und menschliche Sprache ist die komplexeste unter ihnen
Zum Beispiel überliefern die australischen Ureinwohner der Gunditjmara den Ausbruch eines Vulkans vor 30.000 Jahren in Erzählungen (Budj Bim)
Text ist insofern einzigartig, als er Informationen über Generationen hinweg ohne Verzerrung weitergeben kann
Am Ende lautet das Fazit also: „Setze auf Sprache“
LLMs sind deshalb so erstaunlich, weil die Menschheit über Jahrtausende hinweg ihr gesamtes Wissen in Text aufgezeichnet hat
Auch Bildmodelle haben sich dank eines gemeinsamen Embedding-Raums von Text und Bild weiterentwickelt
Bequem ist es, aber man kann es kaum ein wirklich „effektives“ Modell nennen
Als Linguist glaube ich, dass Text (Unicode) beim Dokumentieren bedrohter Sprachen das nachhaltigste Format ist
Selbst griechische oder sanskritische Grammatiken aus Jahrtausenden sind noch lesbar
Unser Team hat zwar als PDF veröffentlicht, intern aber alles in XML archiviert
Ich hoffe, dass es auch in 2000 Jahren noch lesbar ist
Es gab viel Verwirrung mit Encodings wie UTF-16, SJIS oder EUC, während PDF oder JPEG weiterhin problemlos geöffnet wurden
Wenn der Speicherplatz es zulässt, erscheint mir die Aufbewahrung in Bildformaten sicherer
Außerdem gibt es noch immer Zeichen, die selbst mit Unicode nicht darstellbar sind
Höhlenmalereien vermitteln die Absicht besser als Text
Wenn man sich die Reihe Future Text Publishing anschaut,
ist „Text“ im Kern einfach ein 2D-Bild
Computer verstehen keinen Text, sie verarbeiten nur Zahlen
Menschen geben diesen Zahlen Bedeutung und schaffen daraus Symbol- und Sprachsysteme
DNA/RNA kann man als Beispiel für ein physisch aufgebautes universelles Schriftsystem sehen
Dieser Beitrag wurde schon früher mehrfach auf HN eingereicht
2014, 2015 und 2021 gab es jeweils Hunderte Kommentare
Version von 2014, Version von 2015, Version von 2021
Es stimmt, dass Text wirklich ein gutes und sehr wichtiges Ausdrucksmittel ist, aber …
Man kann eben nicht alles als Text speichern.
Text ist letztlich eine komprimierte Ausdrucksform. Was wir mit unseren fünf Sinnen wahrnehmen können (Sehen, Hören, Tasten, Schmecken, Riechen), wird in eine gesellschaftlich vereinbarte Form komprimiert und so ausgedrückt.
Wenn es jedoch keine Informationen über das ursprüngliche Objekt gibt, auf das sich das bezieht, verliert dieser Text seinen Sinn, selbst wenn man die Daten noch so sehr in Textform speichert, sobald spätere Menschen dieses ursprüngliche Objekt nicht mehr kennen.
Wir wissen zwar, was eine Kassette ist, aber wenn man Kindern, die erst vor Kurzem geboren wurden, nur das Wort „Kassette“ zeigt und sie fragt, was das ist, wie viele könnten wohl noch richtig antworten? Selbst wenn man Form, Funktion und Funktionsweise einer Kassette noch so ausführlich beschreibt: Könnte man in einigen tausend Jahren allein anhand dieses Textes eine Kassette wirklich perfekt rekonstruieren?
In solchen Fällen können ein paar Fotos der Kassette, technische Zeichnungen oder einige Minuten Video, in denen man sieht, wie eine Kassette benutzt wird, viel nützlicher sein.