14 Punkte von GN⁺ 2025-12-28 | 3 Kommentare | Auf WhatsApp teilen
  • Text ist die mächtigste Kommunikationstechnologie der Menschheitsgeschichte und besitzt eine Ausdruckskraft und Effizienz, die alle anderen Medien übertrifft
  • Er ist besser geeignet als Bilder, Videos oder Sprache, um abstrakte Konzepte und komplexe Gedanken präzise zu vermitteln
  • Es ist eine Technologie, deren Langlebigkeit und Stabilität belegt sind, so sehr, dass wir noch Aufzeichnungen von vor Jahrtausenden lesen können
  • Bei Speicher- und Übertragungskosten ist Text überwältigend effizient und war immer wieder der Ausgangspunkt für Fortschritte in der Kommunikationstechnik
  • Beim gesellschaftlichen Umfang und der Tiefe der Nutzung – etwa für Suche, Übersetzung, Zusammenfassung und Zusammenarbeit – kann kein anderes Medium mithalten

Grundhaltung zu Text

  • Bei Fragen zu Video, 3D, Spielen und dynamischen Multimediasystemen wurde immer wieder dieselbe Position vertreten
  • Der Wert von Bildern, Fotos, Filmen und Musik wird nicht bestritten, doch die Überlegenheit von Text ist absolut
  • Text wird als die mächtigste, nützlichste und effektivste Kommunikationstechnologie definiert

Die älteste und stabilste Technologie

  • Sprache und Gebärden sind natürlicher Teil menschlicher Gesellschaften, aber Text ist eine Technologie, die durch Lernen und Weitergabe erworben wird
  • Er besitzt eine zeitliche Beständigkeit, die so groß ist, dass wir heute noch Aufzeichnungen von vor etwa 5.000 Jahren lesen können
  • In physische Träger wie Stein eingraviert, kann er sogar länger bestehen als die Menschheit selbst

Das flexibelste Ausdrucksmittel

  • Bilder sind in bestimmten Situationen stark, aber beliebige abstrakte Sätze lassen sich visuell nicht ausdrücken
  • Konzeptionelle Aussagen wie eine Definition von Menschenrechten können nicht durch Bilder ersetzt werden
  • Mit Text lassen sich Ideen vermitteln, wobei sich Präzision und Grad der Mehrdeutigkeit steuern lassen
  • Dass Literatur, Philosophie, Geschichte, Mathematik, Logik, Programmierung und Ingenieurwesen auf Text basieren, ist kein Zufall

Die effizienteste Form der Kommunikation

  • Text besitzt bei Speicherplatz und Übertragungskosten eine Effizienz in einer ganz anderen Größenordnung
  • Einige tausend Bytes Text können kleiner sein als selbst ein einfaches Icon-Bild
  • Von optischer Telegrafie über elektrische Telegrafie und Fernschreiber bis zu frühen Computernetzwerken: Text war immer zuerst da
  • Sprache, Bilder und Video kamen erst, als Bandbreite ausreichend günstig geworden war
  • Text ist so dicht, dass sich die gesamte Wikipedia auf einem Smartphone speichern lässt

Die gesellschaftlich nützlichste Technologie

  • Für 1:1-, 1:N- und M:N-Kommunikation funktioniert Text in allen Fällen effizient
  • Suche und Indexierung sind möglich, auch manuell
  • Für algorithmische Verarbeitung wie Übersetzung, Vergleich, Diff, Clustering, Korrektur, Zusammenfassung und Filterung ist Text optimal geeignet
  • Er lässt sich asynchron nutzen, und das Tempo kann frei angepasst werden
  • Er unterstützt gemeinsames Editieren, Zitieren, Anmerkungen, verzweigte Diskussionen, Zusammenfassungen, Reviews und sogar abgeleitete Werke
  • Es gibt keine Technologie, die die soziale und kognitive Komplexität von Bibliotheken und Internetbeiträgen ersetzen könnte

Fazit

  • Deshalb ist die Haltung zu Text eindeutig: Man sollte immer zuerst Text wählen (always pick text first)
  • Um einen früheren Vorgesetzten zu zitieren: Man sollte immer auf Text setzen (always bet on text)
  • Wenn sich etwas mit Text erledigen lässt, sollte man es so tun. Text enttäuscht fast nie

3 Kommentare

 
roxie 2025-12-29

Text ist zwar eindeutig stabil, aber ich bin mir nicht sicher, ob er intuitiv ist.

 
GN⁺ 2025-12-28
Hacker-News-Kommentare
  • Ich verstehe diese Dichotomie in der Diskussion nicht
    Warum sollte ich mich zwischen UTF-8 und einer Aufnahme eines Klaviervortrags entscheiden müssen?
    Es wirkt, als würde jemand, der vom Thema begeistert ist, nur in einer simplen „Ford vs. Chevy“-Gegenüberstellung sprechen
    Wir mögen doch alle Text, also muss man mich davon nicht extra überzeugen

  • Ich stimme der unendlichen Flexibilität und Haltbarkeit von Text zu, aber nachdem ich die Arbeiten von Bret Victor gesehen habe, habe ich auch die Grenzen von Text gespürt
    Beim Klavierlernen gab es eine unmittelbare Feedback-Schleife, und so eine Art des Lernens lässt sich mit Text nur schwer umsetzen
    Victors Kernidee ist, dieses feedbackzentrierte Lernen auch auf Ingenieurwesen und Bildung insgesamt anzuwenden
    Text bleibt wichtig, aber ich denke, dass auch Ansätze mit anderer sensorischer Intuition viel Potenzial haben

    • Kurzfristig ist der Engineering-Aufwand für Medien, die reichhaltiger als Text sind, deutlich höher
      Bret Victors Demos sind beeindruckend, aber die tatsächliche Umsetzung erfordert enormen Aufwand
      Die Idee selbst ist großartig, aber man muss verstehen, dass ihre Realisierung große Investitionen und Hingabe verlangt
    • Wenn man in den Naturwissenschaften arbeitet, wird dieser Punkt noch klarer
      Daten oder Ergebnisse in Text zu erklären ist schwierig, aber Grafiken vermitteln auf einen Schlag viele Informationen
      Text ist gut, weil er asynchron ist, aber Menschen bevorzugen instinktiv gesprochene oder visuelle Ausdrucksformen
      Letztlich ist ein gemischter Ansatz natürlicher als ein einzelner Kommunikationsmodus
    • Zum Beispiel ist es ineffizient, textlich zu erklären, wie man ein Kabelwirrwarr entknotet
      Ein Kind schaut einfach zu und lernt es, und versteht es durch physische Intuition
      Wissen, das man wie Fahrradfahren mit dem Körper lernt, lässt sich durch Text kaum vermitteln
    • Ich würde sagen: „Setze immer auf symbolische Repräsentation
      Text ist symbolisch, Bilder sind sinnlich
      Es ist unmöglich, ein Gemälde von Norman Rockwell perfekt in Text auszudrücken
      Textbasierte Symbolsysteme wie Notenschrift oder Feynman-Diagramme bleiben dennoch mächtig
    • Diese Diskussion selbst zeigt die Überlegenheit von Text
      Ich habe den Beitrag des OP in 30 Sekunden zusammengefasst, aber Bret Victors Video ist 54 Minuten lang, also werden die meisten es nicht ansehen
      Bei Effizienz und Transformierbarkeit ist Text immer noch das optimale Medium
      Andere Medien nutzt man meiner Meinung nach am besten als ergänzende Mittel
  • Ich bezeichne mich selbst als Text-Maximalisten
    Text ist die natürliche Schnittstelle zwischen Mensch und Maschine und der Gleichgewichtspunkt zwischen Effizienz und Transparenz
    Alles kann als String gespeichert und in base64, JSON, HTML, CSS, SQL usw. ausgedrückt werden
    Letztlich war die Silver Bullet, nach der die Branche gesucht hat, der String
    Komplexe Binärformate verlieren an Lesbarkeit, und nach GZIP-Komprimierung verschwindet der Vorteil fast vollständig

    • Aber man kann nicht gleichzeitig „Effizienz, Flexibilität und Transparenz“ bekommen
      Textbasierte Protokolle werden wegen Problemen mit dem Postel’schen Gesetz instabil
      Ein Unterschied von 30 % bei der Bandbreite ist keineswegs klein, und HTTP3 ist genau deshalb auf Binärformate umgestiegen
      Selbst wenn man base64 komprimiert, ist die Lesbarkeit ohnehin schon verloren
      Verwandte Referenzen: Robustness principle, Regex-Probleme, ReDoS
    • Auf die Behauptung, die „CPU-Kosten der Deserialisierung seien vernachlässigbar“, würde ich umgekehrt sagen, dass auch die „Kosten, Tools zum Lesen für Menschen zu nutzen“, vernachlässigbar sind
      Gzip-komprimiertes JSON kann sowieso niemand direkt lesen, also ist der Einsatz von Werkzeugen kein großes Problem
    • Ich arbeite täglich mit protobuf, und die binäre Struktur dieses Formats dient der Kompatibilitätsgarantie
      Für Konfigurationsdateien, die Menschen bearbeiten, sind text proto oder JSON besser geeignet
    • Ich habe die Dokumentenspeicherung von DOC oder PDF auf Markdown-Text umgestellt
      grep, git und Konvertierung sind alle unkompliziert
      Alte Arbeiten habe ich in Lotus Word Pro geschrieben und kann sie heute nicht mehr lesen; als Text wäre das kein Problem gewesen
    • Die Textversion von protobuf ist weder base64 noch JSON
      In großen Systemen zirkulieren viele Textdateien, aber Transparenz gibt es dabei kaum
      In Umgebungen im großen Maßstab führen ein paar gesparte Bits zu erheblichen Kostensenkungen, daher werden self-labeled Felder ausgeschlossen
  • Text ist letztlich nur eine Darstellung von Bytes
    Dass man dennoch an Text festhält, liegt an der Geschlossenheit von Binärformaten und am Mangel an Werkzeugen
    Selbst wenn eine CSV Millionen base64-Spalten enthält, ist sie ohne passende Tools kaum besser als ein Binärformat

    • Text ist nicht einfach nur Bytefolge, sondern ein vom Menschen lesbares Zeichensystem
    • Text beschränkt die zulässigen Byte-Sequenzen und besitzt eine komprimierte Struktur der Sprachentwicklung
      Dank Standardisierung können Bedeutungen geteilt werden, und Modelle wie LLMs können das lernen
    • Als Scherz: Es gibt auch eine Zivilisation mit binärer Kommunikation — die Bynar-Zivilisation
  • So wie man nicht „einen zufälligen Wiki-Satz als Bild ausdrücken“ kann, kann man auch nicht alles durch Text ersetzen
    Umgekehrt ist es ebenso unmöglich, einen Filmclip perfekt in Text zu beschreiben
    Text ist keine Obermenge aller Medien, sondern einfach eine andere Art von Darstellung

  • Zur Behauptung, „Text sei die älteste und stabilste Kommunikationstechnologie“
    Tatsächlich ist Sprache selbst eine ältere Technologie
    Mündliche Traditionen haben Wissen über Generationen hinweg weitergegeben, und menschliche Sprache ist die komplexeste unter ihnen
    Zum Beispiel überliefern die australischen Ureinwohner der Gunditjmara den Ausbruch eines Vulkans vor 30.000 Jahren in Erzählungen (Budj Bim)
    Text ist insofern einzigartig, als er Informationen über Generationen hinweg ohne Verzerrung weitergeben kann
    Am Ende lautet das Fazit also: „Setze auf Sprache“

    • Wenn man sogar biologische Kommunikation einbezieht, wäre der genetische Code der RNA wohl der älteste „Text“
    • Das Beispiel der Gunditjmara ist faszinierend, aber letztlich nur eine nicht verifizierbare Vermutung
  • LLMs sind deshalb so erstaunlich, weil die Menschheit über Jahrtausende hinweg ihr gesamtes Wissen in Text aufgezeichnet hat
    Auch Bildmodelle haben sich dank eines gemeinsamen Embedding-Raums von Text und Bild weiterentwickelt

    • Dass ein LLM erst nach Dutzenden von Rückfragen die gewünschte Antwort findet, ist allerdings eher explorativ als effizient
      Bequem ist es, aber man kann es kaum ein wirklich „effektives“ Modell nennen
  • Als Linguist glaube ich, dass Text (Unicode) beim Dokumentieren bedrohter Sprachen das nachhaltigste Format ist
    Selbst griechische oder sanskritische Grammatiken aus Jahrtausenden sind noch lesbar
    Unser Team hat zwar als PDF veröffentlicht, intern aber alles in XML archiviert
    Ich hoffe, dass es auch in 2000 Jahren noch lesbar ist

    • Persönlich habe ich allerdings erlebt, dass Textdateien, die ich vor 10 Jahren gespeichert habe, gerade deshalb schwerer zu öffnen waren
      Es gab viel Verwirrung mit Encodings wie UTF-16, SJIS oder EUC, während PDF oder JPEG weiterhin problemlos geöffnet wurden
      Wenn der Speicherplatz es zulässt, erscheint mir die Aufbewahrung in Bildformaten sicherer
      Außerdem gibt es noch immer Zeichen, die selbst mit Unicode nicht darstellbar sind
    • Wie bei Notenschrift lassen sich manche Darstellungen nicht einfach in Text oder Binärformat einteilen
      Höhlenmalereien vermitteln die Absicht besser als Text
  • Wenn man sich die Reihe Future Text Publishing anschaut,
    ist „Text“ im Kern einfach ein 2D-Bild
    Computer verstehen keinen Text, sie verarbeiten nur Zahlen
    Menschen geben diesen Zahlen Bedeutung und schaffen daraus Symbol- und Sprachsysteme
    DNA/RNA kann man als Beispiel für ein physisch aufgebautes universelles Schriftsystem sehen

  • Dieser Beitrag wurde schon früher mehrfach auf HN eingereicht
    2014, 2015 und 2021 gab es jeweils Hunderte Kommentare
    Version von 2014, Version von 2015, Version von 2021

 
cronex 2025-12-30

Es stimmt, dass Text wirklich ein gutes und sehr wichtiges Ausdrucksmittel ist, aber …
Man kann eben nicht alles als Text speichern.
Text ist letztlich eine komprimierte Ausdrucksform. Was wir mit unseren fünf Sinnen wahrnehmen können (Sehen, Hören, Tasten, Schmecken, Riechen), wird in eine gesellschaftlich vereinbarte Form komprimiert und so ausgedrückt.
Wenn es jedoch keine Informationen über das ursprüngliche Objekt gibt, auf das sich das bezieht, verliert dieser Text seinen Sinn, selbst wenn man die Daten noch so sehr in Textform speichert, sobald spätere Menschen dieses ursprüngliche Objekt nicht mehr kennen.
Wir wissen zwar, was eine Kassette ist, aber wenn man Kindern, die erst vor Kurzem geboren wurden, nur das Wort „Kassette“ zeigt und sie fragt, was das ist, wie viele könnten wohl noch richtig antworten? Selbst wenn man Form, Funktion und Funktionsweise einer Kassette noch so ausführlich beschreibt: Könnte man in einigen tausend Jahren allein anhand dieses Textes eine Kassette wirklich perfekt rekonstruieren?
In solchen Fällen können ein paar Fotos der Kassette, technische Zeichnungen oder einige Minuten Video, in denen man sieht, wie eine Kassette benutzt wird, viel nützlicher sein.