Der Gesellschaftsvertrag des Schreibens
(jola.dev)- LLM-Schreiben hat sich auf Blogs, Social Media, Zeitungen, Bücher, Rechtschreibprüfung und Entwurfserstellung ausgebreitet, und wiederkehrende Stilmerkmale lassen Texte wie vereinheitlichten Slop erscheinen
- Leser erwarten, dass Autorinnen und Autoren, so wie sie Zeit ins Lesen investieren, auch intellektuelle Anstrengung ins Schreiben investiert haben; der Einsatz von LLMs erschüttert diese Erwartung unabhängig von der Qualität des Ergebnisses
- Oxide RFD 576 argumentiert, dass der Glaube, der Autor habe selbst verstanden und geschrieben, den Verständigungsaufwand der Lesenden rechtfertigt und dass LLM-Prosa diesen Gesellschaftsvertrag beschädigt
- Seit ChatGPT beeinflusst generierter Text auch dann menschliche Sprache und Stil, wenn man ihn nicht direkt schreibt; sichtbar wird das am häufigeren Gebrauch von Wörtern wie „delve“, „realm“ und „meticulous“
- Der Maßstab für gutes Schreiben verschiebt sich von grammatischer und lexikalischer Perfektion hin zu originellem Ausdruck und menschlichen Spuren; selbst Tippfehler können zu einem Signal werden, das von KI-Text unterscheidet
LLM-Schreiben und der Gesellschaftsvertrag
- LLMs haben sich in viele Branchen verbreitet, werden aber besonders beim Schreiben breit eingesetzt: in Blogs, Social Media, Zeitungen, Büchern, bei Rechtschreibprüfung, Grammatik, Faktenprüfung und beim Verfassen kompletter Entwürfe
- Sie sind stark darin, große Mengen an Inhalten zu erzeugen, aber sobald man die für LLMs typischen Redewendungen und Stilpattern erkennt, wiederholt sich dieses gleiche Gefühl überall
- Formulierungen wie „it’s not x, it’s why“, der em dash oder „you’re not imagining it, the problem is real“ tauchen immer wieder auf, und Texte werden zunehmend zu demselben Slop homogenisiert
- In dem Moment, in dem Lesende erkennen, dass sie Zeit ins Lesen investiert haben, die schreibende Person aber nicht entsprechend viel Zeit aufgewendet hat, entsteht starke Ablehnung
- Diese Ablehnung verschwindet nicht einmal dann, wenn der Inhalt korrekt, ausreichend recherchiert und der Text an sich in Ordnung ist
Die Fragestellung von Oxide RFD 576
- Abschnitt 2.4 „LLMs as writers“ in Oxide RFD 576 argumentiert, dass von LLMs erzeugte Prosa den Gesellschaftsvertrag des Schreibens verletzt
- Ohne LLM gilt die Annahme, dass die schreibende Person die größere intellektuelle Anstrengung geleistet hat als die lesende
- Lesende haben nur dann einen Grund, sich um das Verständnis schwieriger Sätze und Gedanken zu bemühen, wenn sie glauben können, dass die Autorin oder der Autor diese Gedanken selbst verstanden und niedergeschrieben hat
- Wenn mit einem LLM geschrieben wird, verringert sich unabhängig von Textqualität oder sachlicher Richtigkeit der Aufwand, den die schreibende Person in die Erstellung des Inhalts gesteckt hat
- Das Kernproblem ist nicht nur die Qualität des Ergebnisses, sondern dass schon der Akt, nicht selbst zu schreiben und stattdessen ein LLM zu verwenden, den Gesellschaftsvertrag bricht
Der schwer vermeidbare Einfluss generierten Texts
- Auch ohne direkten Einsatz von LLMs beeinflusst die Flut generierten Texts menschliches Sprechen und Schreiben
- Formulierungen wie „you’re absolutely right“ werden zwar genutzt, um sich über LLMs lustig zu machen, doch das Werkzeug selbst verändert subtil auch menschliche Sprachgewohnheiten
- Eine Studie des Max Planck Institute for Human Development analysiert, dass von ChatGPT bevorzugte Wörter auch in der menschlichen Umgangssprache häufiger verwendet werden
- Zu den häufiger gewordenen Wörtern gehören delve, realm, meticulous, adept, boast, swift, comprehend und weitere
- Die Ausgaben generativer KI haben sich bereits überall in der Sprachumgebung verbreitet, unabhängig davon, ob man sie direkt nutzt oder nicht
Die Metapher vom Low-background steel
- Low-background steel bezeichnet Stahl, der vor der ersten Atombombenexplosion produziert wurde und zeitweise für bestimmte Anwendungen stärker nachgefragt war
- Mehrere Atomtests in den 1940er- und 1950er-Jahren erhöhten die Menge radioaktiver Stoffe in der Atmosphäre, und später produzierter Stahl galt für manche Anwendungen wie Teilchendetektoren als nicht ausreichend „sauber“
- Inzwischen scheint die globale menschengemachte Hintergrundstrahlung jedoch so weit gesunken zu sein, dass auch neuer produzierter Stahl für die meisten Zwecke verwendet werden kann
- In dieser Metapher gelten Texte nach dem 30. November 2022 als zumindest in gewissem Maß von LLMs beeinflusst, weil sie nach der Verbreitung von ChatGPT geschrieben wurden
- Abgesehen davon, nur alte Inhalte zu lesen, ist es schwer, die Sprachumgebung nach dem LLM-Zeitalter vollständig zu vermeiden
Maßstäbe des Schreibens nach dem LLM
- Je mehr generierte Inhalte das Internet einnehmen, desto stärker wird bei einzelnen Menschen wie auch bei Modellfirmen die Nachfrage nach originellem Denken und Ausdruck steigen
- Die Fähigkeit, ohne LLM originelle Inhalte zu schreiben, könnte wertvoller werden
- In einer Umgebung voller LinkedIn-artiger Thought-Leadership-Texte und KI-generierter Katzenbilder wird es jedoch schwerer, solche Texte überhaupt zu finden
- Lange galten gute Grammatik, großer Wortschatz, passende Formulierungen und Metaphern sowie ein solider Aufbau als Maßstab für gutes Schreiben
- LLMs erfüllen diese traditionellen Maßstäbe größtenteils, wiederholen aber dieselben Muster, ihre Formulierungen wirken abgenutzt, ihre Metaphern etwas schräg, und der em dash hinterlässt einen schlechten Eindruck
Veränderung der Maßstäbe für gutes Schreiben
- Studierende stehen heute möglicherweise vor der Wahl, sich anzustrengen und eine durchschnittliche Note zu bekommen oder gar nichts zu tun und mit einer von ChatGPT geschriebenen Arbeit eine gute Note zu erzielen
- Man kann durchaus argumentieren, dass ein heute von Claude geschriebener Text Menschen vor zehn Jahren kaum viele Gründe zur Beschwerde gegeben hätte
- LLM-Texte zeigen bei längerer Lektüre zwar ihre Wiederholung, entsprechen aber den traditionellen Maßstäben eines „ordentlichen“ Schreibens ziemlich stark
- Wichtiger wird nun origineller Ausdruck
- Selbst bei fehlerhafter Grammatik kann ein Text wertvoll sein, wenn er anders ist; auch mit begrenztem Wortschatz wirkt er menschlicher, solange er wiederkehrende LLM-Wörter vermeidet
- Tippfehler können nicht länger nur als Mangel gelten, sondern als menschliche Spur, die von flachen und verallgemeinerten KI-generierten Texten unterscheidet
Das Versprechen, ohne LLM zu schreiben
- Der Gesellschaftsvertrag entsteht dann, wenn Lesende Zeit in die Lektüre investieren und Schreibende entsprechend Zeit in das Schreiben investieren
- Ein Text, der über einen großen Teil des Tages hinweg entstanden ist, während im Hintergrund ein alter Film lief, enthält eine Anstrengung, die der Zeit der Lesenden entspricht
- Schreiben ist eine angenehme Tätigkeit und etwas, das die Person ihr Leben lang getan hat, wenn auch mit unterschiedlicher Beständigkeit
- Es gibt den Vorsatz, Schreiben künftig stärker zu einer alltäglichen Routine zu machen, und dies wird als sinnvoll und lohnend angesehen
1 Kommentare
Lobste.rs-Kommentare
Dieser Satz im Oxide-RFD wirkt wie eine weniger spitze und weniger zitierfähige, dafür aber deutlich explizitere Ausformulierung des verbreiteten ai;dr-Memes
„Ohne LLMs wird angenommen, dass von Leser und Autor der Autor den größeren intellektuellen Aufwand betrieben hat“ bedeutet letztlich: „Wenn du dir nicht die Mühe gemacht hast zu schreiben, mache ich mir auch nicht die Mühe zu lesen.“
Bei Autoren, die LLMs in ihre Arbeit einschleusen, spürt man keine Fachlichkeit
Dieser ganze LLM-Geruch wirkt, als würde er laut hinausposaunen: „Ich bin ein Pfuscher, der nicht vorhat, seine Arbeit zu machen.“ Bei Software kann man argumentieren, dass konsistente, vorhersehbare, langweilige Ergebnisse mit geringer Varianz gut sind, aber beim Schreiben ist es aus meiner Sicht meist genau umgekehrt
Ich finde eher, dass wir mehr konsistentes, vorhersehbares und langweiliges Schreiben brauchen. Die meisten Schreibratgeber stellen Stil über Klarheit und Wahrheit. Ich will damit nicht AI-Schreiben verteidigen, ich nutze selbst keine AI fürs eigentliche Schreiben und mag diesen Geruch auch nicht, aber ich wünschte, mehr menschliche Autoren hätten den Mut, langweilig zu sein
Bei Pull Requests ist es genauso. Früher floss der größte Teil der Arbeit ins gründliche Nachdenken über das Problem und ins Schreiben des Codes
Reviews konnten zwar auch viel Arbeit sein, aber es gab zumindest ein Gleichgewicht, und selbst wenn es unausgewogen war, erfüllte das Review gleichzeitig eine Onboarding- oder Schulungsfunktion. Wenn einem die Qualität eines Projekts wichtig ist, hat sich die Gleichung jetzt komplett verändert. Leute ohne jedes Interesse am Projekt können PRs um mehrere Größenordnungen schneller raushauen, als man sie sinnvoll reviewen kann
Wirklich unerquicklich. Bei Code-Reviews gibt es immerhin den Vorteil, dass man mit Systemen wie
vouchPRs neuer Mitwirkender blockieren kann. Bei Blogposts dagegen fragt man sich ständig, ob der Autor wirklich jemand ist, der das verstanden hat und dem es wichtig ist, oder ob man wieder nur gegen eine weitere Wand aus Slop gelaufen ist. Noch ist Slop leicht zu erkennen, aber das dürfte sich ändern, sobald Produzenten den Modellen sagen, sie sollen die typischen Muster vermeiden. Der einzige Slop, den ich begrüße, ist, dass LinkedIn von Slop-Kommentaren überflutet wirdEs war vorher schon selbstverliebter Müll und ist es nachher auch. Jetzt kommen nur noch comicartige AI-Bilder dazu
Grundsätzlich betrachte ich alles, was vor 2022 erstellt wurde, als deutlich weniger verdächtig. Wer sich auskennt, nutzt bei der Bildersuche
before:2022Der wichtigste soziale Vertrag, wenn man einen Blogpost liest, ist, dass der Autor durch diese Erfahrung sein Schreiben künftig weiter verbessern wird
Der Einsatz von LLMs zerstört auch das. Über den Einsatz von LLMs beim Schreiben von Code kann man diskutieren, aber gerade beim Schreiben von Blogposts ist der Einsatz von LLMs einfach widerlich
Das bringt Gedanken und Gefühle, die ich schon länger mit mir herumtrage, gut in Worte. Vor allem dieses Verlangen nach der Unvollkommenheit menschlicher Handarbeit
Ich will das bei anderen sehen, und ich will, dass sich meine Menschlichkeit auch in meiner eigenen Arbeit zeigt. Ich bin ziemlich schlecht in Rechtschreibung und werde von Freunden und Kollegen oft damit aufgezogen; ich habe sogar schon ernsthaft darüber nachgedacht, in Blogposts absichtlich ein paar Fehler stehen zu lassen, um zu zeigen, dass ich noch ein Mensch bin. Natürlich ist das vielleicht etwas übertrieben
Mit der Aussage „Ich schreibe gern und habe es mein ganzes Leben lang getan, und jetzt versuche ich, es routinierter zu machen. Es fühlt sich sinnvoll und lohnend an“ fühle ich mich völlig abgeholt, aber ich habe zwei Ängste
Erstens: Wenn ich sehe, dass jemand ungefähr 2024/2025 zufällig mit dem Bloggen angefangen oder deutlich mehr veröffentlicht hat, ordne ich das automatisch als AI ein und archiviere es so. Mein eigener Blog wird von außen genauso wirken. Zweitens gefällt mir nicht, dass meine Texte dabei helfen, dass AI-Firmen bessere Modelle bauen. Allerdings bin ich auch heuchlerisch genug, selbst jeden Tag AI zu nutzen
Für das zweite Problem sehe ich keinen guten Weg, all diese Goliaths zu töten. Beim ersten hoffe ich auf eine Art Proof of Human Work, die belegt, dass hinter dem Inhalt ausreichend menschliche Aufmerksamkeit steckt. Ich habe sogar darüber nachgedacht, das Schreiben per Twitch zu streamen, aber das ist viel zu unrealistisch, und den Schreibprozess offenzulegen — einschließlich dummer Ideen, der Erkenntnis „das, was ich gerade schreibe, ist völlig falsch“, und endloser Umformulierungen für den richtigen Ton — wäre mir ehrlich gesagt peinlich. Andere Beweisformen fallen mir nicht ein
Ich schreibe gerade einen ziemlich komplexen technischen Blogpost und formuliere alle Sätze im Haupttext komplett selbst
Ich brauchte ein paar Anläufe, um auf den Punkt zu kommen, den ich machen wollte, aber inzwischen scheint die Struktur ziemlich gut zu stehen. Den Teil, bei dem ich Claude als Werkzeug genutzt habe, war die Umwandlung einer textlichen Beschreibung in ein Mermaid-Diagramm. Für die in Mermaid gesteckte Arbeit bin ich dankbar, aber gerade wenn man von Standardstrukturen wie Flussdiagrammen oder Sequenzdiagrammen abweicht, wirkt ein Teil der Syntax viel zu obskur. Ich arbeite bei Oxide und habe auch zu RFD 576 ein Stück weit Feedback gegeben