Ich bin Kenianer. Ich schreibe nicht wie ChatGPT. ChatGPT schreibt wie ich
(marcusolang.substack.com)- Der formelle englische Stil, der im kenianischen Bildungssystem geprägt wurde, wird immer wieder dafür gehalten, wie von einer KI erzeugter Text auszusehen
- Das strukturelle Training im englischen Schreiben betont Satzbalance, logischen Fluss und den Einsatz von Konnektoren und führt so zu Ergebnissen, die dem KI-Schreiben ähneln
- Dieser Stil ist ein Erbe des britisch-englischen Unterrichts aus der Kolonialzeit und wurde als Symbol für sozialen Status und Bildung bewahrt
- Kritisiert werden Verzerrungen von KI-Detektoren und Sprachmodellen, die Texte von Nicht-Muttersprachlern als „nicht menschlich“ einstufen
- Betont wird, dass sich im Schreiben nicht eine Maschine zeigt, sondern das Ergebnis von Geschichte, Bildung und sprachlicher Identität
Missverständnisse über KI und menschliches Schreiben
- Ausgangspunkt ist die Erfahrung, auf einen eigenen Projektvorschlag das Feedback erhalten zu haben: „Das klingt, als hätte es ChatGPT geschrieben.“
- Weil der Stil strukturiert und logisch sei, wurde er als „zu wenig menschlich“ bewertet
- Viele Autorinnen und Autoren erleben ähnliche Reaktionen, was mit Vorurteilen gegenüber nicht-muttersprachlichen Schreibenden zusammenhängt
- Der Autor erklärt die Ähnlichkeit seines Stils mit KI damit, dass die KI die eigene Bildungsweise gelernt hat
Wie sich das kenianische Englischlernen herausgebildet hat
- Die Englisch-Aufsatzprüfung des KCPE (Kenya Certificate of Primary Education) ist zentral für das Schreibtraining
- Um in der mit 40 Punkten bewerteten Prüfung gute Ergebnisse zu erzielen, muss man einen reichen Wortschatz und komplexe Satzstrukturen beherrschen
- Die Schreibregeln lassen sich auf drei Punkte verdichten
- Mit einem Sprichwort oder einem starken Satz beginnen, abwechslungsreichen Wortschatz verwenden und eine perfekte Struktur beibehalten
- Lehrkräfte übernehmen die Rolle des „ursprünglichen Algorithmus“, der mit rotem Stift Grammatik und Struktur korrigiert
- Dieses Training betont logische, ausgewogene Satzkonstruktionen und setzt sich später in Highschool und Universität fort
Koloniales Erbe und sprachliche Hierarchien
- Der Englischunterricht in Kenia geht auf das Sprachsystem des Britischen Empires zurück
- Im Mittelpunkt stehen grammatikalische Genauigkeit und Formalität nach dem Maßstab des „Queen’s English“
- Auch nach der Unabhängigkeit blieb diese Sprache Amtssprache und Symbol sozialen Status
- Gepflegtes Englisch gilt als Maßstab zur Unterscheidung von Bildungsgrad und sozialer Schicht
- Dadurch ähnelt die große Menge formeller Stilformen, die KI gelernt hat, den Ergebnissen des kenianischen Englischunterrichts
Verzerrungen und Grenzen von KI-Detektoren
- KI-Detektoren urteilen anhand von „perplexity“ (Vorhersagbarkeit) und „burstiness“ (Variabilität der Satzlängen)
- Vorhersagbare Satzstrukturen und ein gleichmäßiger Rhythmus gelten als nicht menschlich
- Doch gerade das kenianische Bildungssystem erhebt eben diesen vorhersagbaren und ausgewogenen Stil zum Ideal
- Studien zeigen, dass solche Detektoren Texte von Nicht-Muttersprachlern mit höherer Wahrscheinlichkeit fälschlich als KI-generiert einstufen
- Darin zeigt sich eine technische Verzerrung, die sprachliche Vielfalt ausgrenzt
Menschlichkeit und Sprache neu denken
- Die Texte kenianischer Autorinnen und Autoren sind kein Produkt von Maschinen, sondern von Bildung, Geschichte und Kultur
- Kritisiert wird, dass der Maßstab für „menschliches Schreiben“ auf informelle und US-amerikanische Ausdrucksweisen verengt wird
- Schreibende aus Nairobi, Lagos oder Mumbai teilen ebenfalls eine Schreibtradition, die Genauigkeit und Logik hochhält
- Das Urteil „Das sieht nach KI aus“ ist ein Blick, der andere Formen von Menschlichkeit nicht erkennt
- Das Fazit lautet: So schreiben Kenianerinnen und Kenianer – und so wird dort schon seit Langem geschrieben
2 Kommentare
Hacker-News-Kommentare
Unsere Generation hat von Lehrern an Schüler weitergegebene ungeschriebene Regeln des Schreibens gelernt
Der erste Satz musste unbedingt mit einem Sprichwort oder einer eindringlichen Formulierung beginnen, und statt gewöhnlicher Wörter sollte man Ausdrücke wie „strode purposefully“ verwenden
Als ich dann an der Universität Schreiben studierte, ging der Trend jedoch immer mehr zu einfachen Sätzen und kurzen Formulierungen
Inzwischen empfinde ich einen Hemingway-artigen Stil als ideal. Der überladene Stil von ChatGPT ermüdet mich eher
Ich erkenne das Können des Autors an, aber ich bevorzuge einfache und klare Texte
Der Zwang, Sätze kurz zu halten, hat die englische Prosa ruiniert
Für die meisten Menschen ist Einfachheit hilfreich, aber die Tendenz, lange Sätze, Semikolons oder feine Wortnuancen pauschal als „schlechtes Schreiben“ abzutun, ist problematisch
Diese Haltung behindert die Entwicklung sowohl der Leser als auch der Autoren
Allerdings sind Ausdrücke wie „proceeded to“ nach wie vor Müll. Schüler dazu zu zwingen, künstlich „klug klingende“ Wörter zu benutzen, ist eine furchtbare Lehrmethode
Meine Frau ist Autorin, und laut ihr taucht das Wort „strode“ in Fanfiction oder Liebesromanen auffallend oft auf. Wenn jedes Gehen als „schritt selbstbewusst“ beschrieben wird, ist das ein typisches Merkmal von Amateuren
Im Schreibstil stecken Klassenmarker
Wie der Artikel sagt, war das Englisch, das wir gelernt haben, das „Queen’s English“ aus der Zeit des Imperialismus und damit die Sprache der Macht
Die formale Schönheit des Schreibens zu beherrschen diente nicht nur dazu, Prüfungen zu bestehen, sondern auch dazu, zu beweisen, dass man ein „zivilisierter Mensch“ sei
Moden im Schreiben ähneln dem Kreislauf sozialer Modeerscheinungen. Wenn ein verschnörkelter Stil populär wird, grenzt sich die Oberschicht umgekehrt mit einem schlichten Stil ab
Der zurückgenommene Hemingway-Stil ist wie eine „zerrissene 1000-Dollar-Jeans“: eine bewusst bescheidene Erscheinung, die sich nur jemand mit Spielraum leisten kann
Ich habe bei einem der Big Three gearbeitet, und der Stil von ChatGPT ist exakt derselbe Selbstbewertungsbericht-Stil, den ich dort gelernt habe
Entscheidend für Beförderungen war weniger die Leistung als die Fähigkeit, die eigene „Story“ gut zu verpacken
Bist du vielleicht Amerikaner? Selbst im englischsprachigen Raum gibt es kulturelle Unterschiede zwischen britischem und amerikanischem Englisch
Amerikaner sind weniger geschniegelt und direkter, während britisches Englisch weiterhin eher zu blumigen und dekorativen Formulierungen neigt
Meinem Eindruck nach nimmt der Wortschatz britischer Sprecher von Generation zu Generation ab
Schreiben hat zwei Zwecke
(1) Schreiben zur Vermittlung von Ideen — je einfacher, desto besser. Wie bei Essays von Paul Graham gelangt die Information nahezu reibungslos in den Kopf
(2) Schreiben als Selbstausdruck — dazu passt ein auffälliger, künstlerischer Stil
Wie David Foster Wallace sagte, ist Ersteres Schreiben, das wie ein Gespräch kommuniziert, während Letzteres eher wie ein Tagebuch ist, das „Das bin ich!“ hinausschreit
Interessant ist, dass ein erheblicher Teil der LLM-Trainingsdaten in Kenia kuratiert wurde
Wären die Daten in Japan erstellt worden, hätte ChatGPT vielleicht japanisch gefärbte Satzenden wie „Don’t you agree?“ verwendet
Verwandter Artikel
Der Einfluss des indischen Lehrbuchautors Malkiat Singh ist groß
Seine Lehrbücher wurden in Kenia als Standardwerke verwendet, und da seine Schüler später LLM-Datenkuratoren wurden, ist dieser Stil gewissermaßen in KI auf der ganzen Welt eingesickert
Malkiat-Singh-Wiki
(Kurz gesagt) Scheint wohl unvermeidlich zu sein
Sieht so aus, als würde 樣 gerade das Meme „ChatGPT (Japan)“ vorbereiten XD
Datenlabeling ist jedoch etwas anderes als Trainingsdaten zur Textgenerierung für LLMs. Dazu gibt es viele Missverständnisse
Ich habe den Styleguide des Chicago City News Bureau von 1897 gelesen, und darin gab es viele interessante Regeln
Zum Beispiel sollte man „night“ und „evening“ nicht verwechseln und „very“ nicht unnötig verwenden
Solche Detailregeln zeigen das Sprachgefühl der damaligen Zeit
Für mich wirkt der Stil dieses Textes überhaupt nicht wie ChatGPT
Viele Menschen halten die Verwendung von Gedankenstrichen (—) für ein KI-Indiz, aber das ist nur ein schwaches Signal
ChatGPT erzeugt eher einen übersteigerten Tonfall und eine „leere Erhabenheit“
Vergleicht man die Absätze tatsächlich, wirkt die KI-Version zwar prächtiger, aber weniger aufrichtig
Dieser Text hat Sogwirkung. Bei den meisten GPT-Ausgaben lässt die Konzentration schon nach einem Absatz nach
Danach bleibt das Gefühl, keinerlei Information mitgenommen zu haben
Der Unterschied zwischen LLM und Mensch liegt in der Fähigkeit, mit vielen Worten nichts zu sagen
Wenn man GPT bittet, bereits gelungene Sätze zu „verbessern“, ist es nur folgerichtig, dass sie noch weitschweifiger werden
Das Original hat strukturellen Schmuck, aber die Bedeutung lebt. KI-Texte haben eine geringe Informationsdichte und sind langweilig
Gedankenstriche wahllos zu jagen, ist das Verhalten von Leuten, die Grammatik nicht verstehen
Künstler oder YouTuber erleben dasselbe Problem
Es kommt immer häufiger zu Missverständnissen, weil etwas wie KI wirkt
Tatsächlich scheint es denkbar, dass Sprecher Jobs verlieren, weil ihre Stimme einer KI-Stimme ähnelt
Ich habe auch ein Factorio-Video hochgeladen, und einige Zuschauer kommentierten: „Diese KI-Stimme nervt“
Dabei habe ich selbst gesprochen, und am Ende des Videos war sogar mein Gesicht zu sehen
KI-Stimmen sind emotionslos und klingen in der Aussprache unnatürlich, deshalb erkennt man sie schnell
In letzter Zeit gibt es viele Tutorial-Videos ohne Substanz, in denen einfach ein von KI geschriebenes Skript vorgelesen wird
Deshalb schaue ich inzwischen nur noch Videos von Creatorn, denen ich vertraue
Link zu meinem Video
Wenn bei der KI-Bilderzeugung echte Gesichter ohne Erlaubnis verwendet werden, sollte Pierce Brosnan wohl als Erster entschädigt werden
In unserem Team gab es auch einen Kollegen, der wie ChatGPT sprach
Auf WhatsApp und Zoom wirkte seine Ausdrucksweise so mechanisch, dass ich Meta AI fragte, und die Antwort lautete: „Das klingt wie von einer KI geschrieben“
Er sagte jedoch, dass er tatsächlich keine KI benutzt habe, und im Nachhinein halte ich das durchaus für möglich
Aber KI mit KI-Erkennung zu beauftragen ergibt keinen Sinn. Das ist, als würde man sich selbst fragen
Ich habe auch schon die Erfahrung gemacht: „ChatGPT schreibt wie ich“
Ich benutze oft Listen und Formatierung und bevorzuge dyslexiefreundliche Texte
Selbst in Notizen aus dem Jahr 2019 hatte mein Stil schon etwas, das an ChatGPT erinnert
Manchmal baue ich absichtlich Rechtschreibfehler ein oder mische unregelmäßige Stilformen hinein
Nüchtern betrachtet gilt: Wenn ein Text nicht vom Standardoutput von ChatGPT zu unterscheiden ist, dann ist es ein schlechter Text
Auch wenn tatsächlich keine KI verwendet wurde, ist ein solcher Stil verbesserungsbedürftig
In der Bildung sollte man nur denjenigen gute Bewertungen geben, die besser schreiben können als KI
Es ist schon etwas komisch, einen Kollegen dafür zu kritisieren, dass er „so intelligent wie ChatGPT klingen“ wolle
Die Debatte über den Gedankenstrich ist interessant
Früher sah ich ihn nur, wenn Word ihn automatisch ersetzte, und ich hatte ihn nie selbst eingegeben
Dass man unter Windows Alt+0151 drücken muss, habe ich erst diesmal erfahren
Deshalb ist der Gedankenstrich für mich nach wie vor ein ungewohntes Zeichen
Inzwischen verstehe ich aber, dass Menschen in anderen Umgebungen schreiben
Tatsächlich gab es auf HN schon vor ChatGPT Leute, die gern Gedankenstriche benutzten
HN-Rangliste der Gedankenstrich-Nutzer
Ich aktiviere in emacs den Typo mode, damit en/em dash und Smart Quotes automatisch verwendet werden
Ich habe das HN-Dataset analysiert, und auch nach der Verbreitung von KI ist die Nutzung von Gedankenstrichen nicht gestiegen
Allerdings ist eine übermäßige parenthetische Satzstruktur typisch für KI oder unausgereiftes Schreiben
Im macOS-Notizblock wurde
--automatisch zu—, wodurch ein Terminal-Befehl einmal fehlschlugIch bin beeindruckt von den Englischkenntnissen des OP
Die meisten Nicht-Muttersprachler lernen in der Schule literarisches Englisch, deshalb ist ihnen ein formeller Stil vertraut
Ich habe in Frankreich eine ähnliche Ausbildung bekommen, bin aber durch die Arbeit in der IT zu einem amerikanisch direkten Englisch gewechselt
Dieser Text wurde nicht von ChatGPT geschrieben. Es gibt keinen unnötigen Zierrat, und die Informationsdichte ist hoch
KI-Texte überfliege ich meist zur Hälfte, aber das hier war ein Text, bei dem ich kein einziges Wort verpassen wollte
Das ist so etwas wie der Fluch guter Schreiber
ChatGPT wurde so konzipiert, dass es „gutes Schreiben“ nachahmt, deshalb werden gute Schreiber umso eher für KI gehalten
Ich habe sogar gesehen, wie Texte mit vielen Grammatikfehlern kritisiert wurden, weil sie angeblich wie ChatGPT klängen
Es gibt öffentliche Informationen dazu, dass ChatGPT auf afrikanischem Business-Englisch trainiert wurde
Verwandter Artikel
Wenn man „gut schreiben“ als weitschweifigen, gefälligen und kritikvermeidenden Stil definiert, dann stimmt das wohl
Tatsächlich schreiben LLMs nicht besser als Menschen
Sie machen selbst bei Grundgrammatik wie „a/an“ oft Fehler und verwenden weiterhin elliptische Ausdrücke wie „because traffic“
Daran sieht man, dass die Fähigkeit des Menschen zur feinen Bedeutungsabstimmung weiterhin überlegen ist
Der Text des OP hat nicht dieses künstliche Gefühl, das für LLMs typisch ist
Auch die Verwendung von Gedankenstrichen wirkt natürlich, und persönliche Emotionen sind spürbar
Ich mag den ChatGPT-Stil nicht
Er ermüdet wie Marketingsprache und hinterlässt nur leere Pracht
Solche Texte strengen Leser an und vermitteln Informationen schlechter
Es überrascht mich, dass ein solcher Stil in Kenia gelehrt wird
Der Satz „Ich schreibe nicht wie ChatGPT, ChatGPT schreibt wie ich“ bleibt hängen
Letztlich ist es wohl unser Schicksal, immer mehr wie ChatGPT zu sprechen und zu schreiben
Kinder lassen ihre Hausaufgaben, Erwachsene ihre Lebensläufe und Beratungen von KI erledigen, und selbst in Gesprächen werden wir Formulierungen benutzen wie: „Das stimmt, ich fasse die Gründe in drei Punkten zusammen“
(Häkchen-Emoji) Füge mehr Emojis hinzu — Menschen lieben Emojis
(Rotes-X-Emoji) Vermeide negative Wörter wie „bullshit“
(Daumen-hoch-Emoji) Bald wird das Lernen aus menschlichem Feedback übertroffen werden (Smile)
Ein interessanter Text.