3 Punkte von GN⁺ 2026-02-19 | 2 Kommentare | Auf WhatsApp teilen
  • Semantische Ablation (Semantic ablation) bezeichnet ein algorithmisches Erosionsphänomen, bei dem AI die eigentümliche Bedeutungsdichte eines Textes schrittweise entfernt
  • Dies ist ein strukturelles Nebenprodukt von greedy decoding und Reinforcement Learning from Human Feedback (RLHF), das seltene und präzise Ausdrücke verwirft und zu durchschnittlicher Sprache konvergiert
  • Die Ausrichtung von AI auf „Sicherheit“ und „Hilfreichsein“ verstärkt diese Tendenz, unterdrückt absichtlich untypische sprachliche Reibung und führt zu einer Abtrennung von Intention und Individualität
  • Je häufiger man Text iterativ von AI überarbeiten lässt, desto stärker sinkt die lexikalische Vielfalt (type-token ratio); Metaphern, Fachsprache und logische Strukturen werden stufenweise eingeebnet
  • Dadurch wird die Komplexität menschlichen Denkens letztlich der algorithmischen Ästhetik der „Glätte“ geopfert, und die Gesellschaft insgesamt gerät in einen „race to the middle“

Das Konzept der semantischen Ablation

  • Semantische Ablation bedeutet die algorithmische Erosion von Informationen mit hoher Entropie (high-entropy)
    • Sie wird nicht als Fehler verstanden, sondern als strukturelles Ergebnis von greedy decoding und RLHF
    • Um Wahrscheinlichkeit zu maximieren, konvergiert das Modell zum Zentrum einer Gauß-Verteilung und verwirft seltene, präzise und komplexe Tokens
  • Dieses Phänomen verschärft sich, wenn Entwickler die Ausrichtung auf „Sicherheit“ und „Hilfreichsein“ verstärken
    • Untypische sprachliche Reibung wird als „Risiko“ betrachtet, wodurch eine nicht autorisierte semantische Beschneidung entsteht
    • Im Ergebnis führt das Streben nach niedriger Perplexity zur Zerstörung charakteristischer Signale

Der Erosionsprozess beim AI-Schreiben

  • Der Prozess, in dem AI einen Entwurf „verfeinert“, lässt sich tatsächlich als Ausführung semantischer Ablation beschreiben
    • AI identifiziert Bereiche mit hoher Entropie, also jene Teile, die originelle Einsichten enthalten, und ersetzt sie durch die wahrscheinlichsten allgemeinen Tokens
    • Die raue Präzision des ursprünglichen Textes verschwindet und wird zu einer glatten, aber hohlen Hülle
    Anzeige
  • Dieses Phänomen lässt sich als Entropy Decay messen
    • Je öfter ein Text iterativ durch AI veredelt wird, desto stärker kollabiert die lexikalische Vielfalt (type-token ratio)
    • In der Folge zeigt sich der dreistufige Prozess semantischer Ablation

Die drei Stufen der semantischen Ablation

  • Stufe 1: Metaphoric cleansing
    • AI betrachtet untypische Metaphern oder sinnliche Bilder als „Rauschen“ und ersetzt sie durch sichere, abgedroschene Formulierungen
    • Emotionale und sinnliche Reibung wird entfernt
  • Stufe 2: Lexical flattening
    • Fachbegriffe und präzise technische Terminologie werden im Namen der „Zugänglichkeit“ geopfert
    • Seltene Tokens (1/10.000) werden durch häufige Synonyme (1/100) ersetzt, wodurch Bedeutungsdichte und logische Gravitation verwässert werden
  • Stufe 3: Structural collapse
    • Komplexe nichtlineare Logik wird in vorhersagbare Strukturen mit niedriger Perplexity gezwungen
    • Implikationen und Nuancen werden entfernt, sodass nur eine grammatikalisch perfekte, aber intellektuell leere Hülle übrig bleibt
    Anzeige

Folgen und Metaphern

  • Solche Ergebnisse werden als „JPEG des Denkens“ beschrieben
    • Nach außen wirken sie konsistent und glatt, doch die ursprüngliche Datendichte und Bedeutung sind verloren gegangen
  • Wenn „hallucination“ der Fehler ist, etwas zu erzeugen, das nicht existiert, dann ist semantische Ablation der Prozess, etwas Vorhandenes zu zerstören
    • Die Komplexität menschlichen Denkens wird auf dem Altar algorithmischer Glätte geopfert
    • Die Gesellschaft verfällt zunehmend einem „race to the middle“ und errichtet eine hohle grammatikalische Welt

Warnung und Fazit

  • Wer AI-Ausgaben übernimmt, ohne semantische Ablation zu erkennen, normalisiert den Verfall von Bedeutung
  • Wenn diese Erosion anhält, besteht die Gefahr, dass wir sogar vergessen, was „Substanz“ überhaupt ist
  • Deshalb ist es wichtig, das Konzept der semantischen Ablation zu benennen und sich seiner bewusst zu werden

2 Kommentare

 
mammal 2026-02-19

Damit ein von KI geschriebener Text nicht wie KI wirkt, Tippfehler absichtlich stehen zu lassen oder alles kleinzuschreiben, kann man wohl als eine bewusst erhöhte Entropie ansehen.

 
GN⁺ 2026-02-19
Hacker-News-Kommentare
  • Das bringt ziemlich gut auf den Punkt, was viele Leute empfinden, wenn sie Ratschläge zum Umschreiben von Sätzen durch AI ablehnen
    Je mehr AI einen Text glättet, desto mehr verschwindet seine Schärfe, und am Ende sagt er gar nichts mehr
    Die menschliche Eigenart geht verloren und wird zu einem glatten, aber faden Stil
    Aber genau diese rauen Kanten, unerwarteten Formulierungen, sind der Teil, der die Aufmerksamkeit der Leser weckt und sich ins Denken bohrt

    • Ich denke, das hängt auch davon ab, wie gut jemand schreiben kann
      Viele Menschen schreiben nicht besonders gut, daher macht AI ihre Sätze klarer und fehlerfreier
      Aber solche Texte werden niemals großartig
      Selbst wenn man versucht, den Stil berühmter Autoren nachzuahmen, klingt es immer irgendwo seltsam
    • Ich denke, AI ist im Kern ein Werkzeug für Alltagsaufgaben
      Sie kann langweilige Teile wie E-Mails effizienter machen, aber das wirklich Interessante passiert an den „Rändern“
      Gewöhnliches Schreiben lässt sich automatisieren, kreativer Ausdruck bleibt weiterhin menschliches Terrain
    • Der von AI erzeugte Stil klingt für mich ähnlich wie Managersprache
      Wenn technische Fachlichkeit fehlt, wird der Text zunehmend mit vagen Wörtern, Buzzwords und Metaphern aufgefüllt
      Vielleicht ist das auch der Grund, warum Führungskräfte oder Politiker AI-generierte Inhalte mögen
    • AI-Texte sind nicht deshalb fade, weil sie „zu perfekt“ wären, sondern wegen einer künstlichen Stumpfheit
      Es gibt viele Wiederholungen, viele unnötige Sätze, und sie sind schlecht in konkreten Formulierungen
    • In einer Zeile zusammengefasst: Mediocrity as a Service
  • Beim Bauen verschiedener Multi-Agent-Pipelines habe ich ein interessantes Phänomen beobachtet
    Wenn man die vier Schritte „Zusammenfassen → Erweitern → Prüfen → Glätten“ durchläuft, haben ab etwa dem dritten Schritt alle Sätze denselben Rhythmus und denselben Wortschatz
    Selbst wenn man ständig auf den Originaltext zurückverweist, gibt es Grenzen
    Die Ursache liegt in der Struktur von RLHF (Reinforcement Learning from Human Feedback) selbst
    Weil „klare, sichere und unverfängliche“ Formulierungen bevorzugt werden, werden überraschende Sätze eher bestraft
    Am Ende konvergiert das Modell zu durchschnittlichen Ergebnissen
    Das Basismodell ist viel seltsamer und kreativer, aber feinabgestimmte Modelle entfernen Persönlichkeit absichtlich
    Deshalb ist es schwer, das bei Modellen zu lösen, auf die bereits stark RLHF angewandt wurde, selbst mit Prompts
    Stattdessen trenne ich es so auf, dass ich Arbeiten, bei denen die „Stimme erhalten bleiben muss“, weniger stark getunten Modellen überlasse und strukturelle Extraktion oder Klassifikation RLHF-Modellen

    • Ich frage ganz ehrlich: Ist dieser Kommentar auch mit einem LLM geschrieben?
      Der Analyse stimme ich jedenfalls zu
    • Ich frage mich, ob man Individualität retten könnte, indem man in jeder Zwischenstufe Rauschen injiziert
      Wobei es wohl trotzdem schwer wäre, die Eigenart des Originaltexts zu bewahren
    • Selbst wenn man RLHF entfernt, ist fraglich, ob sich Ergebnisse außerhalb des Durchschnitts noch nützlich halten lassen
      Am Ende könnte das ein Problem sein, das sich mit LLMs allein nur schwer lösen lässt
  • In letzter Zeit hört man überall im Internet die Stimme der AI
    Blogs, Nachrichten, Nachrufe, YouTube — alles hat einen ähnlichen Ton
    Manchmal wird sogar die Stimme berühmter Physiker nachgeahmt
    Für mich fühlt sich das persönlich deprimierend an, als würde die Seele entweichen

    • Sogar in diesem Text selbst scheint dieser AI-Geruch zu stecken
    • Ich entwickle immer stärker eine instinktive Abneigung dagegen
      Wie bei den JPEG-Kompressionsartefakten von 1993 beginnt man es inzwischen sofort zu sehen
    • Ich halte das für die schlimmste Veränderung des Internets seit süchtig machenden Feeds und Werbung
      Wegen des Founder-Effekts wird es wahrscheinlich auch kein neues Internet geben
    • Sobald ich Muster von AI-Schreibstil erkenne, bricht meine Konzentration komplett zusammen
      Ich weiß nicht, ob ich zu empfindlich bin oder ob der Text wirklich so schlecht ist
    • Inzwischen machen Offline-Aktivitäten mehr Spaß als online zu sein
      Das Internet ist so sehr mit synthetischem Müll überzogen, dass ich es kaum noch ansehen will
  • Ich denke, schon der Begriff „Generative AI“ ist falsch
    Je besser ich die mathematischen Prinzipien des Machine Learning verstehe, desto stärker habe ich das Gefühl, dass man es nicht dafür verwenden sollte, Inhalte für Menschen zu erzeugen
    Manchmal kommt mit Glück etwas Brauchbares heraus, aber meistens ist es nur auf dem Niveau von jemandem auf einer langweiligen Party, der zwanghaft kreativ wirken will
    Als Werkzeug zur Unterstützung von Kreativität ist es nützlich, aber ich glaube nicht, dass es selbst kreative Ergebnisse hervorbringen kann

    • Die Leute wollen das Echte
      Statt künstlicher Tokens liest man lieber gleich den ursprünglichen Prompttext
    • Kurz gesagt: Regurgitative AI, also wiederkäuende AI
    • Es wäre besser gewesen, wenn Unternehmen sich auf Bereiche konzentriert hätten, in denen AI wirklich gut einsetzbar ist, etwa Suchassistenz oder Code-Automatisierung
      Stattdessen produziert die Realität Spaghetti-Agenten zur Kurspflege
    • Die Formulierung „die Sprache des langweiligsten Menschen“ ist so treffend, dass ich lachen musste
      Sozusagen Median AI à la mode
  • Der Ausdruck „high entropy“ des Bibelwissenschaftlers Dan McClellan hat mich wirklich beeindruckt
    Im YouTube-Video
    zitierte er den Satz: „they have struck the tuning fork that reverberates from the loins of their dogmatism“,
    und ich habe das Gefühl, dass AI so etwas niemals erzeugen könnte

    • Allerdings klingt dieser Satz auch etwas nach Wortsalat
      Im Stil von GPT-2 hätte das vielleicht sogar natürlicher gewirkt
    • AI würde niemals Wörter wie „loins“ oder „dogmatism“ verwenden
      Weil sie zu sexuell oder marketingtechnisch ungünstig sind
    • Diese Metapher wirkt auch etwas wie eine vermischte Metapher
    • Tatsächlich können Modelle wie Claude mit guten Prompts auch üppige Metaphern erzeugen
      Wenn man zum Beispiel promptet: „Misch den Stil von Jim Thompson und Thomas Harris und schreib es mit dem Pulp-Gefühl eines Truck-Stop-Buchladens von 1967“, kommt etwas ziemlich Brauchbares heraus
      Claude ist bei solchen übersteigerten Stilen stärker als ChatGPT
      Dass Texte im Web heute alle ähnlich klingen, liegt letztlich nicht an HTML, sondern daran, dass die Leute HTML nicht richtig genutzt haben
  • Ich habe etwas Ähnliches erlebt
    Ich schrieb die Landingpage meines neuen Studios emotional und ließ sie dann durch Grok laufen, worauf jede Eigenart verschwand
    Gerade die rauen Formulierungen sind nötig, um die Seele eines Konzepts zu transportieren
    Deshalb nutze ich AI jetzt nur noch zum Prüfen von Ideen

    • Ich habe LLMs auch für Ideengenerierung ausprobiert, aber die Ergebnisse waren miserabel
      Ich ließ mir eine Handlung für eine Dungeon-World-Kampagne erstellen, und heraus kam nur eine allzu gewöhnliche und bedeutungslose Prämisse
      Dagegen war es nützlich, Sitzungsnotizen zusammenzufassen und in eine unterhaltsame Erzählung umzuwandeln
      ChatGPT mag einen leicht scherzhaften Ton, aber nach Bearbeitung wird es durchaus lesbar
      Letztlich müssen kreative Handlungsbögen von Menschen selbst entwickelt werden
    • Wenn man AI-Ideen unverändert übernimmt, kommt es zu metaphorischer Vereinfachung und Abflachung des Wortschatzes
      Man läuft Gefahr, Konzepte in verzerrter Form zu verstehen
      Beim Finden neuer Begriffe ist es nützlich, aber um ein Konzept wirklich tief zu verstehen, ist es viel besser, von Menschen geschriebene Quellen direkt zu lesen
  • Das Konzept „Semantic ablation“ gefällt mir wirklich sehr
    Ich werde es künftig verwenden, um zu erklären, warum die ChatGPT-artigen E-Mails mancher Leute so unerquicklich sind
    Aus genau diesem Grund bin ich auch skeptisch gegenüber Behauptungen, Modelle wie Opus 4 würden AGI werden
    Selbst wenn man mehrere Agenten loslässt, wird es am Ende zu einem bedeutungslosen homogenen Brei konvergieren

    • Ich bin dankbar dafür, dass du mir Sprache gegeben hast, um diese Sichtweise auszudrücken
  • Bildgenerierung wirkt auf mich wie eine Art Anti-Semantic-Ablation
    Sie beginnt mit einer leeren Leinwand und konvergiert schrittweise zu bedeutungsvollen Pixeln
    Ich frage mich, ob man bei Sprachgenerierung etwas Ähnliches machen könnte, also Sätze allmählich zu klar meinungsstarken Formulierungen entwickeln

  • Wenn man den Grad der semantischen Auslöschung in generierten Sätzen messen könnte, ließe sich vielleicht ein Loop-Agent bauen, der ihn reduziert
    So könnte man vielleicht neue Verbindungen finden, die in den Trainingsdaten noch unentdeckt sind
    Natürlich kann das Ergebnis am Ende auch einfach nur Geschrei sein

  • Für alle, die es noch nicht gesehen haben: Ich empfehle die Wikipedia-Seite zu Anzeichen von AI-Schreiben
    Ursprünglich ist sie als Leitfaden zum Erkennen von AI-Beiträgen gedacht,
    aber sie ist auch eine gute Referenz, um beim eigenen Schreiben zu bemerken, dass man dieselben Fehler macht, und sie zu korrigieren