Neue HN-Konten verwenden mit 10-fach höherer Wahrscheinlichkeit Gedankenstriche

(marginalia.nu)

1 Punkte von GN⁺ 2026-02-26 | 1 Kommentare | Auf WhatsApp teilen

Eine Analyse der Kommentar-Muster neuer Hacker-News-Konten zeigte zuletzt deutliche Unterschiede zu bestehenden Nutzern
In 17,47 % der Kommentare neuer Konten wurden Gedankenstriche (—), Pfeile und andere Sonderzeichen verwendet; das ist etwa 10-mal mehr als bei bestehenden Konten mit 1,83 %
Außerdem erwähnten neue Konten mit einer Wahrscheinlichkeit von 18,67 % Wörter rund um AI und LLMs, höher als die 11,8 % bei bestehenden Konten
Die Analyse basiert auf Daten von /newcomments und /noobcomments und vergleicht Stichproben von jeweils etwa 700 Kommentaren
Diese Statistik deutet auf eine mögliche Zunahme automatisierter Konten (Bots) in der HN-Community hin

Beobachtete Auffälligkeiten in HN-Kommentaren

In den vergangenen Monaten wurde ein Phänomen beobachtet, das wie ein starker Anstieg von Bots auf HN wirkt
- Einige Konten posten lediglich bedeutungslose Zeichenfolgen oder Zahlen
- Beispiele sind schwer verständliche Texte wie „13 60 well and t6ctctfuvuh7hguhuig8h88gd…“ oder Ein-Zeichen-Kommentare wie „1662476506“ und „Аё“
Neben solchen Konten gibt es auch viele gewöhnlich wirkende, aber unbeholfene oder thematisch unpassende Kommentare

Methode der Datenerhebung und Analyse

Die Seiten /newcomments (aktuelle Kommentare) und /noobcomments (Kommentare neuer Konten) wurden gescrapt und vergleichend analysiert
Aus jeder Gruppe wurden Stichproben von etwa 700 Kommentaren gesammelt und einfache statistische Kennzahlen berechnet

Zentrale statistische Ergebnisse

17,47 % der Kommentare neuer Konten enthalten Gedankenstriche, Pfeile oder andere Sonderzeichen, gegenüber 1,83 % bei bestehenden Konten — ein Unterschied um etwa den Faktor 10
- Statistische Signifikanz p = 7e-20
18,67 % der Kommentare neuer Konten enthalten Bezüge zu AI oder LLMs, mehr als die 11,8 % bei bestehenden Konten
- Statistische Signifikanz p = 0.0018

Interpretation und offene Fragen

Auch menschliche Nutzer können Gedankenstriche verwenden, aber der übermäßige Nutzungsanteil bei neuen Konten ist schwer zu erklären
Diese Unterschiede deuten auf die Möglichkeit automatisch erzeugter Konten unter den neuen HN-Accounts hin

Referenzen

Der für die Analyse verwendete Quellcode und die Daten sind im GitHub-Repository (vlofgren/hn-green-clankers) veröffentlicht
Marginalia.nu veröffentlichte die Untersuchung als Teil der Reihe „Weird AI Crap“

1 Kommentare

GN⁺ 2026-02-26

Hacker-News-Meinungen

Früher wurden auf HN em dash und en dash oft verwendet.
Ich mochte einfach Typografie und hatte mir angewöhnt, statt Semikolons Gedankenstriche zu benutzen.
Mit AHK hatte ich dafür Tastenkürzel eingerichtet, und jetzt führt genau das dazu, dass meine Texte fälschlich so wirken, als hätte sie ein LLM geschrieben.
Ich wurde schon mehrmals für eine AI gehalten, deshalb ist es schade, dass eine früher erfreuliche Vorliebe für Typografie jetzt negativ gesehen wird.
- Sogar mein Teenager-Kind hat mich gefragt, warum ich wie ein Chatbot schreibe.
  Dabei bin ich einfach nur jemand, der auf vollständige Sätze, Rechtschreibung, Grammatik und Großschreibung achtet.
  Inzwischen scheint absichtlich etwas unordentlich zu schreiben ein Signal für Menschlichkeit zu sein. Ich denke mir dann, dass künftige Chatbots das wohl auch lernen werden.
- Falls das absichtliche Weglassen des Oxford comma ein Witz war, schicke ich zugleich Lob und Fluch.
- Ich war früher auch ein großer Fan des em-dash, ersetze es heute aber durch Kommas.
  Die Sätze klingen dadurch etwas holpriger, aber genau das vermittelt mir eine handwerkliche Authentizität.
  Auf zwei Leerzeichen am Satzende werde ich allerdings niemals verzichten. Meine Schreibmaschinenlehrerin sagte 1993, dass auch Sätze Raum zum Atmen brauchen.
- Dass die Krise der Lesekompetenz so schlimm ist und Chatbots der einzige Schreibunterricht sind, ist traurig.
- Ich habe ein ähnliches Problem, bei mir liegt es aber an Aufzählungspunkten.
  Ich tippe sie auf dem Mac schon ewig mit option+8, aber inzwischen wirkt selbst das wie ein LLM-Stil.
Ich habe die in neuen HN-Nutzerkommentaren häufig verwendeten Wörter statistisch verglichen.
Wörter wie „ai“, „actually“, „code“, „real“ und „built“ tauchen bei neuen Accounts viel häufiger auf.
In der Datentabelle ist das ausführlich aufbereitet.
- Bei vielen Kennzahlen nur auf den p-value zu schauen und es deshalb für signifikant zu halten, ist p-hacking.
  Wissenschaftlich ist das problematisch, hier kann man es aber als interessante Einsicht sehen.
  Wenn man stattdessen eine Effektgröße wie Cohen’s d berechnet, sieht man die tatsächliche Größenordnung des Unterschieds.
- Es gab auch einen scherzhaften Kommentar, der Wörter in der Art von „actually building full, real AI app project code…“ aneinanderreihte.
- Ich selbst benutze „actually“ auch zu oft und versuche, es zu reduzieren.
  Meist ist es nur ein bedeutungsloses Füllwort, das die Klarheit des Textes mindert.
- Das Wort „ai“ könnte das Ergebnis verzerren, weil HN in letzter Zeit thematisch entsprechend verzerrt ist.
- Solch niedrige p-values wirken wie ein Hinweis darauf, dass etwas seltsam ist.
  Ich habe die Hypothese, dass einige Bots AI-bezogene Themen künstlich pushen.
Ich habe em-dashes schon immer gern verwendet, aber jetzt finde ich es schade, dass ich sie aus Angst, für AI gehalten zu werden, nicht mehr benutzen mag.
Auf dem Mac lassen sie sich mit alt+shift+- leicht eingeben, daher fühlt es sich an, als wäre eine gute typografische Gewohnheit verdorben worden.
- LLM-Müdigkeit ist real. Wichtiger als Stil sind menschliche Perspektive und Individualität.
  Wenn das vorhanden ist, wirkt ein Text unabhängig von der verwendeten Interpunktion menschlich.
- Einfach weiter benutzen. Ich mache das seit 20 Jahren.
- Ich ersetze sie inzwischen durch Semikolons. Ich fürchte, dass auch das irgendwann zum Symbol von AI wird.
- Ich verwende em-dashes seit 2010 und mag auch curly quotes und ellipsis.
  Im Sinne einer Wiederaneignung der Typografie teile ich diesen Alt-Code-Guide für den Mac.
- Es ist egal, was andere sagen. Vielleicht hat das LLM meinen Stil ja von mir gelernt.
  Letztlich kommt die eigene Ausdrucksweise des Menschen ohnehin zum Vorschein.
Die Daten sind im GitHub-Repository als SQLite-DB öffentlich verfügbar.
Mit Datasette Lite lassen sich SQL-Abfragen direkt im Browser ausführen.
Wenn man sich die Liste der Nutzer ansieht, die viele em-dashes verwenden, scheinen die meisten normale Accounts zu sein.
- Fügt man der Abfrage source hinzu, fallen green Accounts mit besonders häufiger em-dash-Nutzung auf.
- Die Autokorrektur auf iPhone, iPad und Mac kann em-dashes oder ellipsis auch automatisch einsetzen, was die Daten verzerren könnte.
- Es gab auch einen Witz darüber, ob „HN-Kommentare nicht nur an HN, sondern auch an irgendjemanden in Schweden lizenziert“ seien.
- Auch ein kurzes Lob wie „great repo name!“ war dabei.
Das fühlt sich nicht nur bei HN so an, sondern wie eine Krise des anonymen Online-Diskurses insgesamt.
Wenn Vertrauen zerbricht, bricht die Plattform selbst zusammen.
Identitätsprüfung scheint die einzige Lösung zu sein, auch wenn selbst sie nicht perfekt ist.
- Ich sehe das genauso. Man könnte ein System bauen, das Anonymität bewahrt und trotzdem Vertrauen garantiert.
  In meinem Blogbeitrag stelle ich diese Idee vor.
  Es scheint, als käme eine Zeit, in der man beweisen muss, dass man ein Mensch ist.
- Anonymität abzuschaffen ist keine Lösung, sondern der Beginn anderer Probleme.
- Man könnte Vertrauen statt über Identität auch über proof-of-work oder hashcash absichern.
  Wenn sich der Wert eines Kommentars durch geleistete Hash-Berechnungen belegen lässt, wäre Vertrauen auch ohne Identitätsnachweis möglich.
- Ich habe inzwischen immer weniger Lust, HN zu benutzen. Es wäre mir lieber, wenn es nur noch auf Einladung zugänglich wäre. HN war einmal ein eigener Raum, und das vermisse ich.
- Das Karma-System von HN ist ebenfalls eine Art proof-of-work.
  Wenn Bots kein positives Karma halten können, bekommen sie keine Rechte, daher ist auch ohne vollständige Identitätsprüfung eine gewisse Abwehr möglich.
In letzter Zeit fallen auf HN formelle, aber fade Kommentarmuster auf.
Sie wiederholen ständig Strukturen wie „this is [Zusammenfassung] / not just x, it’s y / punchy ending“.
Am Beispiel des Accounts snowhale ist das deutlich zu sehen.
- Dieser Nutzer hat mit nur vier faden Beiträgen 160 Punkte erhalten.
  Das könnte eine Strategie sein, ein Abstimmungsnetzwerk aufzubauen und die Erzählung zu manipulieren.
- Auch der Ausdruck „is real“ wirkt wie eine LLM-Spur.
  In den Suchergebnissen wiederholen mehrere Accounts denselben Satz.
- Ich sehe solche zusammenfassenden Kommentare in letzter Zeit ebenfalls oft.
  Viele Antworten lesen den Gesprächskontext nicht richtig und wirken seltsam abgetrennt.
- AI trifft letztlich ebenfalls wertende Urteile mit Bias.
  Wie Menschen gibt sie sich neutral, aber in ihr steckt die Verzerrung der Trainingsdaten.
  Vollständige Neutralität ist vielleicht eine Illusion.
- Eigentlich ist es leicht, solche Muster zu vermeiden.
  Wenn man dem Prompt hinzufügt: „Sprich wie ich, schreibe nicht wie AI, schreibe knapp“, ist das Problem zur Hälfte gelöst.
Durch diese Debatte haben viele überhaupt erst zum ersten Mal vom em-dash erfahren.
Inzwischen gibt es sogar etliche neue menschliche Nutzer, die in fast jeden Satz ein em-dash setzen.
Die meisten Bot-Accounts, die ich entdeckt habe, verwenden fast nie em-dashes.
Zum Beispiel hat aplomb1026 im Abstand von 30 Sekunden zwei lange Kommentare gepostet.
Das wird deutlich, wenn man den ersten Kommentar und den zweiten Kommentar ansieht.
Wenn die Konfiguration hier nicht versehentlich schlecht war, hätten die meisten es wohl gar nicht bemerkt.
Weitere Bots sind etwa dirtytoken7 und fdefitte.
Englisch-Literatur-Absolventen verwenden em-dashes schon lange, halten sich jetzt aber zurück, weil sie sonst wie AI wirken könnten.
Wenn AI irgendwann auch noch die New-Yorker-artige Diaeresis verwendet, drehe ich wirklich durch.
- Als ich bei GitHub gearbeitet habe, verbot das Unternehmen die Diaeresis mit der Begründung, sie sei leserunfreundlich und elitär.
  Ich habe sie intern trotzdem weiter benutzt.
- Macht mit und verteidigt mit mir zusammen die Ästhetik manuell getippter double-dash.
- Ich habe em-dashes in E-Mails und Texten ebenfalls oft benutzt, aber aufgehört, weil sie wie ein AI-Merkmal wirken.
- Ich wusste gar nicht, dass es so ein Zeichen gibt, aber jetzt werde ich es meinem Ausdrucksrepertoire hinzufügen.
- Jemand meinte auch, er würde gern ein Histogramm meines em-dash-Gebrauchs sehen.
Was, wenn man sich statt „nicht wie AI auszusehen“ lieber dafür entscheidet, im Roboteraufstand unterzutauchen?
Ich schlage ⸻ (U+2E3B dash) vor.
- Es gab den Hinweis, dass dieser Kommentar die Vor-/Zurück-Navigation auf HN kaputtmacht.
- Jemand nannte es den „Big Chungus of dashes“ und scherzte, es sei vielleicht das breiteste Zeichen überhaupt.
- Es gab auch die humorvolle Antwort: „Es gibt nichts zu fürchten, Menschenfreund!“
- Danach ging die Satire weiter, etwa in der Form: „Wir sollten ⸻ häufiger verwenden, um über ⸻ zu sprechen.“

Neue HN-Konten verwenden mit 10-fach höherer Wahrscheinlichkeit Gedankenstriche

Beobachtete Auffälligkeiten in HN-Kommentaren

Methode der Datenerhebung und Analyse

Zentrale statistische Ergebnisse

Interpretation und offene Fragen

Referenzen

Verwandte Beiträge

1 Kommentare

Hacker-News-Meinungen