Tool zum Durchsuchen ausschließlich von Inhalten, die vor der Veröffentlichung von ChatGPT erstellt wurden

(tegabrain.com)

16 Punkte von GN⁺ 2025-12-02 | 1 Kommentare | Auf WhatsApp teilen

Eine Browser-Erweiterung, die entwickelt wurde, um Kontamination durch KI-generierte Inhalte zu vermeiden, und so konzipiert ist, dass nur von Menschen verfasste Inhalte durchsucht werden
Gibt mithilfe der Google-Such-API nur Ergebnisse zurück, die vor dem 30. November 2022 veröffentlicht wurden
Für Chrome und Firefox zum Download verfügbar und nutzbar
Geht davon aus, dass seit dem Aufkommen von ChatGPT und anderen großen Sprachmodellen KI-generierte Texte, Bilder und Videos im Internet stark zugenommen haben
Bietet Nutzern, die nur auf von Menschen erstellte Materialien zugreifen möchten, eine vertrauenswürdige Suchumgebung

Überblick über Slop Evader

Slop Evader ist eine Browser-Erweiterung zur Vermeidung KI-generierter Inhalte und kann in Chrome und Firefox verwendet werden
- Nutzer können die Erweiterung installieren, um von KI erstellte Inhalte herauszufiltern
Dieses Tool zeigt in den Suchergebnissen nur Inhalte an, die vor der Veröffentlichung von ChatGPT (30. November 2022) erstellt wurden
- Dazu nutzt es die Google-Such-API, um Ergebnisse anhand des Datums zu begrenzen

Hintergrund der Entwicklung

Seit der Veröffentlichung von ChatGPT und anderen großen Sprachmodellen (LLM) hat die Zahl von KI-generierten Texten, Bildern und Videos im Internet stark zugenommen
Slop Evader wurde entwickelt, um diese Verschmutzung von Online-Informationen durch KI-generierte Inhalte zu vermeiden
Mit dieser Erweiterung können Nutzer nur direkt von Menschen geschriebene oder erstellte Inhalte durchsuchen

Funktionen und Bedeutung

Indem die Suchergebnisse auf Beiträge beschränkt werden, die vor dem 30. November 2022 veröffentlicht wurden, wird der Einfluss KI-generierter Inhalte minimiert
Es basiert auf der Google-Such-API und bietet dadurch eine Nutzungserfahrung, die der gewohnten Suche ähnelt
Es dient als Werkzeug, das in Zeiten der Verbreitung von KI-Inhalten einen menschenzentrierten Zugang zu Informationen sicherstellt

1 Kommentare

GN⁺ 2025-12-02

Hacker-News-Kommentare

Es soll ein Tool sein, das nur Inhalte durchsucht, die vor der Veröffentlichung von ChatGPT (30. November 2022) entstanden sind.
Allerdings scheint der Qualitätsverlust der Suche schon viel früher begonnen zu haben.
Nicht nur Google, sondern alle Suchmaschinen wurden bereits schlechter, und später hat AI diesen Abwärtstrend beschleunigt.
Besonders problematisch war, dass die YouTube-Suchoberfläche gewaltsam in die Google-Suche transplantiert wurde.
Nutzer wollen nicht „xyz, wonach andere Leute gesucht haben“, sondern präzise Ergebnisse, doch durch Werbung und klickorientierte Elemente wurde die UI nur noch verwirrender
- Ich würde gern fragen, ob du die Suchmaschine Kagi kennst.
  Dort kann man AI-Funktionen komplett abschalten.
  Aktuell gibt es etwa 61.000 Mitglieder, und die Zahl wächst um 2.000 pro Monat (Statistik-Link)
- Tatsächlich gab es automatisch erzeugte Inhalte schon vor ChatGPT.
  Um 2020 herum gab es bereits viele SEO-Seiten voller zusammenkopierter Inhalte oder Keyword-Spam.
  Es gab auch viele Texte, die mit einfachen Sprachmodellen oder Markov-Ketten erzeugt wurden
- In Parodie auf den Satz „Google made the search results worse“
  wird mit Autovervollständigungs-Witzen wie „worse results near me“ und „best worse results“ gespielt
- Es wird darauf hingewiesen, dass Googles Ziel nicht ist, dem Nutzer Informationen finden zu lassen, sondern die Verweildauer zu erhöhen.
  Spöttisch wird angemerkt, dass Unternehmenssprache nur verpackt, wie man das Leben der Menschen unbequemer macht
- Ich nutze seit über 10 Jahren DuckDuckGo.
  Hauptsächlich für die Suche nach Programmierdokumentation, und die Ergebnisse sind immer noch ziemlich präzise.
  Vielleicht liegt es daran, dass mein Suchmuster simpel ist, aber DDG ist weiterhin brauchbar
Jemand sagte, „wir schürfen nach ‘Low-Background-Tokens’, so wie stahl mit niedriger Hintergrundstrahlung (low-background steel) aus der Zeit nach dem Zweiten Weltkrieg“, und diese Metapher geht mir nicht mehr aus dem Kopf.
In Latent Space wurde dazu ein passender Artikel zusammengestellt.
Ich bin mir nicht sicher, ob von Menschen erzeugte Tokens wirklich mehr „hohes Signal“ enthalten als von AI erzeugte
- Tatsächlich wird Stahl mit niedriger Hintergrundstrahlung heute nicht mehr gebraucht.
  Laut Wikipedia-Erklärung liegt das daran, dass das Strahlungsniveau seit dem Partial Test Ban Treaty von 1963 ausreichend niedrig ist
- Heutzutage sind synthetische Daten ohnehin so verbreitet, dass dieses Konzept gar nicht mehr neu wirkt
- Es wird klargestellt: „Die Person, die das gesagt hat, war ich, swyx“
- Menschliche Generationen haben immer auf dem unvollkommenen Erbe der vorherigen Generation aufgebaut.
  Dafür hatten wir den Ausdruck „auf den Schultern von Riesen stehen“
Solche Projekte erinnern an das Setting von Cyberpunk 2077.
Dort war das erste Internet von gefährlichen AIs verseucht, woraufhin eine riesige Firewall errichtet und ein neues, menschenzentriertes Internet aufgebaut wurde.
Vielleicht brauchen wir irgendwann ein nur für Menschen bestimmtes Internet.
Realistisch ist das natürlich schwer umzusetzen, aber man kann sich ein meatspace-first network vorstellen, in dem man fortlaufend beweisen muss, dass man ein Mensch ist
- Das Problem ist, dass nicht verifizierbar ist, ob Inhalte wirklich aus menschlichen Gedanken stammen.
  Die meisten Inhalte stehen bereits unter AI-Einfluss, und bloßes Referenzieren ist etwas anderes als Copy-paste-Betrug
- Wie Nick Bostrom sagte: Eine zivilisationsstörende Technologie, die einmal in die Welt gekommen ist, lässt sich nicht zurückholen.
  Am Ende müssen wir uns anpassen.
  Ich halte autonome Netzwerke wie Mastodon, Discord oder Matrix für Beispiele in diese Richtung
- Schon jetzt wechseln Menschen in private Gruppen auf Signal, WhatsApp oder Telegram
- Ähnliche Settings gab es auch in Peter Watts’ Starfish-Trilogie oder in Neal Stephensons Anathem
- Selbst ein „nur für Menschen bestimmtes Internet“ wäre bedeutungslos, wenn Menschen wiederum unter AI-Einfluss stehen
Es gibt ein HN-Leaderboard, das die Nutzung von em dashes (—) vor ChatGPT zeigt.
Link
- Es wird vorgeschlagen, auch Leute mit double hyphens (--) einzubeziehen
- Beim Kommentar des Nutzers auf Platz 1 fiel auf, dass er die Angewohnheit hatte, Backticks (`) statt Apostrophen zu verwenden
- Scherzhaft heißt es, man solle auch die Nutzer von en dashes (–) nicht vergessen
So eine Funktion ist auch ohne Erweiterung möglich.
Man muss in der Google-Suche einfach den Filter before: hinzufügen.
Beispiel: Happiness before:2022
Ich weiß nicht, ob AI-generierte Inhalte wirklich so ein großes Problem sind.
In den meisten Fällen ersetzen sie doch nur den alten Content-Farm-SEO-Spam.
Solche Texte habe ich früher auch nicht gelesen, und jetzt sind die Sätze nur etwas flüssiger.
Wenn man auf saubere Suchhygiene achtet, sollte das kein Problem sein.
Nur in Reddits r/chess posten Leute oft ChatGPT-Antworten so, als hätten sie sie selbst geschrieben
- Ein Kollege schickte mir einen mit ChatGPT verfassten Bug Report, der das Problem völlig falsch diagnostizierte.
  Danach führte er sogar die weitere Unterhaltung mit ChatGPT fort und behauptete, ich läge falsch.
  Diese Zukunft macht mir Sorgen
- Früher gab es nur ein oder zwei falsche Antworten, die man leicht aussortieren konnte,
  heute gibt es Dutzende inhaltlich identische falsche Antworten in unterschiedlicher Form
- Auch in wissenschaftlich-technischen Subreddits wimmelt es von ChatGPT-Reposts.
  Leute posten, weil sie glauben, einen philosophischen Durchbruch entdeckt zu haben.
  Selbst auf /r/localllama gibt es viel AI-Spam, und manche „Show HN“-Beiträge auf HN sind gefälschte Portfolios, die von LLMs erstellt wurden.
  Ich habe mit so etwas selbst schon Zeit verschwendet
- Der frühere SEO-Spam war immerhin noch faktenbasiert.
  Wie bei Rezeptseiten konnte man die unnötigen Teile überspringen.
  Heute aber ist fast jede Suchanfrage mit AI-generierten Sätzen überzogen.
  Früher bekam man mit seltenen Suchbegriffen präzise Treffer, heute muss man sich durch bedeutungslose Seiten kämpfen
- Als Gegenargument heißt es: Früher schrieb jemand einen guten Text und Suchmaschinen fanden ihn von selbst,
  heute wird dieser menschliche Text in die Trainingsdaten von LLMs eingesogen und als Grundlage für die nächste Generation von AI-Inhalten wiederverwertet.
  Ob man will oder nicht
Der Ausdruck „Low-Background-Stahl des Internets“ ist interessant.
Passender Wiki-Link
- Schon vor einem halben Jahr wurde dasselbe Thema auf HN erwähnt
Das ist etwas, das ich bei Recherchen mit ChatGPT erlebt habe.
- Es halluziniert selbstbewusst falsche Antworten
- Es speichert diesen Inhalt im Gedächtnis und behält ihn bei
- Auf Nachfrage nach Quellen zitiert es sich selbst, indem es zwei von AI erfundene Fake-Artikel nennt
  Am Ende habe ich das Problem gelöst, indem ich das von Menschen geschriebene Dokument der ursprünglichen Institution gefunden habe.
  So etwas passiert häufig an den Randbereichen des Wissens
- AI fühlt sich an, als würde man Stack-Overflow-Antworten durchforsten.
  Die erste Antwort kann richtig sein oder auch nicht.
  Aber bei einem Chatbot ist es schwer, wieder aus der falschen Richtung herauszukommen
- Eine einfache Lösung ist, dieselbe Frage an drei verschiedene LLMs zu stellen.
  Wenn die Ergebnisse übereinstimmen, geht man davon aus, dass die Wahrscheinlichkeit einer Halluzination geringer ist
Für die Bildersuche ist same.energy ganz gut.
Es wurde seit Jahren vernachlässigt, funktioniert aber immer noch, und es gibt dort fast keine AI-Bilder.
Das Produkt selbst ist ebenfalls ziemlich gut
Die Google-Suchergebnisse waren schon vor ChatGPT zu 90 % SEO-Müll.
Man sollte einfach Kagi nutzen und SEO-Seiten blockieren
- Mich würde aber interessieren, wie Kagi SEO-Seiten unterscheidet.
  Ich würde gern wissen, ob es dafür Filterlisten oder bestimmte Kriterien gibt

Tool zum Durchsuchen ausschließlich von Inhalten, die vor der Veröffentlichung von ChatGPT erstellt wurden

Überblick über Slop Evader

Hintergrund der Entwicklung

Funktionen und Bedeutung

Verwandte Beiträge

1 Kommentare

Hacker-News-Kommentare