Tool zum Durchsuchen ausschließlich von Inhalten, die vor der Veröffentlichung von ChatGPT erstellt wurden
(tegabrain.com)- Eine Browser-Erweiterung, die entwickelt wurde, um Kontamination durch KI-generierte Inhalte zu vermeiden, und so konzipiert ist, dass nur von Menschen verfasste Inhalte durchsucht werden
- Gibt mithilfe der Google-Such-API nur Ergebnisse zurück, die vor dem 30. November 2022 veröffentlicht wurden
- Für Chrome und Firefox zum Download verfügbar und nutzbar
- Geht davon aus, dass seit dem Aufkommen von ChatGPT und anderen großen Sprachmodellen KI-generierte Texte, Bilder und Videos im Internet stark zugenommen haben
- Bietet Nutzern, die nur auf von Menschen erstellte Materialien zugreifen möchten, eine vertrauenswürdige Suchumgebung
Überblick über Slop Evader
- Slop Evader ist eine Browser-Erweiterung zur Vermeidung KI-generierter Inhalte und kann in Chrome und Firefox verwendet werden
- Nutzer können die Erweiterung installieren, um von KI erstellte Inhalte herauszufiltern
- Dieses Tool zeigt in den Suchergebnissen nur Inhalte an, die vor der Veröffentlichung von ChatGPT (30. November 2022) erstellt wurden
- Dazu nutzt es die Google-Such-API, um Ergebnisse anhand des Datums zu begrenzen
Hintergrund der Entwicklung
- Seit der Veröffentlichung von ChatGPT und anderen großen Sprachmodellen (LLM) hat die Zahl von KI-generierten Texten, Bildern und Videos im Internet stark zugenommen
- Slop Evader wurde entwickelt, um diese Verschmutzung von Online-Informationen durch KI-generierte Inhalte zu vermeiden
- Mit dieser Erweiterung können Nutzer nur direkt von Menschen geschriebene oder erstellte Inhalte durchsuchen
Funktionen und Bedeutung
- Indem die Suchergebnisse auf Beiträge beschränkt werden, die vor dem 30. November 2022 veröffentlicht wurden, wird der Einfluss KI-generierter Inhalte minimiert
- Es basiert auf der Google-Such-API und bietet dadurch eine Nutzungserfahrung, die der gewohnten Suche ähnelt
- Es dient als Werkzeug, das in Zeiten der Verbreitung von KI-Inhalten einen menschenzentrierten Zugang zu Informationen sicherstellt
1 Kommentare
Hacker-News-Kommentare
Es soll ein Tool sein, das nur Inhalte durchsucht, die vor der Veröffentlichung von ChatGPT (30. November 2022) entstanden sind.
Allerdings scheint der Qualitätsverlust der Suche schon viel früher begonnen zu haben.
Nicht nur Google, sondern alle Suchmaschinen wurden bereits schlechter, und später hat AI diesen Abwärtstrend beschleunigt.
Besonders problematisch war, dass die YouTube-Suchoberfläche gewaltsam in die Google-Suche transplantiert wurde.
Nutzer wollen nicht „xyz, wonach andere Leute gesucht haben“, sondern präzise Ergebnisse, doch durch Werbung und klickorientierte Elemente wurde die UI nur noch verwirrender
Dort kann man AI-Funktionen komplett abschalten.
Aktuell gibt es etwa 61.000 Mitglieder, und die Zahl wächst um 2.000 pro Monat (Statistik-Link)
Um 2020 herum gab es bereits viele SEO-Seiten voller zusammenkopierter Inhalte oder Keyword-Spam.
Es gab auch viele Texte, die mit einfachen Sprachmodellen oder Markov-Ketten erzeugt wurden
wird mit Autovervollständigungs-Witzen wie „worse results near me“ und „best worse results“ gespielt
Spöttisch wird angemerkt, dass Unternehmenssprache nur verpackt, wie man das Leben der Menschen unbequemer macht
Hauptsächlich für die Suche nach Programmierdokumentation, und die Ergebnisse sind immer noch ziemlich präzise.
Vielleicht liegt es daran, dass mein Suchmuster simpel ist, aber DDG ist weiterhin brauchbar
Jemand sagte, „wir schürfen nach ‘Low-Background-Tokens’, so wie stahl mit niedriger Hintergrundstrahlung (low-background steel) aus der Zeit nach dem Zweiten Weltkrieg“, und diese Metapher geht mir nicht mehr aus dem Kopf.
In Latent Space wurde dazu ein passender Artikel zusammengestellt.
Ich bin mir nicht sicher, ob von Menschen erzeugte Tokens wirklich mehr „hohes Signal“ enthalten als von AI erzeugte
Laut Wikipedia-Erklärung liegt das daran, dass das Strahlungsniveau seit dem Partial Test Ban Treaty von 1963 ausreichend niedrig ist
Dafür hatten wir den Ausdruck „auf den Schultern von Riesen stehen“
Solche Projekte erinnern an das Setting von Cyberpunk 2077.
Dort war das erste Internet von gefährlichen AIs verseucht, woraufhin eine riesige Firewall errichtet und ein neues, menschenzentriertes Internet aufgebaut wurde.
Vielleicht brauchen wir irgendwann ein nur für Menschen bestimmtes Internet.
Realistisch ist das natürlich schwer umzusetzen, aber man kann sich ein meatspace-first network vorstellen, in dem man fortlaufend beweisen muss, dass man ein Mensch ist
Die meisten Inhalte stehen bereits unter AI-Einfluss, und bloßes Referenzieren ist etwas anderes als Copy-paste-Betrug
Am Ende müssen wir uns anpassen.
Ich halte autonome Netzwerke wie Mastodon, Discord oder Matrix für Beispiele in diese Richtung
Es gibt ein HN-Leaderboard, das die Nutzung von em dashes (—) vor ChatGPT zeigt.
Link
So eine Funktion ist auch ohne Erweiterung möglich.
Man muss in der Google-Suche einfach den Filter
before:hinzufügen.Beispiel: Happiness before:2022
Ich weiß nicht, ob AI-generierte Inhalte wirklich so ein großes Problem sind.
In den meisten Fällen ersetzen sie doch nur den alten Content-Farm-SEO-Spam.
Solche Texte habe ich früher auch nicht gelesen, und jetzt sind die Sätze nur etwas flüssiger.
Wenn man auf saubere Suchhygiene achtet, sollte das kein Problem sein.
Nur in Reddits r/chess posten Leute oft ChatGPT-Antworten so, als hätten sie sie selbst geschrieben
Danach führte er sogar die weitere Unterhaltung mit ChatGPT fort und behauptete, ich läge falsch.
Diese Zukunft macht mir Sorgen
heute gibt es Dutzende inhaltlich identische falsche Antworten in unterschiedlicher Form
Leute posten, weil sie glauben, einen philosophischen Durchbruch entdeckt zu haben.
Selbst auf /r/localllama gibt es viel AI-Spam, und manche „Show HN“-Beiträge auf HN sind gefälschte Portfolios, die von LLMs erstellt wurden.
Ich habe mit so etwas selbst schon Zeit verschwendet
Wie bei Rezeptseiten konnte man die unnötigen Teile überspringen.
Heute aber ist fast jede Suchanfrage mit AI-generierten Sätzen überzogen.
Früher bekam man mit seltenen Suchbegriffen präzise Treffer, heute muss man sich durch bedeutungslose Seiten kämpfen
heute wird dieser menschliche Text in die Trainingsdaten von LLMs eingesogen und als Grundlage für die nächste Generation von AI-Inhalten wiederverwertet.
Ob man will oder nicht
Der Ausdruck „Low-Background-Stahl des Internets“ ist interessant.
Passender Wiki-Link
Das ist etwas, das ich bei Recherchen mit ChatGPT erlebt habe.
Am Ende habe ich das Problem gelöst, indem ich das von Menschen geschriebene Dokument der ursprünglichen Institution gefunden habe.
So etwas passiert häufig an den Randbereichen des Wissens
Die erste Antwort kann richtig sein oder auch nicht.
Aber bei einem Chatbot ist es schwer, wieder aus der falschen Richtung herauszukommen
Wenn die Ergebnisse übereinstimmen, geht man davon aus, dass die Wahrscheinlichkeit einer Halluzination geringer ist
Für die Bildersuche ist same.energy ganz gut.
Es wurde seit Jahren vernachlässigt, funktioniert aber immer noch, und es gibt dort fast keine AI-Bilder.
Das Produkt selbst ist ebenfalls ziemlich gut
Die Google-Suchergebnisse waren schon vor ChatGPT zu 90 % SEO-Müll.
Man sollte einfach Kagi nutzen und SEO-Seiten blockieren
Ich würde gern wissen, ob es dafür Filterlisten oder bestimmte Kriterien gibt