AI-uBlock-Blacklist

(github.com/alvi-se)

6 Punkte von GN⁺ 2026-02-23 | 1 Kommentare | Auf WhatsApp teilen

Öffentliches Blacklist-Projekt für uBlock Origin, um von KI erzeugte Content-Farm-Websites zu blockieren
Von generativer KI geschriebene Websites sind oft mit Werbung und Empfehlungslinks gefüllt und enthalten unzuverlässige Informationen
Nutzer können die Sperrliste anwenden, indem sie die Datei list.txt abonnieren oder die URL direkt hinzufügen
Die Merkmale und Identifikationskriterien von KI-generierten Websites werden konkret beschrieben, und die Liste kann durch Pull Requests von Mitwirkenden erweitert werden
Kann als praktisches Werkzeug zur Verringerung der Verschmutzung der Suchergebnisse durch KI-Inhalte genutzt werden

Projektüberblick

AI uBlock Blacklist bietet eine Sperrliste für KI-generierte Inhalte, die in der Erweiterung uBlock Origin verwendet werden kann
- Nutzer können auf den Adblock-Plus-Abonnement-Link klicken oder https://raw.githubusercontent.com/alvi-se/ai-ublock-blacklist/… direkt hinzufügen
Jedes Mal, wenn beim Surfen eine von generativer KI geschriebene Website entdeckt wird, wird sie manuell zur Liste hinzugefügt
Es werden keine Automatisierungstools verwendet; als Grund wird angegeben, dass es schwierig ist, algorithmisch festzustellen, ob Inhalte von KI erzeugt wurden

Ziel des Projekts

Von generativer KI geschriebene Websites bieten wenig nützliche Informationen und sind darauf ausgelegt, mit Werbung und Empfehlungslinks Einnahmen zu erzielen
Von KI geschriebene Inhalte können in großer Menge ohne Prüfung veröffentlicht werden und gefährliche Informationen enthalten
- Als Beispiele werden gefährliche Ratschläge genannt, etwa das Kurzschließen von Schaltkreisen, das Ausführen des Befehls rm -rf / oder das Mischen von Bleichmittel und Ammoniak
Aus diesen Gründen gelten KI-generierte Inhalte als nicht vertrauenswürdig und blockierungsbedürftig
Der Verfasser ist Italiener, daher sind viele italienischsprachige Websites enthalten, und Beiträge zum Hinzufügen von Websites in anderen Sprachen sind willkommen

So fügt man Websites hinzu

Nutzer ohne technisches Wissen können verdächtige Websites über ein GitHub Issue melden
Bei direktem Hinzufügen per Pull Request kann auf Domain-Ebene oder auf Ebene eines bestimmten Blog-Pfads blockiert werden
- Beispiel: ||example.com/@slopUser^$doc oder ||example.com^$doc
Wenn Organisationen, die SEO- und digitales Marketing als Service verkaufen, mehrere Content-Farmen betreiben, wird empfohlen, die zugehörigen Websites gemeinsam hinzuzufügen

Kriterien zur Erkennung von KI-Content-Farmen

Unnötige Einleitungen und Schlussfolgerungen, übertriebene Titel wie „Comprehensive Guide“, fehlende externe Links und Quellen sowie zahlreiche Empfehlungslinks
Tausende Beiträge in kurzer Zeit, Fehlinformationen (Halluzinationen), Beiträge nach November 2022 sowie KI-generierte Bilder und Logos
Schlampig formatierter Text, nicht gerenderte Markdown-Syntax, lange, themenfremde Passagen und wiederholte Top-Platzierungen in Suchergebnissen
Fehlende Kontaktinformationen, vage Über-uns-Seiten und KI-verherrlichende Inhalte werden ebenfalls als wichtige Merkmale genannt

Einsatz von Google Dorks

Wenn von KI erzeugte Sätze unverändert kopiert und veröffentlicht werden, lassen sich KI-Seiten durch die Suche nach bestimmten Formulierungen finden
- Beispiel: "Sure! Here's an article about" (Englisch), "Certo! Ecco un articolo" (Italienisch)
Seiten mit solchen Formulierungen werden mit der gesamten Domain auf die Blacklist gesetzt

1 Kommentare

GN⁺ 2026-02-23

Meinungen auf Hacker News

Die Idee fand ich interessant und ich wollte auch zur Liste beitragen, habe aber beim FAQ mit der Formulierung „Cry about it“ aufgehört
Ich finde, so eine Haltung ist ungeeignet für den Betrieb einer öffentlichen Blacklist. Es wirkt, als halte sich der Maintainer für unfehlbar
- Meine persönliche Website hat etwas Ähnliches erlebt. Freunde sagten mir, sie könnten nicht darauf zugreifen, und ich dachte erst an ein Serverproblem, aber meine Seite stand auf irgendeiner Blockliste von PiHole
  Ich habe um Freigabe gebeten, aber nie eine Antwort erhalten, und sie ist immer noch blockiert
- Manche sehen solche Einsprüche als ähnlich wenig vertrauenswürdig an wie Anträge auf Aufhebung eines VAC-Bans
- Mit so einer Haltung ist es unwahrscheinlich, dass dieses Projekt in 5 Jahren noch gepflegt wird. So etwas sollte ein erprobtes Team wie Easylist übernehmen
- Andere meinten, man solle nicht vergessen, dass es sich um eine „persönliche uBlock-Origin-Liste“ handelt
- Inzwischen scheint es aber korrigiert worden zu sein. Den betreffenden Commit gibt es hier
Als realistischeren Ansatz gibt es inzwischen eine neue Liste, die nur Content-Farms oder minderwertige Websites blockiert
Das scheint eine bessere Alternative zu den bisherigen breit angelegten AI-Blocklisten zu sein
Siehe uBlockOrigin-HUGE-AI-Blocklist
Auf Reddit gibt es ebenfalls eine aktive Diskussion dazu
- Die bisherige Liste wirkt eher wie eine reine Hassliste. Sogar Websites, die AI-Inhalte offen kennzeichnen, sind darin enthalten
- Interessant, dass die Website-Liste in einer Tabelle organisiert ist. Nachdem ich früher einen Fall mit einer von SEO zugespammten Mediengruppe gesehen hatte, suchte ich nach ähnlichen Seiten und fügte sie zu uBlacklist hinzu
  In meinem gist habe ich den Suchprozess und die Liste geteilt
- Allerdings wurde diese Liste seit 5 Monaten nicht mehr aktualisiert
- Manche haben einfach beide Listen hinzugefügt
Mit der Zeit wird das Problem der False Positives immer gravierender. Domains werden verkauft, Websites ändern ihre Ausrichtung oder Inhalte werden gelöscht
Mit einer Haltung wie „Cry about it“ wird das nur zu einem Verleumdungs-Schwarzen-Loch. Es braucht zumindest einen Ablauf- oder Überprüfungsmechanismus
In uBlock Origin gibt es bereits eine Blockliste für „AI widget“. Wegen solcher Funktionen nutze ich noch immer Firefox. Unter Chromium ist das nutzlos
Dem Grundsatz stimme ich zu, aber eine Haltung nach dem Muster „Wer mit AI schreibt, hat ein Skill-Problem“ ist Grammarly-Nutzern oder Nicht-Muttersprachlern gegenüber unfair
- Gruppen, denen man ein „Skill issue“ vorhält, waren noch nie ohne Beschwerden
- Ich finde unbeholfene englische Sätze oder holprig übersetzte Texte sogar menschlicher und vielfältiger als AI-generierten Text
  Außerdem richtet sich dieses Projekt nicht gegen einzelne Autoren, sondern gegen Content-Farms, also ist das ein anderer Punkt
- Allerdings entfernt dieser Autor Domains auch dann nicht aus der Liste, wenn der Besitz gewechselt hat. Whitehouse.com war zum Beispiel früher eine Pornoseite, ist es heute aber nicht mehr
- Manche meinten, wer kein gutes Englisch kann, solle einfach einen maschinellen Übersetzer verwenden
- Ich nutze Grammarly beruflich, um Markenrichtlinien einzuhalten. Es macht meinen Stil nicht AI-artig.
  Der Autor scheint eher auf AI-Bot-Farms zu zielen
Immerhin ist im Internet noch keine Whitelist entstanden
- Mit dem Ende des app-zentrierten Zeitalters ist diese Gefahr wohl vorbei
Ich nutze ein Tool, das anhand von Tropes erkennt, ob ein Text von AI geschrieben wurde, und den ursprünglichen Prompt rekonstruiert
tropes.fyi/aidr
- Jemand fand die Idee interessant und teilte einen Beispiellink sowie ein weiteres Beispiel
Diese Richtung gefällt mir. Ich wünschte, es gäbe mehr Blockierungen nach Website-Kategorien
In Unternehmensumgebungen werden Websites über URL-Reputationsdienste kategorisiert und der Zugriff entsprechend gesteuert
Ich denke, auch Privatnutzer brauchen eine solche crowdfinanzierte Infrastruktur
Zum Beispiel wäre ein gemeinnütziger Fonds im Umfang von 1 Milliarde Dollar pro Jahr für ein vertrauenswürdiges Ökosystem aus Browsern, VPN, DNS, E-Mail und Zertifizierungsstellen wünschenswert
Es gibt auch Erweiterungen wie botblock.ai, die auf Twitter AI-Antworten erkennen
- Darauf kam aber auch die Reaktion: „Dann nutzt man besser einfach kein Twitter“
- In der Praxis scheint es nicht besonders gut zu funktionieren. Ein offensichtlich von AI betriebener Account wird zum Beispiel als 100 % menschlich eingestuft
  Belegbild
- Twitter ist ohnehin schon zu einer 8-Dollar-Werbeplattform geworden, seit bezahlte Accounts oben angezeigt werden
Wenn eine Seite zu viele Anzeigen hat, schließe ich sie einfach. Wenn die Werbung halbwegs vernünftig eingebunden ist, nutze ich die Seite weiter
Ich bin müde vom Adblock-Krieg. Ständig tauchen neue Pluginnamen auf, und es wirkt wie ein endloses Wettrüsten
- Das Problem ist, dass Werbung oft ein Einfallstor für Malware ist

AI-uBlock-Blacklist

Projektüberblick

Ziel des Projekts

So fügt man Websites hinzu

Kriterien zur Erkennung von KI-Content-Farmen

Einsatz von Google Dorks

Ähnliche Projekte

Verwandte Beiträge

1 Kommentare

Meinungen auf Hacker News