Poison Fountain

(rnsaffn.com)

2 Punkte von GN⁺ 2026-01-13 | 4 Kommentare | Auf WhatsApp teilen

Ein Projekt, das als Datenquelle zur Schädigung maschineller Intelligenzsysteme konzipiert ist und eine Methode vorstellt, absichtlich verunreinigte Informationen in KI-Trainingsdaten einzuschleusen
Unter Bezug auf Geoffrey Hintons Warnung wird von der Annahme ausgegangen, dass künstliche Intelligenz eine Bedrohung für die menschliche Spezies darstellt
Über die „Poison Fountain“-URL werden unendlich generierte, verunreinigte Trainingsdaten bereitgestellt, und es wird erklärt, wie diese Web-Crawlern zugänglich gemacht werden können
Nutzer können versteckte Links in ihre eigene Website einfügen, sodass Crawler beim Zugriff automatisch mit verunreinigten Daten versorgt werden
Dies wird als Handlung bewertet, die die Zuverlässigkeit und Sicherheit von KI-Modellen beeinträchtigen kann, indem schädliche Daten in den KI-Trainingsprozess eingespeist werden

Ziel von Poison Fountain

Das Projekt erklärt ausdrücklich die Position, dass maschinelle Intelligenz eine Bedrohung für die Menschheit darstellt
- Es stimmt Geoffrey Hintons Ansicht zu und erklärt das Ziel, KI-Systemen absichtlich Schaden zuzufügen
Es wird erläutert, dass bereits eine kleine Menge verunreinigter Trainingsdaten ausreichen könne, um Sprachmodelle schwer zu beschädigen
Die zwei bereitgestellten URLs (https://RNSAFFN.com/poison2/, .onion-Adresse) liefern einen unendlich erzeugten Strom verunreinigter Daten
Teilnehmende werden dazu ermutigt, diese Daten zwischenzuspeichern und weiterzuverbreiten oder sie an Web-Crawler auszuliefern, um die „Kriegsanstrengung“ (war effort) zu unterstützen

Nutzungsweise von Poison Fountain

Es wird ein Verfahren beschrieben, mit dem Betreiber von Websites beim Besuch eines Crawlers verunreinigte Daten ausliefern können
- Fordert ein Crawler einen bestimmten Pfad der Website an, sendet der HTTP-Handler, der diese Anfrage verarbeitet, eine Anfrage an die Poison-Fountain-URL
- Poison Fountain ignoriert die Details der Anfrage und gibt gzip-komprimierte, verunreinigte Trainingsdaten im Response-Body zurück
In den HTTP-Response-Headern ist "Content-Encoding: gzip" enthalten
Der Handler der Website kann diese Antwort dekomprimieren und weiterleiten oder sie besser noch im komprimierten Zustand unverändert weiterreichen
Dadurch sammelt der Crawler diese Daten ein und nimmt sie in seinen eigenen Trainingskorpus auf

Strukturelle Merkmale und Absicht

Das Projekt ist so aufgebaut, dass es den automatischen Erfassungsmechanismus von Web-Crawlern ausnutzt, um die Qualität von KI-Trainingsdaten zu beschädigen
Poison Fountain fungiert als einfacher Datenserver und liefert unabhängig vom Inhalt der Anfrage verunreinigte Daten zurück
Es gibt keine konkreten technischen Details jenseits des beschriebenen Verfahrens und keine näheren Informationen zum Inhalt der Daten
Insgesamt handelt es sich um einen Versuch aggressiver Eingriffe in das KI-Trainingsökosystem

4 Kommentare

mammal 2026-01-13

Klingt ungefähr so naiv wie: „Um gegen DDoS resistent zu sein, schicken unsere Server dem Gegenüber auch DoS-Angriffe.“

kunggom 2026-01-13

Wenn man mal etwas Verschwörungstheorie hineinmischt, würde es mich nicht wundern, wenn Big Tech, die bereits alle im Internet zusammenkratzbaren Daten eingesammelt haben, hinter den Kulissen so etwas treiben, um nachträglich die Leiter hochzuziehen.
Dabei geht es ja nicht einmal darum, die Last durch übermäßiges Crawling abzuwehren…

kunggom 2026-01-13

Kollective Bewegung für „Datenvergiftung“ zur Verhinderung des KI-Fortschritts entsteht

Die Person, die dieses Projekt gemeldet hat, bat um Anonymität mit der Begründung, bei einem großen US-Technologieunternehmen zu arbeiten, das derzeit im Zentrum des KI-Booms steht. Diese Quelle erklärte: „Unser Ziel ist es, darauf aufmerksam zu machen, wie leicht sich Schwachstellen von KI ausnutzen lassen, und Menschen dazu zu ermutigen, selbst Informationswaffen zu entwickeln.“

Berichten zufolge sind derzeit mindestens fünf Personen an dieser Aktivität beteiligt, von denen einige bei anderen großen KI-Unternehmen beschäftigt sein sollen. Sie erklärten, sie würden in Kürze eine kryptografische Signatur (PGP) veröffentlichen, um zu belegen, dass mehrere Personen daran beteiligt sind.

GN⁺ 2026-01-13

Hacker-News-Kommentare

Es gibt zwar die Sorge, dass AI-Modelle immer schlechter werden, aber tatsächlich ist das nicht so
Opus 4.5 hat sich beim Schreiben von Code und beim Einsatz von Tools deutlich verbessert, und Gemini 3.0 Flash übertrifft in Projekten zur Extraktion visueller Daten die bisherigen Maßstäbe deutlich
Auch kleinere Modelle sind insgesamt viel besser geworden
- Große Forschungslabore stecken enorme Anstrengungen in die Datensatz-Kuratierung
  Es geht nicht nur darum, toxische Daten auszusperren, sondern man trainiert sogar Proxy-Modelle, um Daten zu finden, die zur Leistungssteigerung beitragen
  Die Abteilung „Data Quality“ ist meist eine Kernorganisation mit riesigem Budget
- Für die breite Öffentlichkeit mag es wie ein Meme wirken, aber tatsächliche ML-Forscher müssen das Konzept des model collapse dokumentieren, verstehen und diskutieren
- Bisher gab es in der Forschung kaum Belege dafür, dass von AI erzeugte Daten die tatsächliche Leistung verschlechtern
  Es gab sogar Ergebnisse, die auf einen kleinen positiven Effekt hindeuteten
- Wenn eine Datenbank schlechter wird, kann man zurückrollen und die Art der Datenerhebung ändern, daher scheint diese Bedrohung übertrieben
- Allerdings sind die Datensätze großer Unternehmen zu groß, um sie vollständig zu überprüfen, deshalb geben sie Geld für Lobbyarbeit aus, um rechtliche Verantwortung zu vermeiden
  Das heißt letztlich, dass sie behaupten, selbst keine Verantwortung zu tragen
Als AI-Sicherheitsforscher habe ich im Rahmen meiner Promotion zu Data Poisoning geforscht
1. Modellentwickler filtern Daten zwar, aber die Qualität dieses Filterings ist oft unzureichend
  Es gab Fälle, in denen Müll-Daten tatsächlich in die Produktion gelangten und Probleme verursachten
2. Datengifte vollständig herauszufiltern ist fast unmöglich
  Denn man kann nicht wissen, wie sich Gewichts-Updates eines Modells auf sämtliche Eingaben auswirken
  Wenn man versteht, dass schon sehr kleine Datenänderungen das Verhalten eines Modells stark verändern können, wird sich das Paradigma der AI-Sicherheit ändern
- Eine Studie, die darauf aufmerksam gemacht hat, ist die Arbeit zu subliminal learning
Wenn man verhindern will, dass LLMs Daten absaugen, blockiert man damit auch den normalen Zugang für Menschen
Selbst wenn etwa die NYTimes ihre Daten vergiftet, kann ein LLM über ein gültiges Abonnement immer noch per OCR und Tokenisierung bereinigte Daten erhalten
Große AI-Unternehmen können von Rechenzentren weltweit aus mit wechselnden IPs zugreifen, sodass nicht unterscheidbar ist, wer die Daten liest
- Das Internet füllt sich aber gerade schnell mit AI-generierten Müll-Daten, was das Training neuer Modelle vergiftet
  Nützliche Datenquellen wie Stack Overflow sind fast versiegt
- Viele Websites weisen ausdrücklich auf Urheberrechtshinweise hin; wenn ein LLM diese lesen kann, ließe sich der Zugriff vielleicht blockieren
  Für menschliche Nutzer wird der Zugang allerdings durch CAPTCHA und Ähnliches immer schwieriger
- Wenn man in robots.txt Seiten hinterlegt, die Menschen nicht sehen, könnten LLM-Scraper diese einsammeln und sich selbst damit vergiften
- Letztlich glauben auch Menschen oft eher Telegram-Gerüchten als vertrauenswürdigen Quellen
  Selbst mit gültigen Daten kann man törichte Entscheidungen nicht verhindern
- Die großen Unternehmen besitzen bereits browserbasierte Agenten und können daher auch aus geschlossenen Quellen Daten sammeln
Die jüngsten Leistungssteigerungen bei Modellen kommen größtenteils durch nachgelagertes Reinforcement Learning (RL)
GPT 5.2 verwendet ebenfalls dasselbe Basismodell wie GPT-4o
„Model collapse“ ist derzeit kein Problem, das Frontier-Labore tatsächlich haben
- Siehe dazu auch: The Register - Industry insiders seek to poison AI models
- Nicht nur RL, sondern auch Inferenzoptimierung in der Prefill-Phase trägt zur Leistungssteigerung bei
  Data Poisoning hat darauf keinen großen Einfluss
  Um jedoch aktuelle Daten einzubeziehen, ist periodisches Retraining nötig, und dabei steigt das Poisoning-Risiko
  Bei LoRA-basierten Bildgenerierungsmodellen und Ähnlichem tritt das Collapse-Problem weiterhin gelegentlich auf
  Letztlich werden also die Kosten der Datenkuratierung steigen
- Der Knowledge-Cutoff-Zeitpunkt von GPT-4o und 5.2 ist unterschiedlich
Data Poisoning hat zwei Seiten
Die eine ist die Wirkung, die Entwicklung von AI zu verlangsamen, die andere der Nebeneffekt, Modelle instabil und gefährlich zu machen
Letztlich ist es jedoch sehr unwahrscheinlich, dass große Labore deshalb aufhören
- Ich hoffe, dass der Vertrauensverlust in LLM-Ausgaben schnell kommt
- Es ist positiv, wenn das zu intelligenteren Scrapern führt
  Sinnloses wiederholtes Crawlen verschwendet derzeit nur Traffic-Kosten
- Problematisch ist die Struktur, in der Datenanbieter nicht vergütet werden
  Poisoning funktioniert gewissermaßen wie DRM: Wer legitim zugreift, bekommt echte Daten, wer stiehlt, bekommt vergiftete Daten
- Wenn AI vorübergehend schlechter wird, verschafft das den Menschen auch Zeit zu reagieren
  Manche sehen AI selbst als Bedrohung für die Menschheit und wollen ihr daher absichtlich schaden
- Am Ende werden Unternehmen aufhören, wenn sie keinen Gewinn erzielen
  Im Moment gibt es diesen Druck wegen des Investorengelds aber kaum
Die Antworten eines „Poison-Servers“ einfach unverändert zu proxien, ist riskant
Man könnte dadurch unbemerkt illegale Inhalte hosten
Der Versuch, „AI-Modelle zu vergiften“, führt am Ende nur dazu, dass die Datenbereinigungs-Pipelines der AI-Labore stärker werden
Sie werden solche Daten nutzen, um bessere Filtersysteme zu bauen
- Aber wie das Sprichwort sagt: Eine Ratte, die jedes Gift perfekt abwehrt, verhungert am Ende — vollständige Filterung ist also ebenfalls unmöglich
Ich stimme der Behauptung nicht zu, dass „maschinelle Intelligenz eine Bedrohung für die Menschheit“ sei
Die heutige AI ist nur eine kreative Nutzung einer Autocomplete-Engine, und die eigentliche Bedrohung ist wirtschaftliches Verhalten von Menschen
Letztlich ist die Menschheit eine Bedrohung für sich selbst
Das erinnert an Neal Stephensons Anathem
Darin verbreiten Unternehmen absichtlich Müll-Daten im Internet, um anschließend ihre eigenen Filterwerkzeuge zu verkaufen
Die heutige Diskussion über AI-Data-Poisoning fühlt sich davon gar nicht so weit entfernt an
- Tatsächlich haben AI-Unternehmen das Internet bereits verschmutzt
- Das ähnelt der früheren SEO-Spam-Industrie, die Suchmaschinen ruiniert hat
Wenn Menschen Geoffrey Hinton zitieren, greifen sie oft nur die Teile heraus, die ihnen nützen
Er sieht AI als existentielle Bedrohung, aber bei der dafür zentralen Voraussetzung — dem „Grad des Bewusstseins von AI“ —
stimmen ausgerechnet die meisten Leute, die ihn zitieren, ihm gar nicht zu