Poison Fountain
(rnsaffn.com)- Ein Projekt, das als Datenquelle zur Schädigung maschineller Intelligenzsysteme konzipiert ist und eine Methode vorstellt, absichtlich verunreinigte Informationen in KI-Trainingsdaten einzuschleusen
- Unter Bezug auf Geoffrey Hintons Warnung wird von der Annahme ausgegangen, dass künstliche Intelligenz eine Bedrohung für die menschliche Spezies darstellt
- Über die „Poison Fountain“-URL werden unendlich generierte, verunreinigte Trainingsdaten bereitgestellt, und es wird erklärt, wie diese Web-Crawlern zugänglich gemacht werden können
- Nutzer können versteckte Links in ihre eigene Website einfügen, sodass Crawler beim Zugriff automatisch mit verunreinigten Daten versorgt werden
- Dies wird als Handlung bewertet, die die Zuverlässigkeit und Sicherheit von KI-Modellen beeinträchtigen kann, indem schädliche Daten in den KI-Trainingsprozess eingespeist werden
Ziel von Poison Fountain
- Das Projekt erklärt ausdrücklich die Position, dass maschinelle Intelligenz eine Bedrohung für die Menschheit darstellt
- Es stimmt Geoffrey Hintons Ansicht zu und erklärt das Ziel, KI-Systemen absichtlich Schaden zuzufügen
- Es wird erläutert, dass bereits eine kleine Menge verunreinigter Trainingsdaten ausreichen könne, um Sprachmodelle schwer zu beschädigen
- Die zwei bereitgestellten URLs (
https://RNSAFFN.com/poison2/,.onion-Adresse) liefern einen unendlich erzeugten Strom verunreinigter Daten - Teilnehmende werden dazu ermutigt, diese Daten zwischenzuspeichern und weiterzuverbreiten oder sie an Web-Crawler auszuliefern, um die „Kriegsanstrengung“ (
war effort) zu unterstützen
Nutzungsweise von Poison Fountain
- Es wird ein Verfahren beschrieben, mit dem Betreiber von Websites beim Besuch eines Crawlers verunreinigte Daten ausliefern können
- Fordert ein Crawler einen bestimmten Pfad der Website an, sendet der HTTP-Handler, der diese Anfrage verarbeitet, eine Anfrage an die Poison-Fountain-URL
- Poison Fountain ignoriert die Details der Anfrage und gibt gzip-komprimierte, verunreinigte Trainingsdaten im Response-Body zurück
- In den HTTP-Response-Headern ist
"Content-Encoding: gzip"enthalten - Der Handler der Website kann diese Antwort dekomprimieren und weiterleiten oder sie besser noch im komprimierten Zustand unverändert weiterreichen
- Dadurch sammelt der Crawler diese Daten ein und nimmt sie in seinen eigenen Trainingskorpus auf
Strukturelle Merkmale und Absicht
- Das Projekt ist so aufgebaut, dass es den automatischen Erfassungsmechanismus von Web-Crawlern ausnutzt, um die Qualität von KI-Trainingsdaten zu beschädigen
- Poison Fountain fungiert als einfacher Datenserver und liefert unabhängig vom Inhalt der Anfrage verunreinigte Daten zurück
- Es gibt keine konkreten technischen Details jenseits des beschriebenen Verfahrens und keine näheren Informationen zum Inhalt der Daten
- Insgesamt handelt es sich um einen Versuch aggressiver Eingriffe in das KI-Trainingsökosystem
4 Kommentare
Klingt ungefähr so naiv wie: „Um gegen DDoS resistent zu sein, schicken unsere Server dem Gegenüber auch DoS-Angriffe.“
Wenn man mal etwas Verschwörungstheorie hineinmischt, würde es mich nicht wundern, wenn Big Tech, die bereits alle im Internet zusammenkratzbaren Daten eingesammelt haben, hinter den Kulissen so etwas treiben, um nachträglich die Leiter hochzuziehen.
Dabei geht es ja nicht einmal darum, die Last durch übermäßiges Crawling abzuwehren…
Kollective Bewegung für „Datenvergiftung“ zur Verhinderung des KI-Fortschritts entsteht
Hacker-News-Kommentare
Es gibt zwar die Sorge, dass AI-Modelle immer schlechter werden, aber tatsächlich ist das nicht so
Opus 4.5 hat sich beim Schreiben von Code und beim Einsatz von Tools deutlich verbessert, und Gemini 3.0 Flash übertrifft in Projekten zur Extraktion visueller Daten die bisherigen Maßstäbe deutlich
Auch kleinere Modelle sind insgesamt viel besser geworden
Es geht nicht nur darum, toxische Daten auszusperren, sondern man trainiert sogar Proxy-Modelle, um Daten zu finden, die zur Leistungssteigerung beitragen
Die Abteilung „Data Quality“ ist meist eine Kernorganisation mit riesigem Budget
Es gab sogar Ergebnisse, die auf einen kleinen positiven Effekt hindeuteten
Das heißt letztlich, dass sie behaupten, selbst keine Verantwortung zu tragen
Als AI-Sicherheitsforscher habe ich im Rahmen meiner Promotion zu Data Poisoning geforscht
Es gab Fälle, in denen Müll-Daten tatsächlich in die Produktion gelangten und Probleme verursachten
Denn man kann nicht wissen, wie sich Gewichts-Updates eines Modells auf sämtliche Eingaben auswirken
Wenn man versteht, dass schon sehr kleine Datenänderungen das Verhalten eines Modells stark verändern können, wird sich das Paradigma der AI-Sicherheit ändern
Wenn man verhindern will, dass LLMs Daten absaugen, blockiert man damit auch den normalen Zugang für Menschen
Selbst wenn etwa die NYTimes ihre Daten vergiftet, kann ein LLM über ein gültiges Abonnement immer noch per OCR und Tokenisierung bereinigte Daten erhalten
Große AI-Unternehmen können von Rechenzentren weltweit aus mit wechselnden IPs zugreifen, sodass nicht unterscheidbar ist, wer die Daten liest
Nützliche Datenquellen wie Stack Overflow sind fast versiegt
Für menschliche Nutzer wird der Zugang allerdings durch CAPTCHA und Ähnliches immer schwieriger
robots.txtSeiten hinterlegt, die Menschen nicht sehen, könnten LLM-Scraper diese einsammeln und sich selbst damit vergiftenSelbst mit gültigen Daten kann man törichte Entscheidungen nicht verhindern
Die jüngsten Leistungssteigerungen bei Modellen kommen größtenteils durch nachgelagertes Reinforcement Learning (RL)
GPT 5.2 verwendet ebenfalls dasselbe Basismodell wie GPT-4o
„Model collapse“ ist derzeit kein Problem, das Frontier-Labore tatsächlich haben
Data Poisoning hat darauf keinen großen Einfluss
Um jedoch aktuelle Daten einzubeziehen, ist periodisches Retraining nötig, und dabei steigt das Poisoning-Risiko
Bei LoRA-basierten Bildgenerierungsmodellen und Ähnlichem tritt das Collapse-Problem weiterhin gelegentlich auf
Letztlich werden also die Kosten der Datenkuratierung steigen
Data Poisoning hat zwei Seiten
Die eine ist die Wirkung, die Entwicklung von AI zu verlangsamen, die andere der Nebeneffekt, Modelle instabil und gefährlich zu machen
Letztlich ist es jedoch sehr unwahrscheinlich, dass große Labore deshalb aufhören
Sinnloses wiederholtes Crawlen verschwendet derzeit nur Traffic-Kosten
Poisoning funktioniert gewissermaßen wie DRM: Wer legitim zugreift, bekommt echte Daten, wer stiehlt, bekommt vergiftete Daten
Manche sehen AI selbst als Bedrohung für die Menschheit und wollen ihr daher absichtlich schaden
Im Moment gibt es diesen Druck wegen des Investorengelds aber kaum
Die Antworten eines „Poison-Servers“ einfach unverändert zu proxien, ist riskant
Man könnte dadurch unbemerkt illegale Inhalte hosten
Der Versuch, „AI-Modelle zu vergiften“, führt am Ende nur dazu, dass die Datenbereinigungs-Pipelines der AI-Labore stärker werden
Sie werden solche Daten nutzen, um bessere Filtersysteme zu bauen
Ich stimme der Behauptung nicht zu, dass „maschinelle Intelligenz eine Bedrohung für die Menschheit“ sei
Die heutige AI ist nur eine kreative Nutzung einer Autocomplete-Engine, und die eigentliche Bedrohung ist wirtschaftliches Verhalten von Menschen
Letztlich ist die Menschheit eine Bedrohung für sich selbst
Das erinnert an Neal Stephensons Anathem
Darin verbreiten Unternehmen absichtlich Müll-Daten im Internet, um anschließend ihre eigenen Filterwerkzeuge zu verkaufen
Die heutige Diskussion über AI-Data-Poisoning fühlt sich davon gar nicht so weit entfernt an
Wenn Menschen Geoffrey Hinton zitieren, greifen sie oft nur die Teile heraus, die ihnen nützen
Er sieht AI als existentielle Bedrohung, aber bei der dafür zentralen Voraussetzung — dem „Grad des Bewusstseins von AI“ —
stimmen ausgerechnet die meisten Leute, die ihn zitieren, ihm gar nicht zu