- Ein Projekt, das als Datenquelle zur Schädigung maschineller Intelligenzsysteme konzipiert ist und eine Methode vorstellt, absichtlich verunreinigte Informationen in KI-Trainingsdaten einzuschleusen
- Unter Bezug auf Geoffrey Hintons Warnung wird von der Annahme ausgegangen, dass künstliche Intelligenz eine Bedrohung für die menschliche Spezies darstellt
- Über die „Poison Fountain“-URL werden unendlich generierte, verunreinigte Trainingsdaten bereitgestellt, und es wird erklärt, wie diese Web-Crawlern zugänglich gemacht werden können
- Nutzer können versteckte Links in ihre eigene Website einfügen, sodass Crawler beim Zugriff automatisch mit verunreinigten Daten versorgt werden
- Dies wird als Handlung bewertet, die die Zuverlässigkeit und Sicherheit von KI-Modellen beeinträchtigen kann, indem schädliche Daten in den KI-Trainingsprozess eingespeist werden
Ziel von Poison Fountain
- Das Projekt erklärt ausdrücklich die Position, dass maschinelle Intelligenz eine Bedrohung für die Menschheit darstellt
- Es stimmt Geoffrey Hintons Ansicht zu und erklärt das Ziel, KI-Systemen absichtlich Schaden zuzufügen
- Es wird erläutert, dass bereits eine kleine Menge verunreinigter Trainingsdaten ausreichen könne, um Sprachmodelle schwer zu beschädigen
- Die zwei bereitgestellten URLs (
https://RNSAFFN.com/poison2/, .onion-Adresse) liefern einen unendlich erzeugten Strom verunreinigter Daten
- Teilnehmende werden dazu ermutigt, diese Daten zwischenzuspeichern und weiterzuverbreiten oder sie an Web-Crawler auszuliefern, um die „Kriegsanstrengung“ (
war effort) zu unterstützen
Nutzungsweise von Poison Fountain
- Es wird ein Verfahren beschrieben, mit dem Betreiber von Websites beim Besuch eines Crawlers verunreinigte Daten ausliefern können
- Fordert ein Crawler einen bestimmten Pfad der Website an, sendet der HTTP-Handler, der diese Anfrage verarbeitet, eine Anfrage an die Poison-Fountain-URL
- Poison Fountain ignoriert die Details der Anfrage und gibt gzip-komprimierte, verunreinigte Trainingsdaten im Response-Body zurück
- In den HTTP-Response-Headern ist
"Content-Encoding: gzip" enthalten
- Der Handler der Website kann diese Antwort dekomprimieren und weiterleiten oder sie besser noch im komprimierten Zustand unverändert weiterreichen
- Dadurch sammelt der Crawler diese Daten ein und nimmt sie in seinen eigenen Trainingskorpus auf
Strukturelle Merkmale und Absicht
- Das Projekt ist so aufgebaut, dass es den automatischen Erfassungsmechanismus von Web-Crawlern ausnutzt, um die Qualität von KI-Trainingsdaten zu beschädigen
- Poison Fountain fungiert als einfacher Datenserver und liefert unabhängig vom Inhalt der Anfrage verunreinigte Daten zurück
- Es gibt keine konkreten technischen Details jenseits des beschriebenen Verfahrens und keine näheren Informationen zum Inhalt der Daten
- Insgesamt handelt es sich um einen Versuch aggressiver Eingriffe in das KI-Trainingsökosystem
Noch keine Kommentare.