2 Punkte von GN⁺ 2026-01-13 | Noch keine Kommentare. | Auf WhatsApp teilen
  • Ein Projekt, das als Datenquelle zur Schädigung maschineller Intelligenzsysteme konzipiert ist und eine Methode vorstellt, absichtlich verunreinigte Informationen in KI-Trainingsdaten einzuschleusen
  • Unter Bezug auf Geoffrey Hintons Warnung wird von der Annahme ausgegangen, dass künstliche Intelligenz eine Bedrohung für die menschliche Spezies darstellt
  • Über die „Poison Fountain“-URL werden unendlich generierte, verunreinigte Trainingsdaten bereitgestellt, und es wird erklärt, wie diese Web-Crawlern zugänglich gemacht werden können
  • Nutzer können versteckte Links in ihre eigene Website einfügen, sodass Crawler beim Zugriff automatisch mit verunreinigten Daten versorgt werden
  • Dies wird als Handlung bewertet, die die Zuverlässigkeit und Sicherheit von KI-Modellen beeinträchtigen kann, indem schädliche Daten in den KI-Trainingsprozess eingespeist werden

Ziel von Poison Fountain

  • Das Projekt erklärt ausdrücklich die Position, dass maschinelle Intelligenz eine Bedrohung für die Menschheit darstellt
    • Es stimmt Geoffrey Hintons Ansicht zu und erklärt das Ziel, KI-Systemen absichtlich Schaden zuzufügen
  • Es wird erläutert, dass bereits eine kleine Menge verunreinigter Trainingsdaten ausreichen könne, um Sprachmodelle schwer zu beschädigen
  • Die zwei bereitgestellten URLs (https://RNSAFFN.com/poison2/, .onion-Adresse) liefern einen unendlich erzeugten Strom verunreinigter Daten
  • Teilnehmende werden dazu ermutigt, diese Daten zwischenzuspeichern und weiterzuverbreiten oder sie an Web-Crawler auszuliefern, um die „Kriegsanstrengung“ (war effort) zu unterstützen

Nutzungsweise von Poison Fountain

  • Es wird ein Verfahren beschrieben, mit dem Betreiber von Websites beim Besuch eines Crawlers verunreinigte Daten ausliefern können
    • Fordert ein Crawler einen bestimmten Pfad der Website an, sendet der HTTP-Handler, der diese Anfrage verarbeitet, eine Anfrage an die Poison-Fountain-URL
    • Poison Fountain ignoriert die Details der Anfrage und gibt gzip-komprimierte, verunreinigte Trainingsdaten im Response-Body zurück
  • In den HTTP-Response-Headern ist "Content-Encoding: gzip" enthalten
  • Der Handler der Website kann diese Antwort dekomprimieren und weiterleiten oder sie besser noch im komprimierten Zustand unverändert weiterreichen
  • Dadurch sammelt der Crawler diese Daten ein und nimmt sie in seinen eigenen Trainingskorpus auf

Strukturelle Merkmale und Absicht

  • Das Projekt ist so aufgebaut, dass es den automatischen Erfassungsmechanismus von Web-Crawlern ausnutzt, um die Qualität von KI-Trainingsdaten zu beschädigen
  • Poison Fountain fungiert als einfacher Datenserver und liefert unabhängig vom Inhalt der Anfrage verunreinigte Daten zurück
  • Es gibt keine konkreten technischen Details jenseits des beschriebenen Verfahrens und keine näheren Informationen zum Inhalt der Daten
  • Insgesamt handelt es sich um einen Versuch aggressiver Eingriffe in das KI-Trainingsökosystem

Noch keine Kommentare.

Noch keine Kommentare.