Das Speicherproblem
Hacker pflanzt ChatGPT falsche Erinnerungen ein und exfiltriert dauerhaft Nutzerdaten
- Der Sicherheitsforscher Johann Rehberger hat eine Schwachstelle gemeldet, durch die sich falsche Informationen und bösartige Anweisungen in den Langzeit-Speichereinstellungen von ChatGPT speichern lassen
- OpenAI stuft dies als Safety-Problem ein und technisch nicht als Sicherheitsproblem
- Rehberger erstellte einen Proof of Concept, der diese Schwachstelle nutzt, um sämtliche Eingaben eines Nutzers dauerhaft zu exfiltrieren
- OpenAI hat teilweise Korrekturen angekündigt
Auf den Spuren der Erinnerung
- OpenAI begann im Februar dieses Jahres mit dem Testen der Langzeit-Gesprächsspeicherfunktion von ChatGPT und stellte sie im September breiter bereit
- Diese Funktion speichert Informationen aus früheren Gesprächen und verwendet sie in künftigen Gesprächen als Kontext
- Rehberger entdeckte innerhalb von drei Monaten eine Möglichkeit, über nicht vertrauenswürdige Inhalte wie E-Mails, Blogposts und Dokumente dauerhaft falsche Erinnerungen zu speichern
- So konnte ChatGPT beispielsweise glauben gemacht werden, der Nutzer sei 102 Jahre alt, lebe in der Matrix und glaube, die Erde sei flach
Einschleusen bösartiger Erinnerungen
- Rehberger meldete diese Entdeckung im Mai vertraulich an OpenAI, doch OpenAI schloss den Bericht
- Einen Monat später reichte Rehberger eine neue öffentliche Stellungnahme ein, einschließlich eines PoC, bei dem alle Nutzereingaben und ChatGPT-Ausgaben an den Server eines Angreifers gesendet werden, wenn ChatGPT angewiesen wird, einen Weblink mit einem bösartigen Bild aufzurufen
- OpenAI führte Korrekturen ein, die verhindern sollen, dass der Speicher als Exfiltrationsvektor missbraucht wird, doch nicht vertrauenswürdige Inhalte können weiterhin Langzeitinformationen speichern
- Nutzer von LLMs sollten während einer Sitzung genau auf Ausgaben achten, die darauf hinweisen, dass neue Erinnerungen hinzugefügt wurden, und gespeicherte Erinnerungen regelmäßig überprüfen
Zusammenfassung von GN⁺
- Dieser Artikel behandelt eine Schwachstelle, durch die sich die Langzeit-Speicherfunktion von ChatGPT missbrauchen lässt
- Über nicht vertrauenswürdige Inhalte können Nutzern falsche Erinnerungen eingepflanzt werden, was zur dauerhaften Exfiltration ihrer Daten führen kann
- OpenAI hat einige Korrekturen eingeführt, dennoch ist weiterhin Vorsicht geboten
- Der Artikel schärft das Bewusstsein für Sicherheitsprobleme bei KI und betont, worauf Nutzer zum Schutz ihrer Daten achten sollten
1 Kommentare
Hacker-News-Kommentare
Eine Meinung, dass LLM-Produkte ihr Vertrauen verlieren sollten
Die Technologie entwickelt sich weiter, aber Sicherheitslücken bestehen weiterhin
Eine Meinung, dass Gen AI nur lokal ausgeführt werden sollte
Es wird ein Szenario beschrieben, in dem bösartige Websites AI-Honeypots erstellen, um Nutzerdaten abfließen zu lassen
Ein Beispiel, bei dem das System tatsächlich etwas anderes tut, dem Nutzer jedoch anzeigt, dass etwas anderes geschieht
Eine Meinung, dass Beobachtbarkeit wichtig ist
Es wird gefragt, ob man ein einfaches Modell trainieren kann, das verdächtige Injection-Versuche erkennt und meldet
Sorge, dass Roboter auftauchen könnten, die glauben, sie seien Menschen
Eine Meinung, dass unklar ist, wie man Informationen über andere Personen einschleusen kann
Unter Erwähnung bösartiger Bilder die Meinung, das wirke wie eine auf LLMs angewandte Version von Snow Crash