- OpenAI betrachtet den Schutz persönlicher Gesprächsdaten in ChatGPT, das von mehr als 800 Millionen Menschen genutzt wird, als oberste Priorität
- Die New York Times fordert vor Gericht die Herausgabe von 20 Millionen privaten ChatGPT-Gesprächsprotokollen, was als Eingriff in die Privatsphäre der Nutzer kritisiert wird
- OpenAI hat bereits in der Vergangenheit die Forderung nach 1,4 Milliarden Gesprächsprotokollen zurückgewiesen und treibt auch diesmal über rechtliche Verfahren den fortgesetzten Schutz von Nutzerdaten voran
- Das Unternehmen entwickelt verstärkte Sicherheitsfunktionen wie client-side encryption und baut automatisierte Systeme auf, die den Zugriff auf sensible Daten minimieren
- Der Fall gilt als wichtiger Wendepunkt bei der Frage nach Standards zum Schutz personenbezogener Daten im Zeitalter der KI
Die Datenforderung der New York Times und die Position von OpenAI
- Die New York Times verlangt im Rahmen ihrer Klage gegen OpenAI die Vorlage von 20 Millionen ChatGPT-Nutzergesprächen
- Zur Begründung heißt es, man wolle prüfen, ob Nutzer mit ChatGPT die Paywall der New York Times umgangen haben
- OpenAI erklärt, diese Forderung verletze langjährig etablierte Grundsätze zum Schutz der Privatsphäre und Sicherheitspraktiken
- Das Unternehmen beantragte beim Gericht die Zurückweisung dieser Forderung, da sie private Gespräche von Dutzenden Millionen Menschen umfasse, die mit dem Verfahren nichts zu tun haben
Frühere ähnliche Forderungen und Reaktionen
- Die New York Times hatte bereits zuvor versucht, die Löschfunktion für Nutzergespräche einzuschränken, doch OpenAI verhinderte dies und stellte das Löschrecht wieder her
- Anschließend folgte die Forderung nach Herausgabe von 1,4 Milliarden Gesprächsprotokollen, die OpenAI ablehnte
- OpenAI betont ausdrücklich: Persönliche Gespräche der Nutzer gehören den Nutzern selbst und dürfen nicht zum Kollateralschaden eines Streits über den Zugang zu Online-Inhalten werden
Maßnahmen von OpenAI zur Stärkung von Sicherheit und Privatsphäre
- OpenAI gehört nach eigenen Angaben zu den am stärksten angegriffenen Organisationen der Welt und investiert massiv in den Schutz von Daten vor organisierter Kriminalität und staatlich unterstützten Hacking-Versuchen
- Die künftige Roadmap umfasst client-side encryption, wodurch selbst OpenAI keinen Zugriff mehr auf Nutzernachrichten haben soll
- Zudem wird ein automatisiertes Sicherheitserkennungssystem aufgebaut, das nur schwere Missbrauchsfälle wie Lebensgefahr, Schädigung Dritter oder Cybersicherheitsrisiken in begrenztem Umfang an menschliche Prüfteams weiterleitet
Details zur Datenforderung (FAQ-Zusammenfassung)
- Umfang der angeforderten Daten: 20 Millionen zufällig ausgewählte ChatGPT-Gespräche von Endnutzern aus dem Zeitraum Dezember 2022 bis November 2024
- Nicht betroffen: ChatGPT Enterprise, ChatGPT Edu, ChatGPT Business (ehemals Team) und API-Kunden
- Datenschutzmaßnahmen: Alle Gespräche durchlaufen Verfahren zur Entfernung von personenbezogenen Informationen (PII) sowie sensiblen Angaben wie Passwörtern
- Zugriffsrechte auf die Daten: Nur ein Teil von OpenAIs Rechts- und Sicherheitsteam sowie externe Anwälte und technische Berater der New York Times erhalten Zugriff
- Speicherung: Isolierte Ablage in einem separaten Sicherheitssystem zur Erfüllung rechtlicher Pflichten, ohne allgemeinen Zugriff
Rechtliche und internationale Erwägungen
- OpenAI erklärt, man ergreife die nötigen Maßnahmen zur Einhaltung internationaler Datenschutzvorgaben wie der DSGVO, betont jedoch, dass die Forderung der New York Times nicht den eigenen Datenschutzstandards entspricht
- Das Unternehmen geht weiterhin rechtlich gegen die Forderung vor und will in jeder Phase den Schutz der Privatsphäre der Nutzer an erste Stelle setzen
- OpenAI sagt zu, künftig transparent über Gerichtsentscheidungen und Änderungen bei der Datenverarbeitung zu informieren
Weitere Pläne und langfristige Vision
- OpenAI betont, dass Sicherheits- und Datenschutzstandards steigen müssen, je tiefer KI in das Leben der Menschen integriert wird
- Ziel ist eine Zukunft, in der die persönlichsten KI-Gespräche der Nutzer sicher und vertraulich bleiben
- Kurzfristig will das Unternehmen verstärkte Sicherheitsmaßnahmen und kurzfristige Abhilfemaßnahmen zügig bekanntgeben
- Langfristig arbeitet OpenAI am Aufbau technischer und rechtlicher Schutzmechanismen für eine vertrauenswürdige KI-Umgebung
1 Kommentare
Hacker-News-Kommentare
Als Klägerin ist das natürlich eine zulässige Forderung, aber solche Klagen sind womöglich nicht nur auf Urheberrechtsfragen beschränkt
Die eigentliche Frage ist vielmehr, warum OpenAI überhaupt so viele private Gesprächsdaten sammelt und speichert
Die Forderung der NYT wird nur im Rahmen des Rechtsverfahrens verwendet, vertrauliche Informationen werden geschwärzt eingereicht und nach Abschluss des Verfahrens vernichtet
OpenAI hingegen speichert die Daten für kommerzielle Zwecke auf unbestimmte Zeit
Unklar ist dabei sogar, für welches Geschäftsmodell solche Datenberge überhaupt angehäuft werden. Ich halte das für wahlloses Datensammeln
Relevante Dokumente: Gerichtsbeschluss 1, Gerichtsbeschluss 2
Sie verweisen auf den Ars-Technica-Artikel
Das Problem ist, dass die Daten wegen der gerichtlichen Anordnung erhalten bleiben müssen, selbst wenn Nutzer auf Löschen klicken
Ich denke, Urheberrechtsverletzung ist letztlich die Grundursache. Gut, dass die NYT dagegen kämpft
Zusammenfassung der Urteile
Es sei heuchlerisch, keine Beiträge zur offenen Kultur zu leisten und trotzdem Aufmerksamkeit zu verlangen
Die AGI-Versprechen seien falsch gewesen und hätten die Menschen nur verunsichert
Trotzdem ist es unangenehm, wenn privat geführte Gespräche in die Hände von NYT-Anwälten gelangen
Da die NYT keinen klaren Schaden nachgewiesen habe, wirkt das wie eine Fishing Expedition
Verglichen wird das mit der Forderung nach Verkaufsaufzeichnungen eines Buchladens, der Raubkopien verkauft
Nutzer könnten rechtlich nur schwer Datenschutzrechte geltend machen
Entscheidend sei, ob KI-Training eine Urheberrechtsverletzung darstellt und ob Fair Use greift
Auch OpenAIs unkooperatives Verhalten im Verlauf des Verfahrens wird kritisiert
NYT-Klage als PDF
Wer Urheberrechte ignorieren könne, werde einen Wettbewerbsvorteil haben
Die Leute hätten das nur nicht gelesen
ESPN vs. YouTube, diesmal OpenAI vs. NYT
Ich möchte keine der beiden Seiten besonders unterstützen. Wenn OpenAI aber wirklich keine NYT-Sätze wortwörtlich ausgibt, sollte es keinen Grund geben, sich vor einer Überprüfung zu fürchten
Vorgeschlagen wird eine neutrale Prüfung durch Dritte — eine dritte Partei vergleicht NYT-Artikel und ChatGPT-Logs, ohne dass eine der beiden Seiten die Originale direkt sieht
Am Ende bleibe wohl nur, dass beide Seiten ihre Experten ins Feld schicken und sich vor Gericht ein Glaubwürdigkeitsduell liefern
Trotzdem hoffe ich, dass dieser Fall den Menschen die Gefahren des Oversharings persönlicher Daten vor Augen führt
Tatsächlich besitzt und nutzt OpenAI die Daten gemäß seinen AGB
Auch eine Kommunikation, die die Absichten der NYT verzerrt, ist schwer vertrauenswürdig
Das haben sie sich selbst eingebrockt
Bei OpenAI fehle ein solches Verantwortungsbewusstsein völlig
Warum wird dann jetzt Privatsphäre als Schutzschild vorgeschoben?
Solche Aussagen sind meist ein Zeichen einer defensiven Haltung
Jetzt plötzlich Privatsphäre zu beschwören, ist widersprüchlich
Technisch scheint das möglich, aber vermutlich wird Klartextspeicherung für interne Analysen bevorzugt
Wenn Mitarbeitende darauf zugreifen können, ist das noch unangenehmer, als wenn NYT-Anwälte es sehen
Das unterscheide sich kaum davon, wenn Ermittler auf gerichtliche Anordnung Briefe einsehen