OpenAIs Gegenwehr gegen den Eingriff der New York Times in die Privatsphäre der Nutzer

(openai.com)

1 Punkte von GN⁺ 2025-11-13 | 1 Kommentare | Auf WhatsApp teilen

OpenAI betrachtet den Schutz persönlicher Gesprächsdaten in ChatGPT, das von mehr als 800 Millionen Menschen genutzt wird, als oberste Priorität
Die New York Times fordert vor Gericht die Herausgabe von 20 Millionen privaten ChatGPT-Gesprächsprotokollen, was als Eingriff in die Privatsphäre der Nutzer kritisiert wird
OpenAI hat bereits in der Vergangenheit die Forderung nach 1,4 Milliarden Gesprächsprotokollen zurückgewiesen und treibt auch diesmal über rechtliche Verfahren den fortgesetzten Schutz von Nutzerdaten voran
Das Unternehmen entwickelt verstärkte Sicherheitsfunktionen wie client-side encryption und baut automatisierte Systeme auf, die den Zugriff auf sensible Daten minimieren
Der Fall gilt als wichtiger Wendepunkt bei der Frage nach Standards zum Schutz personenbezogener Daten im Zeitalter der KI

Die Datenforderung der New York Times und die Position von OpenAI

Die New York Times verlangt im Rahmen ihrer Klage gegen OpenAI die Vorlage von 20 Millionen ChatGPT-Nutzergesprächen
- Zur Begründung heißt es, man wolle prüfen, ob Nutzer mit ChatGPT die Paywall der New York Times umgangen haben
OpenAI erklärt, diese Forderung verletze langjährig etablierte Grundsätze zum Schutz der Privatsphäre und Sicherheitspraktiken
Das Unternehmen beantragte beim Gericht die Zurückweisung dieser Forderung, da sie private Gespräche von Dutzenden Millionen Menschen umfasse, die mit dem Verfahren nichts zu tun haben

Frühere ähnliche Forderungen und Reaktionen

Die New York Times hatte bereits zuvor versucht, die Löschfunktion für Nutzergespräche einzuschränken, doch OpenAI verhinderte dies und stellte das Löschrecht wieder her
Anschließend folgte die Forderung nach Herausgabe von 1,4 Milliarden Gesprächsprotokollen, die OpenAI ablehnte
OpenAI betont ausdrücklich: Persönliche Gespräche der Nutzer gehören den Nutzern selbst und dürfen nicht zum Kollateralschaden eines Streits über den Zugang zu Online-Inhalten werden

Maßnahmen von OpenAI zur Stärkung von Sicherheit und Privatsphäre

OpenAI gehört nach eigenen Angaben zu den am stärksten angegriffenen Organisationen der Welt und investiert massiv in den Schutz von Daten vor organisierter Kriminalität und staatlich unterstützten Hacking-Versuchen
Die künftige Roadmap umfasst client-side encryption, wodurch selbst OpenAI keinen Zugriff mehr auf Nutzernachrichten haben soll
Zudem wird ein automatisiertes Sicherheitserkennungssystem aufgebaut, das nur schwere Missbrauchsfälle wie Lebensgefahr, Schädigung Dritter oder Cybersicherheitsrisiken in begrenztem Umfang an menschliche Prüfteams weiterleitet

Details zur Datenforderung (FAQ-Zusammenfassung)

Umfang der angeforderten Daten: 20 Millionen zufällig ausgewählte ChatGPT-Gespräche von Endnutzern aus dem Zeitraum Dezember 2022 bis November 2024
Nicht betroffen: ChatGPT Enterprise, ChatGPT Edu, ChatGPT Business (ehemals Team) und API-Kunden
Datenschutzmaßnahmen: Alle Gespräche durchlaufen Verfahren zur Entfernung von personenbezogenen Informationen (PII) sowie sensiblen Angaben wie Passwörtern
Zugriffsrechte auf die Daten: Nur ein Teil von OpenAIs Rechts- und Sicherheitsteam sowie externe Anwälte und technische Berater der New York Times erhalten Zugriff
Speicherung: Isolierte Ablage in einem separaten Sicherheitssystem zur Erfüllung rechtlicher Pflichten, ohne allgemeinen Zugriff

Rechtliche und internationale Erwägungen

OpenAI erklärt, man ergreife die nötigen Maßnahmen zur Einhaltung internationaler Datenschutzvorgaben wie der DSGVO, betont jedoch, dass die Forderung der New York Times nicht den eigenen Datenschutzstandards entspricht
Das Unternehmen geht weiterhin rechtlich gegen die Forderung vor und will in jeder Phase den Schutz der Privatsphäre der Nutzer an erste Stelle setzen
OpenAI sagt zu, künftig transparent über Gerichtsentscheidungen und Änderungen bei der Datenverarbeitung zu informieren

Weitere Pläne und langfristige Vision

OpenAI betont, dass Sicherheits- und Datenschutzstandards steigen müssen, je tiefer KI in das Leben der Menschen integriert wird
Ziel ist eine Zukunft, in der die persönlichsten KI-Gespräche der Nutzer sicher und vertraulich bleiben
Kurzfristig will das Unternehmen verstärkte Sicherheitsmaßnahmen und kurzfristige Abhilfemaßnahmen zügig bekanntgeben
Langfristig arbeitet OpenAI am Aufbau technischer und rechtlicher Schutzmechanismen für eine vertrauenswürdige KI-Umgebung

1 Kommentare

GN⁺ 2025-11-13

Hacker-News-Kommentare

Ich habe gelesen, dass die New York Times von OpenAI verlangt hat, 20 Millionen ChatGPT-Gesprächsprotokolle vorzulegen
Als Klägerin ist das natürlich eine zulässige Forderung, aber solche Klagen sind womöglich nicht nur auf Urheberrechtsfragen beschränkt
Die eigentliche Frage ist vielmehr, warum OpenAI überhaupt so viele private Gesprächsdaten sammelt und speichert
Die Forderung der NYT wird nur im Rahmen des Rechtsverfahrens verwendet, vertrauliche Informationen werden geschwärzt eingereicht und nach Abschluss des Verfahrens vernichtet
OpenAI hingegen speichert die Daten für kommerzielle Zwecke auf unbestimmte Zeit
Unklar ist dabei sogar, für welches Geschäftsmodell solche Datenberge überhaupt angehäuft werden. Ich halte das für wahlloses Datensammeln
- Tatsächlich hat das Gericht nicht angeordnet, Daten zu „sammeln“, sondern bereits gespeicherte Daten zu bewahren (preserve)
  Relevante Dokumente: Gerichtsbeschluss 1, Gerichtsbeschluss 2
- Andere behaupten jedoch, dies sei tatsächlich eine gerichtliche Anordnung, die Datenerfassung erzwingt
  Sie verweisen auf den Ars-Technica-Artikel
- Warum OpenAI Gespräche speichert, ist klar: weil die ChatGPT-Oberfläche eine Gesprächsverlauf-Funktion bietet
  Das Problem ist, dass die Daten wegen der gerichtlichen Anordnung erhalten bleiben müssen, selbst wenn Nutzer auf Löschen klicken
- So wie Google Photos Fotos speichert, muss auch ChatGPT Gesprächsverläufe speichern. Das ist eine Kernfunktion des Produkts
- Wer ChatGPT benutzt hat, weiß, dass im linken Panel der Gesprächsverlauf angezeigt wird
Wenn OpenAI die Daten der NYT nicht unbefugt genutzt hätte, wäre es gar nicht so weit gekommen
Ich denke, Urheberrechtsverletzung ist letztlich die Grundursache. Gut, dass die NYT dagegen kämpft
- Andere entgegnen jedoch, dass bereits zwei Richter entschieden hätten, KI-Training sei Fair Use
  Zusammenfassung der Urteile
- Es gibt auch die Ansicht, Daten sollten als öffentliches Gut behandelt werden. Problematisch sei, dass einzelne Unternehmen Eigentumsrechte an Daten beanspruchen
- Die NYT wird dafür kritisiert, das Internet mit abschottenden Paywalls zu verschmutzen
  Es sei heuchlerisch, keine Beiträge zur offenen Kultur zu leisten und trotzdem Aufmerksamkeit zu verlangen
- Sam Altman und das OpenAI-Management werden kritisiert, nur FUD (Angst, Unsicherheit und Zweifel) verbreitet zu haben, um Investitionen einzusammeln
  Die AGI-Versprechen seien falsch gewesen und hätten die Menschen nur verunsichert
Ich halte OpenAI nicht für die „gute Seite“
Trotzdem ist es unangenehm, wenn privat geführte Gespräche in die Hände von NYT-Anwälten gelangen
Da die NYT keinen klaren Schaden nachgewiesen habe, wirkt das wie eine Fishing Expedition
- Andere erklären jedoch, die NYT habe tatsächlich Belege für Inhaltsdiebstahl vorgelegt, und um das zu überprüfen, brauche man die vollständigen Logs
  Verglichen wird das mit der Forderung nach Verkaufsaufzeichnungen eines Buchladens, der Raubkopien verkauft
  Nutzer könnten rechtlich nur schwer Datenschutzrechte geltend machen
- Wieder andere weisen darauf hin, dass die NYT gesetzlich festgelegten Schadensersatz (statutorily defined damages) fordert und deshalb kein tatsächlicher Schaden nachgewiesen werden müsse
  Entscheidend sei, ob KI-Training eine Urheberrechtsverletzung darstellt und ob Fair Use greift
  Auch OpenAIs unkooperatives Verhalten im Verlauf des Verfahrens wird kritisiert
- Der Einwand „Die NYT hat keinen Schaden nachgewiesen“ sei falsch; man solle die eigentliche Klage (complaint) lesen
  NYT-Klage als PDF
- Manche meinen, dieser Streit werde am Ende China und Open-Source-Modellen in die Hände spielen
  Wer Urheberrechte ignorieren könne, werde einen Wettbewerbsvorteil haben
- Tatsächlich steht in den meisten Nutzungsbedingungen, dass bei gerichtlicher Anordnung Logs herausgegeben werden können
  Die Leute hätten das nur nicht gelesen
Es scheint inzwischen Mode zu sein, dass Unternehmen mit offenen Briefen Stimmung in der Öffentlichkeit machen
ESPN vs. YouTube, diesmal OpenAI vs. NYT
Ich möchte keine der beiden Seiten besonders unterstützen. Wenn OpenAI aber wirklich keine NYT-Sätze wortwörtlich ausgibt, sollte es keinen Grund geben, sich vor einer Überprüfung zu fürchten
Vorgeschlagen wird eine neutrale Prüfung durch Dritte — eine dritte Partei vergleicht NYT-Artikel und ChatGPT-Logs, ohne dass eine der beiden Seiten die Originale direkt sieht
- Praktisch sei es allerdings unmöglich, eine vollkommen neutrale Institution zu finden
  Am Ende bleibe wohl nur, dass beide Seiten ihre Experten ins Feld schicken und sich vor Gericht ein Glaubwürdigkeitsduell liefern
- Manche reagieren zynisch und sagen, beide Organisationen stünden unter autoritären Führungen, also solle man sie einfach kämpfen lassen
OpenAI habe zwar als Non-Profit angefangen, betreibe inzwischen aber eine völlig entgleiste PR-Kampagne (Spin)
So wie bei Google, wenn es über Privatsphäre spricht, wirkt auch OpenAIs Argumentation überhaupt nicht aufrichtig
Trotzdem hoffe ich, dass dieser Fall den Menschen die Gefahren des Oversharings persönlicher Daten vor Augen führt
- Der Slogan „Deine Daten gehören dir“ wirke wie Propaganda
  Tatsächlich besitzt und nutzt OpenAI die Daten gemäß seinen AGB
  Auch eine Kommunikation, die die Absichten der NYT verzerrt, ist schwer vertrauenswürdig
- Diese Situation ist die Folge davon, dass OpenAI wahllos Daten aus der ganzen Welt zusammengekratzt hat
  Das haben sie sich selbst eingebrockt
- Ironischerweise hat Google früher das Problem mit Standortverlauf (Local Timeline) erkannt und auf lokale Speicherung umgestellt
  Bei OpenAI fehle ein solches Verantwortungsbewusstsein völlig
- Manche sagen sogar, es wäre für die Welt besser, wenn OpenAI bankrottginge
Ich verstehe nicht, warum OpenAI vor Gericht behauptet: „Uns interessieren die Nutzerdaten nicht“
Warum wird dann jetzt Privatsphäre als Schutzschild vorgeschoben?
In dem Moment, in dem gesagt wird: „Diese Klage ist unbegründet“, sinkt mein Vertrauen
Solche Aussagen sind meist ein Zeichen einer defensiven Haltung
Ironischerweise ist OpenAI von Anfang an ein Unternehmen gewesen, das personenbezogene Daten abgesaugt hat, um Modelle zu trainieren
Jetzt plötzlich Privatsphäre zu beschwören, ist widersprüchlich
Ich frage mich, warum OpenAI beim Speichern von Gesprächen keine Verschlüsselung (encryption) einsetzt
Technisch scheint das möglich, aber vermutlich wird Klartextspeicherung für interne Analysen bevorzugt
Wenn Mitarbeitende darauf zugreifen können, ist das noch unangenehmer, als wenn NYT-Anwälte es sehen
Das unterscheide sich kaum davon, wenn Ermittler auf gerichtliche Anordnung Briefe einsehen
- Tatsächlich werde vermutlich nicht bei jeder Anfrage das gesamte Gespräch erneut in das Modell eingespeist, sondern effizient mit einem K-V-Cache-System weitergeführt
- Außerdem würde selbst Verschlüsselung nicht helfen, wenn OpenAI den Schlüssel kontrolliert, denn dann entkommt man einer gerichtlichen Anordnung trotzdem nicht

OpenAIs Gegenwehr gegen den Eingriff der New York Times in die Privatsphäre der Nutzer

Die Datenforderung der New York Times und die Position von OpenAI

Frühere ähnliche Forderungen und Reaktionen

Maßnahmen von OpenAI zur Stärkung von Sicherheit und Privatsphäre

Details zur Datenforderung (FAQ-Zusammenfassung)

Rechtliche und internationale Erwägungen

Weitere Pläne und langfristige Vision

Verwandte Beiträge

1 Kommentare

Hacker-News-Kommentare