1 Punkte von GN⁺ 2025-11-13 | 1 Kommentare | Auf WhatsApp teilen
  • OpenAI betrachtet den Schutz persönlicher Gesprächsdaten in ChatGPT, das von mehr als 800 Millionen Menschen genutzt wird, als oberste Priorität
  • Die New York Times fordert vor Gericht die Herausgabe von 20 Millionen privaten ChatGPT-Gesprächsprotokollen, was als Eingriff in die Privatsphäre der Nutzer kritisiert wird
  • OpenAI hat bereits in der Vergangenheit die Forderung nach 1,4 Milliarden Gesprächsprotokollen zurückgewiesen und treibt auch diesmal über rechtliche Verfahren den fortgesetzten Schutz von Nutzerdaten voran
  • Das Unternehmen entwickelt verstärkte Sicherheitsfunktionen wie client-side encryption und baut automatisierte Systeme auf, die den Zugriff auf sensible Daten minimieren
  • Der Fall gilt als wichtiger Wendepunkt bei der Frage nach Standards zum Schutz personenbezogener Daten im Zeitalter der KI

Die Datenforderung der New York Times und die Position von OpenAI

  • Die New York Times verlangt im Rahmen ihrer Klage gegen OpenAI die Vorlage von 20 Millionen ChatGPT-Nutzergesprächen
    • Zur Begründung heißt es, man wolle prüfen, ob Nutzer mit ChatGPT die Paywall der New York Times umgangen haben
  • OpenAI erklärt, diese Forderung verletze langjährig etablierte Grundsätze zum Schutz der Privatsphäre und Sicherheitspraktiken
  • Das Unternehmen beantragte beim Gericht die Zurückweisung dieser Forderung, da sie private Gespräche von Dutzenden Millionen Menschen umfasse, die mit dem Verfahren nichts zu tun haben

Frühere ähnliche Forderungen und Reaktionen

  • Die New York Times hatte bereits zuvor versucht, die Löschfunktion für Nutzergespräche einzuschränken, doch OpenAI verhinderte dies und stellte das Löschrecht wieder her
  • Anschließend folgte die Forderung nach Herausgabe von 1,4 Milliarden Gesprächsprotokollen, die OpenAI ablehnte
  • OpenAI betont ausdrücklich: Persönliche Gespräche der Nutzer gehören den Nutzern selbst und dürfen nicht zum Kollateralschaden eines Streits über den Zugang zu Online-Inhalten werden

Maßnahmen von OpenAI zur Stärkung von Sicherheit und Privatsphäre

  • OpenAI gehört nach eigenen Angaben zu den am stärksten angegriffenen Organisationen der Welt und investiert massiv in den Schutz von Daten vor organisierter Kriminalität und staatlich unterstützten Hacking-Versuchen
  • Die künftige Roadmap umfasst client-side encryption, wodurch selbst OpenAI keinen Zugriff mehr auf Nutzernachrichten haben soll
  • Zudem wird ein automatisiertes Sicherheitserkennungssystem aufgebaut, das nur schwere Missbrauchsfälle wie Lebensgefahr, Schädigung Dritter oder Cybersicherheitsrisiken in begrenztem Umfang an menschliche Prüfteams weiterleitet

Details zur Datenforderung (FAQ-Zusammenfassung)

  • Umfang der angeforderten Daten: 20 Millionen zufällig ausgewählte ChatGPT-Gespräche von Endnutzern aus dem Zeitraum Dezember 2022 bis November 2024
  • Nicht betroffen: ChatGPT Enterprise, ChatGPT Edu, ChatGPT Business (ehemals Team) und API-Kunden
  • Datenschutzmaßnahmen: Alle Gespräche durchlaufen Verfahren zur Entfernung von personenbezogenen Informationen (PII) sowie sensiblen Angaben wie Passwörtern
  • Zugriffsrechte auf die Daten: Nur ein Teil von OpenAIs Rechts- und Sicherheitsteam sowie externe Anwälte und technische Berater der New York Times erhalten Zugriff
  • Speicherung: Isolierte Ablage in einem separaten Sicherheitssystem zur Erfüllung rechtlicher Pflichten, ohne allgemeinen Zugriff

Rechtliche und internationale Erwägungen

  • OpenAI erklärt, man ergreife die nötigen Maßnahmen zur Einhaltung internationaler Datenschutzvorgaben wie der DSGVO, betont jedoch, dass die Forderung der New York Times nicht den eigenen Datenschutzstandards entspricht
  • Das Unternehmen geht weiterhin rechtlich gegen die Forderung vor und will in jeder Phase den Schutz der Privatsphäre der Nutzer an erste Stelle setzen
  • OpenAI sagt zu, künftig transparent über Gerichtsentscheidungen und Änderungen bei der Datenverarbeitung zu informieren

Weitere Pläne und langfristige Vision

  • OpenAI betont, dass Sicherheits- und Datenschutzstandards steigen müssen, je tiefer KI in das Leben der Menschen integriert wird
  • Ziel ist eine Zukunft, in der die persönlichsten KI-Gespräche der Nutzer sicher und vertraulich bleiben
  • Kurzfristig will das Unternehmen verstärkte Sicherheitsmaßnahmen und kurzfristige Abhilfemaßnahmen zügig bekanntgeben
  • Langfristig arbeitet OpenAI am Aufbau technischer und rechtlicher Schutzmechanismen für eine vertrauenswürdige KI-Umgebung

1 Kommentare

 
GN⁺ 2025-11-13
Hacker-News-Kommentare
  • Ich habe gelesen, dass die New York Times von OpenAI verlangt hat, 20 Millionen ChatGPT-Gesprächsprotokolle vorzulegen
    Als Klägerin ist das natürlich eine zulässige Forderung, aber solche Klagen sind womöglich nicht nur auf Urheberrechtsfragen beschränkt
    Die eigentliche Frage ist vielmehr, warum OpenAI überhaupt so viele private Gesprächsdaten sammelt und speichert
    Die Forderung der NYT wird nur im Rahmen des Rechtsverfahrens verwendet, vertrauliche Informationen werden geschwärzt eingereicht und nach Abschluss des Verfahrens vernichtet
    OpenAI hingegen speichert die Daten für kommerzielle Zwecke auf unbestimmte Zeit
    Unklar ist dabei sogar, für welches Geschäftsmodell solche Datenberge überhaupt angehäuft werden. Ich halte das für wahlloses Datensammeln
    • Tatsächlich hat das Gericht nicht angeordnet, Daten zu „sammeln“, sondern bereits gespeicherte Daten zu bewahren (preserve)
      Relevante Dokumente: Gerichtsbeschluss 1, Gerichtsbeschluss 2
    • Andere behaupten jedoch, dies sei tatsächlich eine gerichtliche Anordnung, die Datenerfassung erzwingt
      Sie verweisen auf den Ars-Technica-Artikel
    • Warum OpenAI Gespräche speichert, ist klar: weil die ChatGPT-Oberfläche eine Gesprächsverlauf-Funktion bietet
      Das Problem ist, dass die Daten wegen der gerichtlichen Anordnung erhalten bleiben müssen, selbst wenn Nutzer auf Löschen klicken
    • So wie Google Photos Fotos speichert, muss auch ChatGPT Gesprächsverläufe speichern. Das ist eine Kernfunktion des Produkts
    • Wer ChatGPT benutzt hat, weiß, dass im linken Panel der Gesprächsverlauf angezeigt wird
  • Wenn OpenAI die Daten der NYT nicht unbefugt genutzt hätte, wäre es gar nicht so weit gekommen
    Ich denke, Urheberrechtsverletzung ist letztlich die Grundursache. Gut, dass die NYT dagegen kämpft
    • Andere entgegnen jedoch, dass bereits zwei Richter entschieden hätten, KI-Training sei Fair Use
      Zusammenfassung der Urteile
    • Es gibt auch die Ansicht, Daten sollten als öffentliches Gut behandelt werden. Problematisch sei, dass einzelne Unternehmen Eigentumsrechte an Daten beanspruchen
    • Die NYT wird dafür kritisiert, das Internet mit abschottenden Paywalls zu verschmutzen
      Es sei heuchlerisch, keine Beiträge zur offenen Kultur zu leisten und trotzdem Aufmerksamkeit zu verlangen
    • Sam Altman und das OpenAI-Management werden kritisiert, nur FUD (Angst, Unsicherheit und Zweifel) verbreitet zu haben, um Investitionen einzusammeln
      Die AGI-Versprechen seien falsch gewesen und hätten die Menschen nur verunsichert
  • Ich halte OpenAI nicht für die „gute Seite“
    Trotzdem ist es unangenehm, wenn privat geführte Gespräche in die Hände von NYT-Anwälten gelangen
    Da die NYT keinen klaren Schaden nachgewiesen habe, wirkt das wie eine Fishing Expedition
    • Andere erklären jedoch, die NYT habe tatsächlich Belege für Inhaltsdiebstahl vorgelegt, und um das zu überprüfen, brauche man die vollständigen Logs
      Verglichen wird das mit der Forderung nach Verkaufsaufzeichnungen eines Buchladens, der Raubkopien verkauft
      Nutzer könnten rechtlich nur schwer Datenschutzrechte geltend machen
    • Wieder andere weisen darauf hin, dass die NYT gesetzlich festgelegten Schadensersatz (statutorily defined damages) fordert und deshalb kein tatsächlicher Schaden nachgewiesen werden müsse
      Entscheidend sei, ob KI-Training eine Urheberrechtsverletzung darstellt und ob Fair Use greift
      Auch OpenAIs unkooperatives Verhalten im Verlauf des Verfahrens wird kritisiert
    • Der Einwand „Die NYT hat keinen Schaden nachgewiesen“ sei falsch; man solle die eigentliche Klage (complaint) lesen
      NYT-Klage als PDF
    • Manche meinen, dieser Streit werde am Ende China und Open-Source-Modellen in die Hände spielen
      Wer Urheberrechte ignorieren könne, werde einen Wettbewerbsvorteil haben
    • Tatsächlich steht in den meisten Nutzungsbedingungen, dass bei gerichtlicher Anordnung Logs herausgegeben werden können
      Die Leute hätten das nur nicht gelesen
  • Es scheint inzwischen Mode zu sein, dass Unternehmen mit offenen Briefen Stimmung in der Öffentlichkeit machen
    ESPN vs. YouTube, diesmal OpenAI vs. NYT
    Ich möchte keine der beiden Seiten besonders unterstützen. Wenn OpenAI aber wirklich keine NYT-Sätze wortwörtlich ausgibt, sollte es keinen Grund geben, sich vor einer Überprüfung zu fürchten
    Vorgeschlagen wird eine neutrale Prüfung durch Dritte — eine dritte Partei vergleicht NYT-Artikel und ChatGPT-Logs, ohne dass eine der beiden Seiten die Originale direkt sieht
    • Praktisch sei es allerdings unmöglich, eine vollkommen neutrale Institution zu finden
      Am Ende bleibe wohl nur, dass beide Seiten ihre Experten ins Feld schicken und sich vor Gericht ein Glaubwürdigkeitsduell liefern
    • Manche reagieren zynisch und sagen, beide Organisationen stünden unter autoritären Führungen, also solle man sie einfach kämpfen lassen
  • OpenAI habe zwar als Non-Profit angefangen, betreibe inzwischen aber eine völlig entgleiste PR-Kampagne (Spin)
  • So wie bei Google, wenn es über Privatsphäre spricht, wirkt auch OpenAIs Argumentation überhaupt nicht aufrichtig
    Trotzdem hoffe ich, dass dieser Fall den Menschen die Gefahren des Oversharings persönlicher Daten vor Augen führt
    • Der Slogan „Deine Daten gehören dir“ wirke wie Propaganda
      Tatsächlich besitzt und nutzt OpenAI die Daten gemäß seinen AGB
      Auch eine Kommunikation, die die Absichten der NYT verzerrt, ist schwer vertrauenswürdig
    • Diese Situation ist die Folge davon, dass OpenAI wahllos Daten aus der ganzen Welt zusammengekratzt hat
      Das haben sie sich selbst eingebrockt
    • Ironischerweise hat Google früher das Problem mit Standortverlauf (Local Timeline) erkannt und auf lokale Speicherung umgestellt
      Bei OpenAI fehle ein solches Verantwortungsbewusstsein völlig
    • Manche sagen sogar, es wäre für die Welt besser, wenn OpenAI bankrottginge
  • Ich verstehe nicht, warum OpenAI vor Gericht behauptet: „Uns interessieren die Nutzerdaten nicht“
    Warum wird dann jetzt Privatsphäre als Schutzschild vorgeschoben?
  • In dem Moment, in dem gesagt wird: „Diese Klage ist unbegründet“, sinkt mein Vertrauen
    Solche Aussagen sind meist ein Zeichen einer defensiven Haltung
  • Ironischerweise ist OpenAI von Anfang an ein Unternehmen gewesen, das personenbezogene Daten abgesaugt hat, um Modelle zu trainieren
    Jetzt plötzlich Privatsphäre zu beschwören, ist widersprüchlich
  • Ich frage mich, warum OpenAI beim Speichern von Gesprächen keine Verschlüsselung (encryption) einsetzt
    Technisch scheint das möglich, aber vermutlich wird Klartextspeicherung für interne Analysen bevorzugt
    Wenn Mitarbeitende darauf zugreifen können, ist das noch unangenehmer, als wenn NYT-Anwälte es sehen
    Das unterscheide sich kaum davon, wenn Ermittler auf gerichtliche Anordnung Briefe einsehen
    • Tatsächlich werde vermutlich nicht bei jeder Anfrage das gesamte Gespräch erneut in das Modell eingespeist, sondern effizient mit einem K-V-Cache-System weitergeführt
    • Außerdem würde selbst Verschlüsselung nicht helfen, wenn OpenAI den Schlüssel kontrolliert, denn dann entkommt man einer gerichtlichen Anordnung trotzdem nicht