1 Punkte von GN⁺ 2025-06-07 | 1 Kommentare | Auf WhatsApp teilen
  • Im Rechtsstreit fordern die Kläger, darunter die New York Times, von OpenAI die unbefristete Speicherung von ChatGPT- und API-Daten der Nutzer
  • OpenAI legt dagegen formell Widerspruch ein und Berufung ein, da diese Forderung im Widerspruch zu den Datenschutzversprechen gegenüber den Nutzern stehe
  • Diese Anordnung zur Aufbewahrung gilt nur für Nutzer von ChatGPT Free, Plus, Pro, Team und der allgemeinen API; Enterprise/Edu- und ZDR-API-Nutzer sind nicht betroffen
  • Selbst gelöschte Daten müssen in einem separaten System zur rechtlichen Aufbewahrung gespeichert werden; der Zugriff ist auf ein streng begrenztes OpenAI-Rechts- und Sicherheitsteam beschränkt
  • OpenAI will den Schutz der Privatsphäre als obersten Wert priorisieren und in allen rechtlichen Verfahren weiter zum Schutz der Nutzer vorgehen

How we’re responding to The New York Times’ data demands in order to protect user privacy

  • Die Kläger, darunter die New York Times, verlangen in ihrem Verfahren gegen OpenAI die unbefristete Speicherung von Daten von Consumer-ChatGPT- und API-Kunden
  • Diese Forderung steht grundsätzlich im Widerspruch zu den Datenschutzgrundsätzen, die OpenAI den Nutzern zugesagt hat, und schwächt Branchenstandards sowie das Datenschutzniveau
  • OpenAI hält diese Forderung für überzogen und verfolgt Berufungsverfahren, bei denen der Schutz der Privatsphäre der Nutzer oberste Priorität hat

Wichtige Fragen und Antworten

1. Warum verlangen die Kläger wie die New York Times dies?

  • Im Zuge ihrer Klage gegen OpenAI hat die New York Times beim Gericht die unbefristete Speicherung sämtlicher Nutzerinhalte verlangt, basierend auf der Vermutung, dass sich daraus für das Verfahren nützliche Beweise finden lassen könnten
  • OpenAI ist der Auffassung, dass diese Forderung die Privatsphäre der Nutzer gefährdet und zugleich für die Lösung des Rechtsstreits keinen wesentlichen praktischen Nutzen hat
  • Nutzer von ChatGPT Free, Plus, Pro, Team und der allgemeinen API sind betroffen; ChatGPT Enterprise, ChatGPT Edu und Kunden der Zero Data Retention API sind davon nicht betroffen

2. Die rechtliche Reaktion von OpenAI

  • OpenAI hat von Beginn an erklärt, dass die Forderung nach Aufbewahrung sämtlicher Ausgabedaten überzogen sei und mit den Datenschutzrichtlinien kollidiere, und hat entsprechend Widerspruch eingelegt
  • Vor dem Magistrate Judge wurde bestätigt, dass ChatGPT Enterprise ausgenommen ist
  • Eine weitere Berufung beim District Court Judge läuft derzeit

3. Geschäftskunden mit Zero Data Retention-Verträgen

  • Geschäftskunden, die die Zero Data Retention API nutzen, sind nicht betroffen, da Ein- und Ausgabedaten nicht gespeichert werden

4. Wenn ChatGPT-Daten gelöscht werden

  • Normale Consumer-Konten können von dem Verfahren betroffen sein, Enterprise- und Edu-Kunden sowie Nutzer der Zero Data Retention API jedoch nicht

5. Art der Datenspeicherung und Zugriffsrechte

  • Daten, die unter die gerichtliche Anordnung fallen, werden getrennt in einem eigenen Sicherheitssystem gespeichert
  • Diese Daten dürfen nicht für andere Zwecke als die Erfüllung rechtlicher Pflichten verwendet werden; der Zugriff ist auf eine kleine Zahl streng berechtigter Mitarbeiter in OpenAIs Rechts- und Sicherheitsteams beschränkt

6. Möglichkeit der Weitergabe an Dritte

  • Gespeicherte Daten werden nicht automatisch an Dritte wie die New York Times weitergegeben
  • Sollte es weitere Auskunfts- oder Offenlegungsforderungen geben, will OpenAI zum Schutz der Privatsphäre aktiv dagegen vorgehen

7. Dauer der Datenspeicherung und Ende der Maßnahme

  • Derzeit wird aufgrund der gerichtlichen Anordnung eine unbefristete Aufbewahrung von Nutzerdaten erzwungen, dagegen läuft jedoch eine aktive rechtliche Gegenwehr
  • Bei erfolgreicher rechtlicher Anfechtung wäre eine Rückkehr zu den bisherigen Aufbewahrungsrichtlinien möglich

8. Verstoß gegen Datenschutzgesetze wie die DSGVO?

  • OpenAI erfüllt zwar die rechtlichen Pflichten aus der gerichtlichen Anordnung, doch die Forderung der New York Times steht im Widerspruch zu OpenAIs Datenschutzstandards
  • Berufungen und politische bzw. richtlinienbezogene Gegenmaßnahmen werden weiterverfolgt

9. Änderungen an den Richtlinien zum Modelltraining?

  • Daten von Geschäftskunden werden standardmäßig nicht für das Modelltraining verwendet; durch diese Anordnung ändert sich daran nichts
  • Consumer-Kunden können über ihre individuellen Einstellungen selbst steuern, ob ihre Daten zum Training genutzt werden; auch hier gibt es durch die Anordnung keine Änderung

10. Information der Nutzer und Transparenz

  • OpenAI verspricht fortlaufende Information und Transparenz
  • Wenn sich die gerichtliche Anordnung ändert oder Auswirkungen auf Nutzerdaten ergeben, will das Unternehmen zeitnah informieren

11. Zusammenfassung der Richtlinien zur Datenspeicherung

  • ChatGPT (Free/Plus/Pro): Wenn eine Unterhaltung oder ein Konto gelöscht wird, werden die Daten sofort aus dem Konto entfernt und innerhalb von 30 Tagen dauerhaft gelöscht
  • ChatGPT Team: Jeder Nutzer kann selbst steuern, ob Unterhaltungen gespeichert werden; gelöschte oder nicht gespeicherte Daten werden innerhalb von 30 Tagen gelöscht (außer bei rechtlichen Pflichten)
  • ChatGPT Enterprise/Edu: Workspace-Administratoren verwalten die Aufbewahrungsdauer; gelöschte Unterhaltungen werden innerhalb von 30 Tagen gelöscht (außer bei rechtlichen Pflichten)
  • API: Geschäftsnutzer können Aufbewahrungsdauer und -methode zur Verwaltung des Anwendungsstatus selbst wählen; API-Ein- und -Ausgabedaten werden nach 30 Tagen aus den Logs gelöscht (außer bei rechtlichen Pflichten)
  • Zero Data Retention API: In diesem Fall werden Ein- und Ausgabedaten von vornherein nicht gespeichert

Fazit

  • OpenAI betrachtet Nutzervertrauen und Datenschutz als oberste Priorität seiner Richtlinien und reagiert fortlaufend auf rechtliche Herausforderungen
  • Bestimmte Kundengruppen wie Business- und Bildungsangebote sowie die ZDR API sind nicht betroffen; für allgemeine Consumer-Daten gelten gesonderte Schutzmaßnahmen
  • Über Änderungen der rechtlichen Lage und Maßnahmen zum Schutz von Nutzerdaten will OpenAI transparent informieren

1 Kommentare

 
GN⁺ 2025-06-07
Hacker-News-Kommentare
  • Es wäre wirklich eine große Hilfe, wenn OpenAI offiziell die Beantragung der Zero Data Retention (ZDR)-Option ermöglichen würde. In vielen Unternehmenskontexten gibt es überhaupt keinen Grund, Request-Logs selbst zu speichern. In der Dokumentation steht mehrfach, dass man sie beantragen kann, in der Praxis wird man aber einfach ignoriert. Ich verstehe, dass eine Genehmigung nötig ist und es eine Zugangshürde gibt, aber in Wirklichkeit scheint OpenAI ZDR nur zu Marketingzwecken zu erwähnen. Ich habe es mehrfach beantragt und nie irgendeine Antwort erhalten. Wenn man sich Forenbeiträge ansieht, scheint das sehr häufig vorzukommen.
    • Ich verstehe, dass ein Freigabeprozess nötig sein kann, aber ich frage mich, warum der Standard nicht Datenschutz oder Nicht-Speicherung ist. Viele Nutzer misstrauen OpenAIs Datenschutzversprechen. Sie denken, Eingaben würden gespeichert, analysiert und weitergegeben. Wenn echter Datenschutz nötig ist, sind lokal laufende LLMs die einzige echte Alternative.
    • Soweit ich weiß, werden Logs standardmäßig 30 Tage lang zur Fehlerbehebung aufbewahrt. Man kann auch eine Aufbewahrung von 0 Tagen beantragen. Das steht in der offiziellen Dokumentation.
    • Im Kern fehlt dabei Geld.
    • Es gibt die Richtlinie OpenAI Privacy Policy mit der Aussage: "Für bestimmte Anwendungsfälle kann auch Zero Data Retention (ZDR) beantragt werden. Weitere Details zur Datenverarbeitung finden Sie auf der Seite Platform Docs." 1) Eine Beantragung ist möglich, garantiert aber keine Genehmigung. 2) Der Standardwert ist wichtig. Die Silicon-Valley-Standardeinstellung ist nicht Datenschutz, sondern Gewinnmaximierung. Auch bei OpenAI ist die Voreinstellung Datenspeicherung, einschließlich der Ausgabe. Das macht es schwer, das OpenAI-Memo gegen die Anordnung zur Datenspeicherung ernst zu nehmen.
    • Es steht zwar immer wieder offiziell da, dass man es beantragen könne, aber ich vermute, dass es in Wirklichkeit nur Marketingtext ist, der überhaupt nicht funktioniert.
  • Durch Gerichtsbeschluss geschützte Daten werden in einem isolierten System gespeichert und sind außer zur Erfüllung rechtlicher Pflichten nicht zugänglich. Nur eine kleine Zahl geprüfter OpenAI-Mitarbeiter aus Rechts- und Sicherheitsteams kann im Rahmen rechtlicher Verpflichtungen darauf zugreifen. Falls Daten abfließen, trägt OpenAI die Verantwortung. Aber die Sprache im gesamten Beitrag, insbesondere das wiederholte Behaupten, die Klage sei „unbegründet“, mindert die Glaubwürdigkeit und lässt ihn wie einen werblichen Text wirken.
    • Dieser Fall ist in den Nachrichtenzyklus geraten, weil es zum Thema wurde, dass gelöschte Chats wegen des Rechtsstreits tatsächlich nicht gelöscht werden. OpenAI musste also reagieren, um Kunden zu beruhigen.
    • Wenn im Zuge der Suche festgestellt wird, dass prozessrelevante Daten mit dem Fall zusammenhängen, dann können mindestens beide Parteien und das Gericht auf diese Daten zugreifen.
    • Aus OpenAIs Sicht ist es selbstverständlich, die eigene Position zu vertreten. Zu behaupten, es handle sich um eine „unbegründete Klage“, ist erwartbar.
    • Ich bin OpenAI-Nutzer. Es ist nützlich, deshalb bezahle ich auch dafür. Ich möchte nicht, dass meine Daten über das hinaus gespeichert werden, was in den Nutzungsbedingungen und der Datenschutzerklärung angegeben ist. Wenn das Gericht nicht versteht, dass OpenAIs Aufbewahrungspflichten die Privatsphäre von zig Millionen Nutzern gefährden, halte ich es für ungeeignet.
    • Das erste Prinzip der Datensicherheit ist, dass Systeme unvollkommen sind und der einzige echte Schutz darin besteht, Daten gar nicht erst zu speichern. Wenn es zu einem Datenleck kommt, trägt OpenAI die Verantwortung. Unternehmen, die Datensicherheit versprechen, sind entweder unfähig oder unaufrichtig.
  • Ich frage mich, ob OpenAIs Rechtsabteilung statt echter Chatverläufe nur unscharfe Informationen wie ssdeep-Hashes oder Content-Defined Chunks speichern könnte. Wenn der von der NYT geforderte Datenumfang begrenzt ist und problematische Inhalte über die API erzeugt werden, könnte ein Vergleich über Hash-Werte möglich sein. Natürlich wäre es ideal, gar nichts zu speichern, aber angesichts einer übermäßig weit gefassten gerichtlichen Anordnung könnte das ein realistischer Kompromiss sein. Zusätzlich kann man sich auch Material zu ssdeep und Content-Defined Chunking ansehen.
    • Es sollte betont werden, wie schwierig es ist, solche technischen Begriffe Anwälten oder Richtern vor Gericht zu erklären.
    • Schon der Versuch, die Intention des Urteils aktiv zu umgehen, ist eine sehr schlechte Entscheidung.
    • Ich konnte die Unterlagen zur gerichtlichen Anordnung nicht finden, aber es wirkt so, als habe der Richter OpenAI gefragt, ob sich Daten unterscheiden ließen, und OpenAI habe überhaupt nicht geantwortet — nicht bloß abgelehnt, sondern ignoriert. Es sieht so aus, als habe OpenAI kein echtes Interesse daran, aktiv nach einer Lösung zu suchen, und nutze stattdessen nur PR.
    • So schick solche technischen Vorschläge auch in einem Whitepaper aussehen mögen: In der Realität werden sämtliche ChatGPT-Konversationen in S3 gespeichert und regelmäßig von allen möglichen Stellen gesichert. Es ist eine Textdatenbank voller sensibler Inhalte, wie E-Mail. Den „Versprechen“ des Managements vertraue ich überhaupt nicht.
  • Früher hätte ich es als extrem peinlich empfunden, wenn mein Browserverlauf geleakt wäre. Heute halte ich es für weit gravierender, wenn LLM-Konversationsprotokolle nach außen dringen. Mehr noch als private Gespräche mit anderen sind das Aufzeichnungen meines unverstellten Selbst in Momenten, in denen ich allein bin.
    • Es gibt auch die Reaktion: Was fragst du denn bitte, dass du bei einem LLM Vertraulichkeit erwartest?
  • Verwandte Diskussion: OpenAI slams court order to save all ChatGPT logs, including deleted chats (Juni 2025, 878 Kommentare)
  • Ich finde die Vorwürfe gegen die NYT seltsam. Wenn die NYT einen Klagegrund hat, wird das Gericht zustimmen; wenn nicht, wird OpenAI vor Gericht gewinnen. Es ist seltsam, die gerichtliche Anordnung als Werkzeug zu benutzen, um die NYT anzugreifen.
    • Die NYT nutzt eine Schwachstelle des US-Rechtssystems aus, nämlich ein weitreichendes Discovery-Verfahren, das sich kaum um Privatsphäre schert. Vermutlich aus Eigeninteresse, aber in diesem Fall kann ich nicht anders, als OpenAI zu unterstützen.
    • Die NYT scheint ihre Position je nach Lage zu wechseln. Früher hat sie Datenbanken mit Freelancer-Artikeln verkauft und für eine Schwächung des Urheberrechts argumentiert. Jetzt stellt sie das Urheberrecht über alles. Zur Einordnung ist dieser Text über den Positionswechsel der NYT interessant.
    • Auch die NYT ist Partei in diesem Fall. Die Klage als „unbegründet“ zu bezeichnen, ist legitim.
    • Wenn die NYT tatsächlich keinen Grund hätte und das Gericht trotzdem zustimmen würde, wäre auch das ein seltsamer Vorgang.
    • Nur weil etwas legal ist, bekommen Menschen, die das Rechtssystem missbrauchen, keinen Freifahrtschein.
  • In OpenAIs Abschnitt „Warum passiert das?“ fehlt ein Teil der Erklärung. Es wird so dargestellt, als würden die Leute grundlos wütend, aber aus Kundensicht ist die Verärgerung durchaus nachvollziehbar.
  • In den „Einstellungen“ wird darauf hingewiesen, dass Nutzer steuern können, ob ihre Daten für das Modelltraining verwendet werden. In Wirklichkeit gibt es jedoch ein Dark Pattern, bei dem der Schalter „Das Modell für alle verbessern“ keinerlei Wirkung hat, und man muss den Antrag direkt über ein nicht sichtbares Portal stellen, sodass er kaum auffindbar ist. Viele Nutzer wurden über die tatsächliche Funktionsweise in die Irre geführt.
    • Es wird um genauere Erläuterung gebeten.
    • Zu der Behauptung, der Schalter „Das Modell für alle verbessern“ habe tatsächlich keinerlei Wirkung, werden eine konkrete Erklärung und der Link zu diesem Portal verlangt.
  • Ich bin immer davon ausgegangen, dass alles, was an eine externe Anbieter-API geschickt wird, dauerhaft gespeichert wird. Das Gegenteil anzunehmen ist eher naiv. Das ist ähnlich naiv wie zu glauben, eine App betreibe kein Web-Tracking.
    • Vom schlimmsten Fall auszugehen ist klug, aber sich dem schlimmsten Fall ohne jeden Widerstand einfach zu fügen, ist töricht.
    • Auch Datenschutz-Nihilismus ist letztlich eine Entscheidung, die man selbst trifft.
  • Ich stimme OpenAIs offizieller Aussage nicht zu, wonach „Vertrauen und Datenschutz Kernwerte sind und Datenverwaltungs-Tools sowie Löschoptionen bereitgestellt werden“. Sie werben damit, gegen Aufpreis Privatsphäre zu bieten, und selbst Pro-Nutzer erhalten diese „Privatsphäre“ nicht. Trotz mehrfacher Löschanträge wird die Entfernung personenbezogener Daten aus Modellen und Trainingsdaten verweigert.
    • Alle Nutzer können sich abmelden. Bei ChatGPT Plus, Pro und Free ist die Datenfreigabe standardmäßig aktiviert, aber jeder kann die Nutzung der Daten für das Training deaktivieren. Nur bei Enterprise ist sie standardmäßig deaktiviert. Referenz: What if I want to keep my history on but disable model training?
    • Das ist nichts weiter als unternehmerisches „Trustwashing“. Es besteht nur aus vagen und mehrdeutigen Begriffen, wohlklingender Rhetorik und hohlen Werten.