2 Punkte von GN⁺ 2025-06-05 | 1 Kommentare | Auf WhatsApp teilen
  • Aufgrund eines Gerichtsbeschlusses muss OpenAI alle ChatGPT-Nutzerprotokolle aufbewahren, einschließlich gelöschter Unterhaltungen; OpenAI entgegnet, dass dies eine schwerwiegende Verletzung der Privatsphäre darstelle
  • OpenAI argumentiert, die Anordnung sei im Zuge eines Urheberrechtsverfahrens auf Drängen von Nachrichtenverlagen ohne ausreichende Grundlage sofort erlassen worden, um die Sicherung von Beweisen zu erzwingen
  • OpenAI warnt, dass dadurch personenbezogene Daten von Hunderten Millionen Nutzern sowie vertrauliche Unternehmensdaten gespeichert werden müssten, was das Risiko von Verstößen gegen globale Datenschutzvorschriften und zusätzlichen Engineering-Aufwand erhöhe
  • Seit Inkrafttreten der Anordnung werden auch von Nutzern gelöschte Unterhaltungen und temporäre Chats zwangsweise dauerhaft gespeichert, was in sozialen Netzwerken starke Unruhe und Besorgnis ausgelöst hat
  • OpenAI fordert zum Schutz der Datenkontrolle der Nutzer und der Privatsphäre erneut die Aufhebung der Anordnung und kündigt an, den juristischen Kampf fortzusetzen

OpenAIs Widerstand gegen die Anordnung zur Speicherung „zutiefst persönlicher“ Daten

Hintergrund des Gerichtsbeschlusses und zentrale Streitpunkte

  • OpenAI protestiert vor Gericht zum Schutz der Privatsphäre von Millionen von ChatGPT-Nutzern und wehrt sich entschieden gegen die Anordnung, alle Nutzerprotokolle zu speichern, einschließlich gelöschter Chats und API-Unterhaltungen
  • Die Anordnung wurde im Verlauf eines Urheberrechtsverletzungsverfahrens erlassen, nachdem die klagenden Nachrichtenverlage behauptet hatten, OpenAI vernichte Beweismittel; OpenAI kritisiert, die Entscheidung sei übereilt und ohne hinreichende Tatsachenprüfung oder Anhörung gefallen
  • Die Klägerseite argumentierte, dass Nutzer bei einem Umgehen von Paywalls bezahlter Nachrichtenartikel mit ChatGPT ihre Unterhaltungen löschen würden, um Spuren zu beseitigen; tatsächlich seien jedoch keine Beweise vorgelegt worden, die diese Behauptung stützten
  • Auf Grundlage dieser Annahmen ordnete das Gericht an, dass OpenAI künftig sämtliche Gesprächsprotokolle gesondert aufbewahren müsse, auch gelöschte; OpenAI warnt, dass dies die Datenhoheit der Nutzer verletze und das Risiko von Verstößen gegen globale Datenschutzgesetze erhöhe

OpenAIs Position und juristische Gegenwehr

  • OpenAI betont, die in diesem Umfang außergewöhnliche Aufbewahrungsanordnung verletze die Privatsphärerechte der Nutzer, die selbst entscheiden können sollten, wann und wie ihre Daten gespeichert werden
  • Bis zum Erlass der Anordnung galt bei OpenAI, dass Unterhaltungen, die Nutzer selbst löschten oder über die Funktion für temporäre Chats führten, innerhalb von 30 Tagen vollständig aus dem System gelöscht wurden
  • Durch die jetzige Anordnung müsse OpenAI jedoch selbst alle Löschanfragen und temporären Chats zwangsweise speichern, sodass personenbezogene Daten von Hunderten Millionen Nutzern und Unternehmensdaten aus APIs, darunter vertrauliche Informationen, langfristig aufbewahrt würden
  • OpenAI weist neben den Datenschutzbedenken auch darauf hin, dass die Umsetzung der Anordnung Engineering-Ressourcen und enorme Kosten verursache, und argumentiert, dass der Schaden für OpenAI und seine Nutzer deutlich größer sei als der spekulative Nutzen für die Nachrichtenverlage
  • OpenAI hat eine mündliche Anhörung beantragt und fordert die Aufhebung der Anordnung mit sofortiger Wirkung

Reaktionen von Nutzern und Branche

  • Nachdem das Bekanntwerden der Maßnahme publik wurde, äußerten zahlreiche Nutzer und Unternehmenskunden in sozialen Medien wie LinkedIn und X ihre Besorgnis
  • Einige Fachleute warnten, die Anordnung könne einen schwerwiegenden Vertragsbruch gegenüber sämtlichen Unternehmenskunden von OpenAI darstellen; Unternehmen, die über die API mit vertraulichen Daten arbeiten, seien einem noch größeren Sicherheitsrisiko ausgesetzt
  • In sozialen Netzwerken verbreiteten sich Aussagen wie: „Alle KI-Dienste über OpenAI sind nun einer Bedrohung der Privatsphäre ausgesetzt“ oder Empfehlungen, zu alternativen Diensten wie Mistral AI oder Google Gemini zu wechseln
  • Ein Sicherheitsexperte bezeichnete eine solche Anordnung als ein inakzeptables Sicherheitsrisiko
  • Auch Kritik wie „Richterin Wang hält offenbar die Urheberrechtslogik der NYT für wichtiger als die Privatsphäre aller OpenAI-Nutzer — verrückt“ wurde laut

OpenAIs Richtlinien und Ausblick

  • OpenAI hatte sich bislang strikt an seine Richtlinien zur Datenspeicherung von Nutzern gehalten und bei einer Kontolöschung den vollständigen Gesprächsverlauf innerhalb von 30 Tagen entfernt
  • Durch den Gerichtsbeschluss seien die bisherigen Prozesse zur Datenverwaltung und -löschung mit einem Schlag außer Kraft gesetzt worden, sodass Nutzer kaum noch darauf vertrauen könnten, dass ihre Daten tatsächlich sicher gelöscht werden
  • OpenAI will den juristischen Kampf fortsetzen und die Unangemessenheit der Anordnung sowie den tatsächlichen Schaden weiterhin aktiv öffentlich machen

1 Kommentare

 
GN⁺ 2025-06-05
Hacker-News-Kommentare
  • Es wird darauf hingewiesen, dass dasselbe Risiko auch besteht, wenn GPT-Modelle über die API verwendet werden.

    OpenAI erwähnt, dass sich dieses Risiko auf ChatGPT-Free-, Plus- und Pro-Nutzer sowie auf API-Nutzer ausweitet.
    Ich denke, dass diese Situation für OpenAIs Geschäft sehr nachteilig ist.

    • Ich denke, das ist ein Problem, mit dem bald alle AI-Unternehmen konfrontiert sein werden.
      Solange nicht alle zu einer Umgebung übergehen, in der sie Modelle selbst hosten, ist in einem SaaS-ähnlichen Geschäftsmodell der Schutz der Privatsphäre der Nutzer in der Realität kein besonders wichtiger Faktor, wenn man die Rentabilität berücksichtigt.
      Ehrlich gesagt haben sich die meisten Menschen bereits daran gewöhnt, dass es im Internet keine Privatsphäre gibt.
      Unternehmen oder Personen, die proprietären Source Code oder sicherheitsrelevante Daten auf Vertrauensbasis anvertrauen, werden jedoch zwangsläufig stark getroffen.
      Allerdings ist meine Position, dass man solche Dinge von vornherein an keinen Anbieter auslagern sollte.

    • Etablierte Unternehmen müssen wegen dieses Themas bestehende Verträge, Richtlinien und ihre Risikotoleranz neu überprüfen.
      Auch Wrapper-Startups für ChatGPT-basierte Dienste sollten ihre Datenschutzrichtlinien noch einmal prüfen und klar offenlegen, dass die Nutzer auf Privatsphäre verzichten.

    • Alle GPT-Integrationen, die ich eingeführt habe, liefen über Azure-Dienste, weil vertraglich zugesichert war, dass nicht mit meinen Daten trainiert wird.
      Soweit ich es verstehe, gilt dieses Urteil für Azure-Dienste, also für Microsoft, nicht.

    • Wenn du mit proprietärem Code gearbeitet hast, hättest du Cloud-LLMs von Anfang an nicht verwenden dürfen, und dieses Thema macht das nur noch deutlicher.

    • Auf die Frage, wie das dem Geschäft schadet, wird betont, dass dies eine Maßnahme zur Absicherung gegen rechtliche Risiken ist, bei der Daten aufbewahrt werden, und nicht etwas, das für Trainingszwecke genutzt werden soll.
      Ich denke, man kann auch in Verträgen mit anderen Unternehmen ausdrücklich festhalten, dass Daten nicht zum Training verwendet werden.

  • Einen ausführlicheren Hintergrundartikel gibt es hier.

    • Dieser Link ist die eigentliche Quelle.
      Es wäre wohl besser, den Link auf diesen Artikel zu aktualisieren.

    • Die Kommentare unter dem Artikel haben eine wirklich komische Stimmung, deshalb stelle ich sie vor.
      Es wirkt wie eine satirische Darstellung von Urheberrechtsbefürwortern als Anti-AI-Lager.
      Persönlich mag ich OpenAIs arrogante Haltung gegenüber den Inhalten anderer nicht besonders, aber gleichzeitig fällt es mir schwer, überzogene Forderungen von Rechteinhabern nachzuvollziehen.
      Ich denke, generative AI und das Training damit legen die anachronistischen Elemente des heutigen Immaterialgüterrechts schonungslos offen.
      Veränderungen sind künftig nötig, aber sie dürfen nicht nur großen Unternehmen oder Reichen nützen, sondern sollten gewöhnlichen Menschen helfen.

    • Ich bin bei Urheberrechtsverletzungen durch LLMs überwiegend kritisch eingestellt, aber die Art, wie die Begründung dieses Urteils aufgebaut ist, wirkt etwas seltsam.
      Es wird darauf hingewiesen, dass der Richter hypothetisch davon ausgeht, ein Nutzer könnte über ChatGPT eine Paywall umgehen und Inhalte der New York Times herausziehen und anschließend, nachdem er von dem Fall erfahren hat, verlangen, dass alle seine ausgegebenen Protokolle gelöscht werden — und dass dies nicht den Zweck des Urteils unterlaufen würde.
      Wenn man hört, dass ein solches Urteil ergangen ist, würden Nutzer in diesem Zeitraum nicht eher vorsichtiger werden? Diese Frage drängt sich auf.

    • Es wird kritisiert, dass OpenAI nun selbst dann Logs behalten muss, wenn Nutzer ihren Chatverlauf löschen oder die Funktion Temporary Chat für temporäre Gespräche verwenden, und dass sich das kaum noch von einem normalen Browserverlauf unterscheidet.
      Warum nur OpenAI dazu besonders gezwungen wird, etwa so, als müsste Safari auch vom Nutzer gelöschte Verläufe zwingend speichern, erscheint fragwürdig.

  • Im Thread wird ein besserer Artikellink genannt.
    Es ist der Link zum Originalartikel von Ars Technica.
    Es wird ergänzt, dass man statt eines bloßen Mastodon-Posts lieber einen Artikel mit tatsächlichen Informationen heranziehen sollte.

  • In letzter Zeit erscheinen auf Hacker News mehrere persönliche Kolumnen über Vor- und Nachteile von LLMs, aber das Thema Privatsphäre wird dabei oft gar nicht erwähnt.
    Der Hauptgrund, warum ich keine LLMs nutze oder Source Code in ein Prompt-Fenster einfüge, ist die Privatsphäre.
    In unserem Unternehmen würde Code, der wegen staatlicher Vorgaben wie NDA und ITAR den Server verlässt, sofort einen Regelverstoß darstellen.
    Dieses Thema zeigt, dass Privatsphäre die Achillesferse von LLMs ist.
    Bevor sich LLMs On-Premises etablieren, wird man diesem Problem nicht entkommen.

    • Es gibt auch die Möglichkeit, ein LLM direkt auf dem eigenen Server zu hosten; für solche Bedenken ist vollständige Selbstverwaltung die richtige Antwort.
      Man kann sehr leicht und einfach selbst ein LLM aufbauen.
  • Dass OpenAI Daten zwangsläufig auf Servern speichern muss, führt dazu, dass die Rechtsabteilungen der klagenden Unternehmen im Rahmen des Discovery-Verfahrens Zugriff auf Gesprächsverläufe zwischen Nutzern und ChatGPT bekommen könnten.
    So könnten etwa Anwälte der NYT vor Gericht private Gespräche der Betroffenen als Belegmaterial vorlesen.

    • Eine mögliche Lösung wäre, Gesprächslogs anonymisiert zu speichern.
      OpenAI könnte technisch eine Anonymisierung umsetzen, und das scheint hier die beste Lösung zu sein.

    • Solche Daten könnten in tief archivierenden Systemen gesichert werden, etwa in bandbasierten Storage-Lösungen wie der Spectra TFinity ExaScale Library oder in AWS Glacier.
      In einer Struktur, bei der die Wiederherstellung von Daten mehrere Stunden bis Tage dauert, könnte man gerichtliche Anordnungen einhalten und zugleich die Kosten niedrig halten.
      Auch bei groß angelegten Datenlecks wäre ein Diebstahl nur mit viel Zeit und Aufwand möglich, was Erkennung und Abwehr begünstigt.

    • Man muss nun grundsätzlich davon ausgehen, dass alle Chats/API-Calls mit cloudbasierter AI in den USA rechtlich durchsuchbar sind.
      Wenn dieses Risiko nicht tragbar ist, sollte man einen Wechsel zu lokalen LLMs ernsthaft in Betracht ziehen.

  • Es wird infrage gestellt, wie Medien wie die Times überhaupt das Recht erhalten können, Nutzerdaten einzusehen.
    Am Ende führt ein solches Urteil dazu, dass die Zeitung Einblick in Nutzerdaten bekommt.

  • Diese gerichtliche Anordnung könnte in mehr als einer Jurisdiktion gegen Datenschutzgesetze verstoßen, und es besteht auch die Möglichkeit, dass OpenAI dadurch bestehende Verträge mit Kunden bricht.

    • Bestehende Verträge können auf eine gerichtliche Anordnung keinerlei Einfluss ausüben.
      Die rechtliche Anordnung hat Vorrang.

    • Die Anordnung selbst schafft keinen zusätzlichen Verstoß gegen neue Datenschutzgesetze.
      Der Verstoß bestand bereits darin, die Daten überhaupt zu speichern und an Dritte weiterzugeben.

    • Diese Anordnung gilt tatsächlich rückwirkend ab dem 13. Mai.
      Es wirkt so, als habe OpenAI Nutzer bisher nicht per gesonderter E-Mail oder auf anderem Weg informiert, weil das geschäftlich negative Folgen hätte.
      Dennoch fühlt es sich wie ein klarer Vertrauensbruch gegenüber den Nutzern an.

  • Unternehmen, die über die ChatGPT-API sensible Daten ausgetauscht haben, dürften darauf vertraut haben, dass Eingabe- und Ausgabedaten nicht gespeichert werden.
    Tatsächlich befindet sich OpenAI aber in einer Situation, in der das Unternehmen die Daten einfach behalten kann, wenn es nur die Einstellungen ändert.
    Ich frage mich, ob dazu eine gesonderte Mitteilung verschickt wurde oder ob alle erst durch Medienberichte davon erfahren haben.

  • Der Link zum Originalpost war wegen Verkehrsüberlastung (HN hug of death) nicht erreichbar, aber ich konnte ihn über die Wayback Machine lesen.
    Da es sich um eine persönliche Mastodon-Instanz handelt, ist nachvollziehbar, dass sie bei einem plötzlichen Besucheransturm überlastet wird.