- Ein US-Gericht hat OpenAI angewiesen, sämtliche ChatGPT-Logs – einschließlich gelöschter Chats – auf unbestimmte Zeit zu speichern. Zwei Nutzer versuchten daraufhin mit dem Verweis auf „Massenüberwachung“ zu intervenieren, wurden jedoch abgewiesen
- Ein Nutzer argumentierte unter Hinweis darauf, dass er sensible persönliche und geschäftliche Informationen eingegeben habe, diese Anordnung komme einem landesweiten Massenüberwachungsprogramm in den USA gleich
- Der Richter stellte klar, dass eine bloße Anordnung zur Beweissicherung kein Überwachungsprogramm ist und die Justiz keine Ermittlungsbehörde ist
- Auch die digitale Bürgerrechtsorganisation EFF äußerte Bedenken hinsichtlich der Risiken für die Privatsphäre der Nutzer und möglicher künftiger Missbräuche
- Nutzer zeigen sich beunruhigt über OpenAIs entschlossene Haltung sowie über eine mögliche künftige Datenoffenlegung oder fehlende Transparenz
Hintergrund und gerichtliche Anordnung
- Kürzlich ordnete ein Gericht gegenüber OpenAI an, alle ChatGPT-Logs, einschließlich gelöschter Chats, auf unbestimmte Zeit aufzubewahren
- Die Maßnahme erfolgte zur Sicherung von Beweismitteln in einem von Nachrichtenmedien angestrengten Urheberrechtsprozess
- Einige Nutzer äußerten Sorge, dass die Anordnung auch gelöschte und anonyme Chats umfasst und ohne Benachrichtigung der Nutzer umgesetzt wird
Interventionsversuch der Nutzer und Datenschutzdebatte
- Ein Nutzer beantragte unter Verweis darauf, dass er sensible persönliche und geschäftliche Informationen eingegeben habe, eine Intervention mit dem Argument, die Anordnung führe zu landesweiter Massenüberwachung in den USA
- Er beanstandete insbesondere, dass gelöschte und anonyme Chats ohne vorherige Mitteilung gespeichert würden, und verlangte Ausnahmen für Chats zu sensiblen Themen wie Medizin, Finanzen und Recht
- Das Gericht machte den Grund für die Zurückweisung deutlich: „Eine Anordnung zur Aufbewahrung von Unterlagen hat nichts mit Überwachung zu tun, und Gerichte sind keine Ermittlungsbehörden“
Sicht der digitalen Bürgerrechtsorganisation
- Corynne McSherry, Rechtsdirektorin der Electronic Frontier Foundation (EFF), äußerte die Sorge, „dass diese Anordnung ein reales Risiko für die Privatsphäre der Nutzer darstellt und sich negativ auf ähnliche Verfahren auswirken könnte“
- Sie wies darauf hin, dass dies künftig einen Präzedenzfall dafür schaffen könnte, dass Strafverfolgungsbehörden oder Prozessparteien von OpenAI die Herausgabe von Nutzerdaten verlangen
- Insbesondere betonte sie, dass AI-Chatbots zu einem neuen Überwachungsvektor werden könnten, wenn die Kontrolle der Nutzer über ihre Daten und Benachrichtigungspflichten unzureichend bleiben
Begründung des Gerichts
- Der Richter befand, „eine Anordnung zur Aufbewahrung von Dokumenten dient der Beweissicherung in einem bestimmten Verfahren“, und kam zu dem Schluss, dass behauptete Eingriffe in verfassungsmäßige Rechte nicht zum eigentlichen Streitgegenstand dieses Verfahrens gehören
- Der Interventionsversuch stehe weder in Zusammenhang mit der Sachverhaltsaufklärung noch mit den Streitfragen des Verfahrens und würde den Prozess lediglich verzögern, weshalb kein entsprechendes Recht anerkannt werde
- Derzeit sei noch kein Fall bekannt, in dem tatsächlich Daten an die Nachrichtenunternehmen übermittelt wurden; sollten Daten künftig weitergegeben werden, sei eine weitere Diskussion möglich
Sorgen der Nutzer und künftige Streitpunkte
- Nutzer befürchten, „OpenAI könnte andere Interessen wie Prozesskosten oder Reputationsmanagement höher gewichten als den Schutz der Privatsphäre“
- Die EFF und andere betonen, dass Anbieter von AI-Chat-Apps bei Löschanfragen Datensätze tatsächlich löschen und transparent über Datenanfragen informieren müssen
- Letztlich werden Transparenz bei der Speicherung und Offenlegung von Nutzerdaten, Benachrichtigungsverfahren und nachträgliche Rechtsschutzmöglichkeiten zu zentralen Themen werden
1 Kommentare
Hacker-News-Kommentare
Wenn man sich die im Artikel zitierten Aussagen des Richters ansieht, wirkt es so, als habe er den Kern des Problems nicht richtig verstanden, und zugleich erscheinen die Gründe für die Entscheidung seltsam
Die Logik lautet: „Wenn wir solche Fragen berücksichtigen, würde das nur zu einer unangemessenen Verzögerung bei der Klärung der eigentlichen Rechtsfragen führen.“
Das wirft die Frage auf, ob verfassungsrechtliche Probleme ignoriert werden dürfen, nur weil es sich um einen urheberrechtlichen Rechtsstreit handelt
Und einen Antrag allein deshalb sofort zurückzuweisen, weil er nicht von einem Anwalt verfasst wurde, halte ich für ein Verhalten, das der Rolle eines Richters nicht gerecht wird
Es scheint übersehen zu werden, dass Ansprüche auch ohne Anwalt geltend gemacht werden können
Wenn man die dem Artikel beigefügte vollständige Entscheidung (hier) liest, wird die Lage klarer
Die Partei, die das Problem aufgeworfen hat, hat einen bestimmten Typ von „Antrag auf Intervention“ eingereicht, für den strenge Voraussetzungen gelten
Diese Voraussetzungen wurden nicht erfüllt
Auch der Punkt, dass der Antrag ohne Anwalt eingereicht wurde, wird in der Entscheidung erwähnt
Eine natürliche Person kann sich selbst vertreten, aber eine juristische Person (ein Unternehmen) muss zwingend durch einen Anwalt vertreten werden
Da die Sache ursprünglich im Namen eines Unternehmens eingereicht wurde, scheint der Richter gesetzeskonform gehandelt zu haben
Ich sehe das ähnlich, und noch besorgniserregender ist, dass es sehr viele ähnliche Dienste gibt, die von solchen Datenschutzproblemen betroffen sein könnten
Wir bräuchten starke Datenschutzgesetze, die derart überzogene gerichtliche Anordnungen verhindern, aber die gibt es noch nicht
Denkbar wären zum Beispiel gerichtliche Anordnungen, bei Dating-Diensten alle Nachrichten zwischen Nutzern zu speichern, bei Telekommunikationsanbietern sämtliche SMS aufzubewahren oder Milliarden von Google Docs zu sichern
Ich frage mich, warum die Regierung noch nicht verlangt hat, Diensten wie Signal eine Backdoor hinzuzufügen und alle Textnachrichten zu speichern
Ich denke, dafür bräuchte es in der Praxis eine sehr starke Begründung
Ich frage mich, ob die US-Regierung eine derart breit angelegte Überwachung in gewöhnlichen kommerziellen Diensten womöglich bereits betreibt
Früher gab es zur Zeit der Edward-Snowden-Enthüllungen auch Berichte über das Abhören von Google-Kommunikation
Richter haben in der Regel einen juristischen Hintergrund oder rechtliche Erfahrung
Auch der betreffende Richter war als Anwalt tätig und hat zudem fast ein Promotionsstudium in Zoologie abgeschlossen, also einen ungewöhnlichen Werdegang
Es ist sehr natürlich, dass gesellschaftlich geschützte Gruppen ungeschützte Gruppen nicht auf Augenhöhe behandeln wollen
Ich sehe in diesem Fall allerdings kaum eine verfassungsrechtliche Frage, und selbst wenn es eine gäbe, wäre dies nicht der Ort, sie zu entscheiden
Die Kritik daran, dass etwas ignoriert werde, nur weil es ohne Anwalt eingereicht wurde, ist zu 100 % ein Missverständnis
Für Pro Se (Selbstvertretung) gibt es klare Regeln
Wenn man im Namen einer anderen juristischen Person klagt, ist zwingend ein Anwalt erforderlich
Es geht also weniger darum, dass „weil es um Urheberrecht geht, verfassungsrechtliche Fragen ignoriert werden dürfen“, sondern darum, dass der Richter offenbar meinte, ein verfassungsrechtliches Problem werde hier voraussichtlich gar nicht entstehen und die Sache würde nur Zeit verschwenden
Zu der Frage „Dürfen verfassungsrechtliche Fragen ignoriert werden, weil es sich um einen Urheberrechtsprozess handelt?“
Mich würde interessieren, welches verfassungsrechtliche Problem hier überhaupt gesehen wird
Auch die Behauptung „das geht auch ohne Anwalt“ ist rechtlich falsch, weil Unternehmen zwingend anwaltlich vertreten sein müssen
Wenn eine Einzelperson selbst auftritt, gibt es etwas Spielraum, aber für Unternehmen gilt das nicht
Wenn die Argumentation schon bei solchen Grundlagen wackelt, fällt es schwer, den übrigen Punkten zu vertrauen
Dieser Fall scheint keinen so großen Nachrichtenwert zu haben
OpenAI wird demnächst ohnehin direkt in einer mündlichen Verhandlung gegen die Anordnung zur Datenspeicherung argumentieren, und die beiden vorbeugenden Anträge gewöhnlicher ChatGPT-Nutzer waren kein Vorgang, der den Ausgang hätte entscheiden können
Es wird eingewandt, dass der Richter offenbar die realen Auswirkungen einer Anordnung zur „Aufbewahrung aller Daten“ auf ein Unternehmen nicht richtig versteht und auch keine Bereitschaft zeigt, das rasch zu überdenken
Schon die Tragweite der ersten Entscheidung an sich habe daher Nachrichtenwert
Ich halte es inzwischen für sehr nachrichtenwürdig, wenn eine allzu offensichtliche Schlussfolgerung gezogen wird
Wir haben auf diese Weise bestätigt, dass Nutzer das Recht haben, sich direkt zu beteiligen
Man kann auch, wie die Kläger, selbst Klage erheben
Wie das am Ende ausgeht, ist eine andere Frage, aber dieses Recht besteht an sich
Da der Richter an dem Thema kein Interesse zu haben scheint, lautet mein Fazit, dass Überzeugungsarbeit sinnlos ist
Ich frage mich, welche Alternativen oder Optionen OpenAI und den Nutzern bleiben
Das ist keine direkte Antwort, aber ich denke, die praktikabelste Alternative wird künftig die Nutzung lokaler LLMs sein
Ich probiere das derzeit selbst aus; beim Kontextspeicher und bei hoher Leistung gibt es noch Grenzen, aber in ein bis zwei Jahren sind wirklich brauchbare lokale LLMs wohl kein unrealistischer Traum mehr
Für mich ist weniger die Privatsphäre als vielmehr die Offline-Nutzbarkeit attraktiv
Nach US-Recht gibt es keine Optionen
Das ist ein typischer Fall der Third-Party-Doktrin
Selbst wenn es die eigenen Daten sind, gilt: Wenn man sie freiwillig einem Dritten (OpenAI) gibt, gehören sie rechtlich nicht mehr einem selbst, und eine berechtigte Privatsphäre-Erwartung besteht dann nicht mehr
Ausnahmen können nur durch eigens neu geschaffene Gesetze anerkannt werden, und für OpenAI gibt es nach geltendem Recht nichts Derartiges
Auch die Entscheidung bewegt sich innerhalb dieses Rahmens des US-Rechts, und die an OpenAI gesendeten Gesprächsdaten genießen derzeit keinen Datenschutz in dem Sinn, dass sie geschützt wären
Es ist wohl besser, die Erwartung von Privatsphäre gegenüber Dritten aufzugeben
Auch Bankdaten können offengelegt werden, wenn eine entsprechende Anordnung vorliegt
Es gibt viele Programmierer, die diese Realität nicht kennen und nur aktuelle Reizthemen missverstehen
Unabhängig davon, wie das Urteil am Ende ausfällt, könnte eine Berufung eine Option sein
Auf die Frage „Welche Optionen haben OpenAI und die Nutzer?“
Eine Möglichkeit wäre, einen Dienst zu wählen, der seine Daten nicht in die USA gibt
Falls jemand glaubt, OpenAI speichere nicht alles, was in Chats oder über die API eingegeben wird, sollte er sich unbedingt ansehen, wer im Board von OpenAI sitzt
Selbst wenn Anbietern von LLMs wie OpenAI rechtlich verboten würde, Daten zu speichern, wäre es schwer, darauf zu vertrauen, dass sie sich in der Praxis auch wirklich daran halten
Ich würde deshalb empfehlen, sensible Daten unbedingt nur direkt in lokale LLMs einzugeben
Ich würde mir wünschen, dass dieses doppelte Negativ bemerkt wird
Die ganze Welt verfügt nun technisch über die Fähigkeit, praktisch jeden Aspekt des Alltags zu überwachen; die Frage ist also, wie wir damit umgehen
In Zukunft könnten aus diesen riesigen Datenmengen neue Felder wie Medizin, Epidemiologie oder groß angelegte Psychologie entstehen (ich nenne das Massive open online psychology, moop), und Regierungen könnten mit Big Data in Echtzeit benachteiligte Bürger besser versorgen
Aber für eine solche Zukunft braucht es unbedingt ein vertrauenswürdiges rechtliches Rahmenwerk, und ich glaube nicht, dass sich das Stück für Stück durch einzelne Gerichtsentscheidungen schaffen lässt
Persönlich finde ich, dass Daten, die ohne das direkte Handeln eines Menschen gar nicht entstehen könnten, grundsätzlich dieser Person gehören sollten und nur dann treuhänderisch verwahrt werden dürften, wenn sie zum Nutzen dieses Menschen verwendet werden
Würde ein hoher Maßstab wie „zum Nutzen des Nutzers/Bürgers“ eingeführt, würde sich auch die Denkweise von Datenunternehmen grundlegend ändern
Mich interessiert, wie andere darüber denken
Noch ist das auf HN und anderswo eher ein Tabu, aber ich denke, Daten müssen nutzerzentriert verschlossen und statt in zentralisierten Silos verteilt gespeichert werden, damit sich Privatsphäre und die Vorteile von Big Data zugleich verfolgen lassen
Der Richter in dieser Sache ist tatsächlich ein Magistrate Judge, dessen Amtszeit in gut einem Jahr endet
Es gab schon früher Fälle, in denen Magistrate Judges nach solchen schwachen Entscheidungen nicht wiederernannt wurden, und ich hoffe, dass das auch diesmal passiert
Link zur Bekanntmachung der Wiederernennung
Ich verstehe nicht, warum der Titel Richter in Anführungszeichen gesetzt werden soll
Ein Magistrate Judge ist selbstverständlich ebenfalls ein Richter
Referenz: Arten von Richtern an US-Bundesgerichten
Ich finde nicht, dass die Amtszeit oder der Ruf eines Magistrate Judge unter der bloßen gewöhnlichen Anwendung der Third-Party-Doktrin leiden sollte
Verweis auf eine frühere Diskussion zum selben Thema OpenAI wehrt sich gegen Gerichtsanordnung, alle ChatGPT-Logs und sogar gelöschte Chats zu speichern
Kein Richter kann ein groß angelegtes Überwachungsprogramm stoppen, das seit mehr als zehn Jahren läuft
Das ist inzwischen eher ein Witz und eine sinnlose Kontroverse
OpenAI sammelt wie andere Unternehmen alle Informationen, die es bekommen kann, und erstellt Profile über uns
Ich finde es seltsam, dass so viele Menschen von dieser Situation schockiert oder wütend sind
Die meisten wissen offenbar nicht oder übersehen, dass auch die Online-Dienste, die sie tatsächlich täglich nutzen, ihre Daten auf genau dieselbe Weise speichern
Praktisch alle wichtigen Dienste außer solchen wie Signal mit E2EE – also Gmail, Telekommunikationsanbieter, Reddit, Xitter und so weiter – speichern Daten und Metadaten
Unabhängig davon, ob man das für richtig oder falsch hält, ist das bei heutigen Online-Diensten schlicht die Realität
Der Grund für die Wut ist, dass sich diese Realität für viele nun wie ein inakzeptables Ausmaß anfühlt
Unabhängig von Nutzungsbedingungen oder Richtlinien muss OpenAI hier sogar Daten zwangsweise aufbewahren, die man im Interesse der Nutzer eigentlich löschen wollte
Mich überrascht eher nicht, dass Menschen dazu aktiv Stellung beziehen
Ich denke, die meisten Menschen wissen das überhaupt nicht
Wenn man nichttechnische Freunde oder irgendeine zufällige Person auf der Straße fragt, stellt man fest, dass viele sich dieser Realität tatsächlich nicht bewusst sind