1 Punkte von GN⁺ 2023-12-29 | 1 Kommentare | Auf WhatsApp teilen

New York Times reicht Urheberrechtsklage gegen OpenAI ein

  • Die New York Times hat eine Klage wegen Urheberrechtsverletzung gegen OpenAI und dessen Partner Microsoft eingereicht.
  • Es werden Belege dafür vorgelegt, dass von OpenAI entwickelte GPT-basierte Systeme Artikel der New York Times reproduzieren können.
  • Nachdem die Verhandlungen nicht zufriedenstellend verliefen, entschied sich die New York Times, OpenAI wegen Lizenzfragen zu verklagen.

Journalismus ist teuer

  • Die New York Times gibt viel Geld aus, unter anderem für wichtigen investigativen Journalismus durch Reporterinnen und Reporter aus verschiedenen Fachbereichen.
  • Die Zeitung erzielt Einnahmen über eine strikte Paywall und beschränkt die Nutzung ihrer Werke durch Urheberrechtsvermerke und Nutzungsbedingungen.
  • In der Klage wird behauptet, dass von OpenAI entwickelte Werkzeuge diese Formen der Monetarisierung beeinträchtigen.

Nicht nur das Training

  • Es wurden mehrere Klagen eingereicht, die sich gegen die Nutzung urheberrechtlich geschützten Materials zum Training von KI-Systemen richten.
  • Die Klage der New York Times zeigt, wie während des Trainings aufgenommene Inhalte bei der Nutzung wieder auftauchen können.
  • Die Klage enthält Beispiele, in denen GPT-4 Artikel der New York Times nahezu wortgleich reproduziert.

Rufschädigung und weitere Schäden

  • In der Klage wird darauf hingewiesen, dass KI-"Halluzinationen" dem Ruf der New York Times schaden und negative Auswirkungen auf die Gesundheit von Menschen haben können.
  • Auch in Artikeln von Wirecutter, das der New York Times gehört, seien urheberrechtlich geschützte Inhalte unbefugt verwendet und Monetarisierungs-Links entfernt worden.
  • Die Klage wirft OpenAI und Microsoft unter anderem Urheberrechtsverletzungen, Verstöße gegen den DMCA und Markenrechtsverletzungen vor.

GN⁺-Meinung:

  • Dieser Artikel zeigt gut, welche Probleme entstehen, wenn die Weiterentwicklung von KI-Technologien mit bestehenden rechtlichen Rahmenwerken wie dem Urheberrecht kollidiert.
  • Das Spannungsverhältnis zwischen Rechteinhabern und KI-Entwicklern könnte wichtige rechtliche und ethische Debatten über die Zukunft der KI auslösen.
  • Dass ein großes Medienhaus wie die New York Times rechtliche Schritte gegen KI-Technologien einleitet, könnte ein wichtiger Präzedenzfall für Regulierung und Leitlinien zur Art und Weise werden, wie KI Inhalte erzeugt und verbreitet.

1 Kommentare

 
GN⁺ 2023-12-29
Hacker-News-Kommentare
  • Frage, ob das Scrapen von Artikeln der New York Times (NYT) zur Erstellung eines Produkts unter Fair Use fällt

    • Es wird die Frage aufgeworfen, ob es unter Fair Use fällt, legal gescrapte NYT-Artikel zur Erstellung eines Produkts zu verwenden, sie zusammenzufassen und umzuschreiben und dann kostenpflichtig anzubieten.
    • Dabei wird auf den Unterschied zu Suchmaschinen hingewiesen: Suchmaschinen ersetzen das Original nicht, sondern liefern Verweise, während ein Zusammenfassungsprodukt anstelle eines NYT-Abos genutzt werden könnte.
  • Einschätzungen zur Urheberrechtsklage der NYT

    • Es wird behauptet, dass LLMs (Large Language Models) der nächsten Generation nur noch mit urheberrechtsfreien, „synthetischen“ Daten trainiert werden und es daher keine Urheberrechtsprobleme mehr geben werde.
    • Es wird die Ansicht vertreten, dass die USA diese technische Entwicklung nicht aufhalten können und andere Länder sonst vorausgehen werden.
    • Zudem wird die Perspektive geäußert, dass das Urheberrecht mit der komplexen Entwicklung von AI-Modellen und der unklaren Herkunft von Daten kaum Schritt halten könne.
  • Bewertung der Vervielfältigung von NYT-Inhalten durch ChatGPT/Bing Copilot

    • Es wird die Auffassung vertreten, dass Fälle, in denen ChatGPT und Bing Copilot NYT-Artikel wortwörtlich kopieren, nicht unter Fair Use fallen.
    • Die Klage behaupte nicht nur bloßes Kopieren, sondern auch, dass das unautorisierte Kopieren von Artikeln zum Training von LLMs eine Urheberrechtsverletzung darstelle.
    • Nach dieser Ansicht sollte der Fokus auf der rechtlichen Frage liegen, ob ein Modell als „transformativ“ gelten kann.
  • Bedenken zu „Fair Use“ in der Klage

    • Es wird Sorge darüber geäußert, dass einige wenige Unternehmen den Wert des Internets monopolisieren könnten.
    • Zudem wird die Hoffnung geäußert, dass Gerichte Regeln für diesen Bereich festlegen.
  • Link zu NYT-Klageunterlagen und Zusammenfassung des Inhalts

    • Es wird ein Link zu einem Dokument geteilt, das klar Fälle zeigt, in denen ChatGPT urheberrechtlich geschütztes Material wörtlich zitiert.
    • Es wird die Frage gestellt, wie stark urheberrechtlich geschütztes Material verändert werden muss, damit das Urheberrecht nicht mehr greift.
    • Außerdem wird diskutiert, ob OpenAI über die Weboberfläche das Auslaufen urheberrechtlich geschützter Inhalte verhindern könnte.
  • Kritik an der Wahrnehmung von Entwicklern, LLMs seien menschenähnlich

    • Kritisiert wird die Auffassung von Entwicklern, LLMs würden NYT-Artikel wie Menschen als Lernmaterial verwenden.
    • Es wird darauf hingewiesen, dass die Komplexität von LLMs nichts daran ändert, dass urheberrechtlich geschützte Inhalte in den Quellcode integriert wurden.
  • Erwartungen von Content-Unternehmen an Monetarisierung

    • Es wird angemerkt, dass Content-Unternehmen einschließlich der NYT Gebühren dafür erwarten, dass ihre Inhalte für das Training von LLMs verwendet werden.
    • Genannt wird außerdem, dass Reddit, Discord und Twitter den Verkauf von Inhalten für AI-Training erwägen oder bereits betreiben.
  • Rechtliche Argumentation der NYT zur Nutzung von LLMs

    • Es wird analysiert, dass die NYT argumentiert, die Art der Nutzung beim Training von LLMs stelle eine Urheberrechtsverletzung dar.
    • Verglichen wird die Kritik an großen Unternehmen, die den Zugang zu LLMs verkaufen, mit einer toleranteren Haltung gegenüber privater oder akademischer Nutzung.
  • Prognosen zur künftigen Nutzung von LLMs

    • Es wird behauptet, dass es in Zukunft illegal sein werde, urheberrechtlich geschütztes Material zu lesen, wenn LLMs in Maschinen integriert werden, die mit der physischen Welt interagieren.
    • Dazu wird die Sicht geäußert, dass Roboter sich dann keine urheberrechtlich geschützten Inhalte mehr merken dürften, die sie etwa durch Fernsehen, das Lesen von Bibliotheksbüchern oder Internetrecherchen aufnehmen.
  • Ansicht, dass LLMs als „transformative Werke“ unter Fair Use fallen sollten

    • Es wird als persönliche Meinung vertreten, dass LLMs als transformative Werke unter Fair Use fallen sollten.
    • Zudem wird Interesse daran geäußert, wie das Rechtssystem dies letztlich beurteilen wird.