1 Punkte von GN⁺ 2 시간 전 | 1 Kommentare | Auf WhatsApp teilen
  • Meta und CEO Mark Zuckerberg werden von fünf Verlagen und Scott Turow verklagt, weil sie für das Training von AI-Systemen angeblich Millionen urheberrechtlich geschützter Bücher, Fachaufsätze und Artikel illegal kopiert haben
  • Meta wird vorgeworfen, Millionen urheberrechtlich geschützter Materialien per Torrent von berüchtigten Piratenseiten heruntergeladen und mehrfach unautorisiert per Web-Scraping erfasste Daten kopiert zu haben, um damit Llama zu trainieren
  • Die Klage wurde am 5. Mai 2026 beim US-Bezirksgericht für den südlichen Bezirk von New York eingereicht; Hachette, Macmillan, McGraw Hill, Elsevier, Cengage und Scott Turow fordern nicht näher bezifferten Schadensersatz
  • Meta erklärte, es werde sich energisch verteidigen, und verwies auf Gerichtsentscheidungen, wonach die Nutzung urheberrechtlich geschützter Werke für AI-Training unter Fair Use fallen könne; im Juni 2025 waren bereits Ansprüche von Autoren im Zusammenhang mit dem Llama-Training abgewiesen worden
  • Die neue Klage stellt als zentrales Unterscheidungsmerkmal heraus, dass Meta eine Lizenzstrategie nach Prüfung auf persönliche Anweisung Zuckerbergs gestoppt und trotz bekannter Risiken bei der Nutzung von LibGen den Download von mehr als 267 TB an Raubkopien genehmigt habe

Kern der Klage

  • Meta und CEO Mark Zuckerberg werden von fünf Verlagen und dem Autor Scott Turow verklagt, weil sie für das Training von AI-Systemen angeblich Millionen urheberrechtlich geschützter Bücher, Fachaufsätze und Artikel illegal kopiert haben
  • Meta und Zuckerberg sollen beim Aufbau generativer AI-Modelle dem bekannten Meta-Motto „move fast and break things“ gefolgt sein und Millionen urheberrechtlich geschützter Bücher und wissenschaftlicher Zeitschriftenaufsätze per Torrent von berüchtigten Piratenseiten heruntergeladen haben
  • Meta wird außerdem vorgeworfen, unautorisiert per Web-Scraping erfasste Daten heruntergeladen zu haben, die nahezu dem gesamten Internet entsprächen, diese mehrfach kopiert und zum Training von Metas milliardenschwerem generativen AI-System Llama verwendet zu haben
  • Dieses Vorgehen wird als „eine der größten Verletzungen urheberrechtlich geschützter Materialien in der Geschichte“ bezeichnet

Kläger und Forderungen

  • Die Klage wurde am Dienstag, dem 5. Mai 2026, beim US-Bezirksgericht für den südlichen Bezirk von New York eingereicht
  • Kläger sind die fünf Verlage Hachette, Macmillan, McGraw Hill, Elsevier, Cengage sowie Scott Turow persönlich
  • Die vorgeschlagene Sammelklage verlangt wegen des Vorwurfs der Urheberrechtsverletzung nicht näher bezifferten Schadensersatz
  • Eine Kopie der Klageschrift ist unter diesem Link verfügbar

Metas Gegenargumente und bisherige Rechtsprechung

  • Ein Sprecher von Meta erklärte: „AI ermöglicht Innovation, Produktivität und Kreativität für Einzelpersonen und Unternehmen, und Gerichte haben richtigerweise entschieden, dass die Nutzung urheberrechtlich geschützter Materialien für AI-Training unter Fair Use fallen kann“
  • Meta kündigte an, die Klage energisch abzuwehren
  • Es gibt Fälle, in denen Autoren mit Urheberrechtsklagen gegen AI-Unternehmen gescheitert sind
  • Im Juni 2025 wies ein Bundesrichter Ansprüche von 13 Autoren, darunter Sarah Silverman und Junot Díaz, ab, die geltend gemacht hatten, Metas Training seiner AI-Modelle verletze das Urheberrecht
  • Richter Vincent Chhabria entschied damals, dass Metas Nutzung eines Datensatzes aus rund 200.000 Büchern zum Training des Sprachmodells Llama unter Fair Use falle

Was diese Klage unterscheidet

  • Diese Klage hebt hervor, dass Meta und Zuckerberg Urheberrechtsschutzmaßnahmen bewusst umgangen hätten
  • Meta soll geprüft haben, Werke zu lizenzieren, diese Strategie aber auf „persönliche Anweisung Zuckerbergs“ aufgegeben haben
  • Die Klage vertritt die Auffassung, dass das beanstandete Verhalten außerhalb des Schutzbereichs der Fair-Use-Regelung des US-Urheberrechts liege
  • In der Klageschrift heißt es, Meta habe auf Weisung Zuckerbergs ohne Erlaubnis Millionen Bücher, wissenschaftliche Zeitschriftenaufsätze und andere Werke kopiert, darunter Werke im Eigentum oder unter Verwaltung der Kläger und der Mitglieder der Sammelklage, und zusätzliche Kopien für das Training von Llama erstellt
  • Zuckerberg wird vorgeworfen, die Verletzungen „persönlich genehmigt und aktiv gefördert“ zu haben
  • Meta soll aus den gestohlenen Werken Informationen zur Rechteverwaltung entfernt haben, um die Herkunft des Trainingsmaterials zu verschleiern und die unautorisierte Nutzung zu erleichtern

Prüfung und Stopp von Lizenzen

  • Laut Klage prüfte Meta nach dem Start von Llama 1 kurzzeitig den Abschluss von Lizenzverträgen mit großen Verlagen
  • Meta diskutierte von Januar bis April 2023 darüber, das Budget des Unternehmens für Datensatz-Lizenzen auf bis zu 200 Millionen US-Dollar zu erhöhen
  • Anfang April 2023 soll Meta die Lizenzstrategie abrupt gestoppt haben
  • In der Klageschrift heißt es, die Frage, ob urheberrechtlich geschützte Materialien künftig lizenziert oder Raubkopien genutzt werden sollten, sei an Zuckerberg „eskaliert“ worden
  • Nach dieser Eskalation habe Metas Business-Development-Team laut Klägern die mündliche Anweisung erhalten, die Lizenzbemühungen einzustellen
  • Die Klageschrift enthält zudem die Aussage, ein Meta-Mitarbeiter habe den Grund sinngemäß damit erklärt, dass es schwerer werde, sich auf eine Fair-Use-Strategie zu stützen, wenn auch nur ein einziges Buch lizenziert werde

Metas bisherige Lizenzierungserfahrung

  • Es wird angeführt, dass Meta und Zuckerberg den Markt für die Lizenzierung von AI-Trainingsmaterial gut kannten
  • Laut Klage schloss Meta 2022 vier Lizenzvereinbarungen mit Buchverlagen aus afrikanischen Sprachräumen für begrenzte Trainingssätze ab
  • Später schloss Meta außerdem Lizenzverträge mit großen Nachrichtenverlagen, darunter Fox News, CNN und USA Today

Nutzung von LibGen und interne Risikoprüfung

  • Laut Klage zirkulierten Meta-Mitarbeiter am 13. Dezember 2023 ein internes Memo zu den rechtlichen Risiken der Nutzung von LibGen
  • Dieses Meta-Memo bezeichnete LibGen als „einen Datensatz, von dem wir wissen, dass er Raubkopien enthält“
  • In derselben Notiz habe laut Klageschrift auch gestanden, dass man die Nutzung des für das Training verwendeten LibGen-Datensatzes nicht offenlegen werde
  • Diese Bedenken seien letztlich jedoch nicht berücksichtigt worden
  • Laut Klage genehmigten und veranlassten Zuckerberg und andere Meta-Führungskräfte den Torrent-Download von mehr als 267 TB an Raubkopien
  • Dieses Volumen entspreche Hunderten Millionen Publikationen und übersteige die gesamte gedruckte Sammlung der US-Kongressbibliothek um ein Vielfaches

Vorwürfe zu Llama-Ausgaben

  • Als Folge der mutmaßlichen Verletzungen soll Metas AI-System schnell und in großem Maßstab Ausgaben erzeugen, die die im Training verwendeten Werke der Kläger und der Mitglieder der Sammelklage ersetzen können
  • Laut Klageschrift umfassen solche Ersatzprodukte nahezu identische Kopien der Originale, Ersatzkapitel für akademische Lehrbücher sowie Zusammenfassungen und alternative Versionen berühmter Romane und wissenschaftlicher Zeitschriftenaufsätze
  • Llama soll außerdem minderwertige Nachahmungen erzeugen, die kreative Elemente der Originalwerke kopieren, sowie Bearbeitungen, die ausschließlich den Rechteinhabern vorbehalten sind
  • Laut Klageschrift kann Llama Ausgaben auch gezielt so erzeugen, dass Ausdruckselemente und kreative Entscheidungen bestimmter Autoren nachgeahmt werden

1 Kommentare

 
GN⁺ 2 시간 전
Hacker-News-Kommentare
  • Viele würden sich wohl freuen, wenn Zuckerberg dafür auch nur den gesetzlichen Mindestschadensersatz von 750 Dollar pro Verstoß zahlen müsste
    Im früheren Anthropic-Verfahren wurde festgestellt, dass KI-Training selbst eine transformative Nutzung ist und als solches keine Verletzung darstellt, das rechtswidrige Kopieren urheberrechtlich geschützter Werke zu diesem Zweck jedoch eindeutig eine Verletzung ist
    Die Vergleichssumme lag bei 1,5 Milliarden Dollar, also fast 3.000 Dollar pro 500.000 illegal kopierter Werke; wenn Zuckerberg „Millionen“ Werke illegal kopiert hat, wirkt ein Vergleich über 6 Milliarden Dollar also durchaus plausibel

    • Wenn ich an die Kinder[1] denke, die strafrechtlich verfolgt wurden, weil sie früher MP3-Seiten betrieben haben, ist das schon frustrierend
      Dieser Mann scheint dagegen fast alle existierenden Medien gestohlen und genutzt zu haben und wird wohl trotzdem davonkommen, weil er zu reich ist, um angeklagt zu werden
      [1] z. B.: https://en.wikipedia.org/wiki/Oink%27s_Pink_Palace#Legal_pro...
    • Solange DJT Präsident ist, wird Zuckerberg oder Meta wohl nichts passieren
      Es ist, als hätte er sich den besten Schutz gekauft, den man haben kann, um Gesetze zu brechen
    • Das beeindruckt mich überhaupt nicht. Ich verstehe nicht, wie er so weitermachen und dennoch ein KI-Monopolist/Hegemon bleiben kann
      Im Grunde eignet er sich einfach alles ohne zu fragen an und will erst hinterher über den Preis verhandeln. Wo bleibt die strafrechtliche Verfolgung, und wenn schon nicht Freiheitsentzug, dann wenigstens die Einziehung von Beteiligungsvermögen?
    • Ich hätte nie gedacht, dass ich am Ende Anwälte für geistiges Eigentum anfeuern würde
    • Zur Einordnung: Zuckerbergs Nettovermögen liegt bei etwa 220 Milliarden Dollar
  • Früher wurden Studenten mit Klagen überzogen, die nur MP3s heruntergeladen und nicht einmal weiterverbreitet hatten
    Damals hieß es, das sei keine faire Nutzung, weil es keinerlei Transformation gebe und es bloß ein Dateidownload sei; die Lektion daraus scheint zu sein, dass diese Studenten lieber Millionen Werke hätten stehlen sollen

    • Das könnte auch eine Kampagne zur Beeinflussung der öffentlichen Meinung gewesen sein
      Wenn sogar Endnutzer angeklagt werden können, kippt der Diskurs von positiv zu negativ, und die Mächtigen können dieses Verhalten leichter unterdrücken
    • Die eigentliche Trennlinie ist, ob man extrem reich ist oder nicht
  • Vor ein paar Wochen musste ich auf meinem privaten cgit-Server das ASN von Meta blockieren. Sie haben die robots.txt ignoriert und den Server praktisch niedergebrannt
    Sie schienen klar über verschiedene Netzblöcke verteilt zu sein, um IP-basierte Limits zu umgehen, und allein ihretwegen liefen die Access-Logs auf mehrere hundert MB auf. Unglaublich

    • Dasselbe ist mir schon letztes Jahr passiert. Es wurden pausenlos zufällige nicht existierende URLs gecrawlt
      Es sah so aus, als wollten sie Benutzeranfragen an einen Suchendpunkt weiterleiten, und da das ASN übereinstimmte, war das auch niemand, der sich nur als Meta ausgab
    • ASN-basiertes Blockieren sollte meiner Meinung nach viel üblicher sein. Schade nur, dass viele gängige Tools das nicht als erstklassige Konfigurationsoption unterstützen
    • Mich würde interessieren, wie man solche Firmen identifiziert. Gibt es einen Dienst, mit dem man herausfinden kann, welche Firma meine Website abgesaugt hat?
  • Es ist schon komisch, wie plötzlich Leute Partei für Elsevier ergreifen. Nach geltendem Recht scheint KI-Training klar eine transformative faire Nutzung zu sein
    Vielleicht wird dieser Fall sogar zum Präzedenzfall, der genau das bestätigt

    • Mich stört, dass KI-Befürworter nun so tun, als würden Menschen, die sich in den letzten 20 Jahren gegen die Urheberrechtsindustrie gestellt haben, plötzlich ihre Haltung ändern, nur weil sie sich jetzt gegen die KI-Industrie wenden
      Ich kann für die Entkriminalisierung oder Legalisierung kleiner Mengen Cannabis für den Eigengebrauch sein, ohne deshalb riesige industrielle Drogenproduktion zu befürworten, die die Wirtschaft verzerrt, oder Firmen, die Methamphetamin in jedes Produkt mischen wollen
    • Ich finde das auch komisch. Ich habe in anderen Threads und Beiträgen[0] dasselbe gesagt
      Man sagt: „Sie haben die gestohlenen Früchte erneut kopiert“ – aber was genau wurde denn „gestohlen“? Der ursprüngliche Eigentümer hat das angeblich Gestohlene doch immer noch, oder nicht?
      In Dowling v. United States, 473 U.S. 207 (1985), entschied der Supreme Court, dass der unerlaubte Verkauf von Tonträgern mit urheberrechtlich geschützten Musikwerken nicht unter den National Stolen Property Act als „gestohlene, veruntreute oder betrügerisch erlangte“ Güter fällt
      Und selbst wenn man zum Zweck des Arguments annimmt, dass hier etwas gestohlen wurde, besteht der Zweck des Urheberrechts darin, „den Fortschritt von Wissenschaft und nützlichen Künsten zu fördern, indem Autoren und Erfindern für begrenzte Zeit das ausschließliche Recht an ihren jeweiligen Schriften und Entdeckungen gesichert wird“
      Es dürfte sehr schwer sein zu beweisen, dass LLMs Kunst und Wissenschaft nicht vorangebracht haben, daher sehe ich darin zumindest eine transformative Nutzung, also Fair Use
      [0] https://news.ycombinator.com/item?id=48026207#48029072
    • Ich glaube nicht einmal, dass man so weit gehen muss wie „KI-Training ist nach geltendem Recht transformative Fair Use“. Das ist ein völlig neues Produkt
      Es ist ungefähr so, als würde jemand, der eine Tastatur verkauft hat, Tantiemen für Software verlangen, die mit dieser Tastatur geschrieben wurde
      Dass der Autor eines Buches die neue Nutzung als LLM-Trainingsmaterial nicht vorhergesehen hat, ist unerheblich. Das Buch befindet sich nicht im LLM und wird auch nicht zusammen mit dem LLM verkauft. Es ist nur eines von Milliarden Werkzeugen, die zum Bau des LLM verwendet wurden
      Es ist verrückt, das so darzustellen, als würden KI-Firmen armen Inhabern geistiger Eigentumsrechte wie Disney Wert entziehen. Diese Inhalte sind unser kulturelles Erbe und gehören uns bereits. Es wurde nur irgendeinem Idioten das lebenslange Recht eingeräumt, daraus ein Monopol auszubeuten
      LLMs werden mit Daten trainiert, die wir bereits besitzen. Disney und andere wollen mit neuer Technik noch mehr Geld aus Dingen pressen, die vor Jahrzehnten geschaffen wurden
      Im schlimmsten Fall ist es Reverse Engineering, und das sollte in den USA durch Fair Use geschützt sein, auch wenn dieser Schutz offenbar teilweise ausgehöhlt wurde
    • Gewöhnlich geht es nicht um die Frage, ob etwas transformativ ist, sondern darum, dass urheberrechtlich geschütztes Material rechtswidrig beschafft wurde
    • Ich finde, sowohl Elsevier als auch Menschen, die geistiges Eigentum ohne Zustimmung der Autoren für kommerziell vertriebenes KI-Training verwenden, sollten legal handeln dürfen
  • Ich bin gespannt, was aus der persönlichen Haftung wird
    In Unternehmen verflüchtigt sich Verantwortung viel zu oft, und ich habe mich gefragt, was eigentlich die rechtliche Begründung dafür ist. Bisher scheint nur ein „Achselzucken“ und „die einschlägige Vorschrift scheint nicht zu greifen“ übrig zu sein, und beides sind keine guten Gründe
    Ich wollte schon den Witz machen, dass man, wenn man einen Magneten an Aaron Swartz’ Leiche hielte, damit inzwischen eine starke Energiequelle hätte, weil er sich so schnell drehen würde
    Aber ehrlich gesagt hätte er so etwas vermutlich erwartet, wenn man bedenkt, wie sein Fall behandelt wurde und dass es seitdem kaum besser geworden ist

    • Die Behandlung des Falls Aaron Swartz war ein Desaster, aber er wurde nicht wegen Piraterie angeklagt
      Die Vorwürfe lauteten auf Betrug, unbefugten Zugriff auf geschützte Computer und Computerschädigung
      Mit der Zeit geriet die Grundlage des Falls in Vergessenheit und wurde durch die Annahme ersetzt, es habe sich um einen Pirateriefall gehandelt, doch tatsächlich ging es um unbefugten Zugriff
    • In einer anderen Realität wäre Aaron Swartz vielleicht nie verklärt worden und würde heute womöglich mit seinen YC-Alumni-Freunden ein KI/Krypto-Startup betreiben, das Menschen dafür bezahlt, Trainingsdaten hochzuladen
  • Wenn Zuckerberg dafür nicht hart bestraft wird, hoffe ich wenigstens, dass daraus ein juristischer Präzedenzfall entsteht, der allen anderen dasselbe erlaubt
    Alle künftigen Aaron Swartz sollten wissenschaftliche Aufsätze frei mit der ganzen Welt teilen dürfen

    • Wahrscheinlich werden sie durch Lobbyarbeit regulatorische Vereinnahmung schaffen und kleineren Akteuren die Leiter hochziehen
  • Ich kenne persönlich einen Ingenieur, dem aufgetragen wurde, etwas zu tun, obwohl klar war, dass es viele rechtliche Probleme geben würde, mit der Begründung, genau dafür habe die Firma ja Anwälte

    • Es wäre schön, wenn so etwas im Zuge der Beweisaufnahme bei einer Klage ans Licht käme, aber wahrscheinlich wird das nie passieren
      Whistleblowing ist bei der aktuellen Wirtschaftslage auch keine attraktive Option, aber ich wünschte trotzdem, mehr Menschen würden es tun
  • Also lautet das Motto jetzt: „move fast and steal things“?

    • Als die KI-Sammler gerade erst anfingen, war das im Grunde auch mein Eindruck. Es schien ein Plan zu sein, so viel wie möglich einzusammeln, bevor die Leute merkten, was geschah, und anfingen, sie zu blockieren
      Die Geschwindigkeit, mit der sie Websites durchforsteten und absaugten, lag weit über allem, was man bei sogenannten legitimen Crawlern sieht, und das schien die plausibelste Erklärung zu sein
    • Move fast and break the law
    • Das lief von Anfang an so, direkt von ganz oben
    • Das ist der größte Diebstahl der Geschichte an der arbeitenden Bevölkerung
    • Gestohlen? Ist das schon wieder diese „you wouldn’t download a car“-Logik? Ich dachte, darüber seien wir längst hinaus
  • Ob der CEO es genehmigt hat oder ein anderer hochrangiger Mitarbeiter, wird an der Haftung des Unternehmens wohl nichts ändern
    Die zu beantwortende Frage ist, ob so etwas stattgefunden hat und falls ja, ob es eine Urheberrechtsverletzung ist, die nicht durch Fair Use geschützt ist, nicht welcher Unternehmensmanager das genehmigt hat

  • Aaron Swartz sah sich mit mehreren Jahren Gefängnis bedroht, weil er wissenschaftliche Zeitschriftenartikel herunterladen und der Welt kostenlos zugänglich machen wollte, ohne daran zu verdienen, und nahm sich am Ende das Leben
    Wenn dagegen ein Milliardenunternehmen Millionen urheberrechtlich geschützter Werke herunterlädt, mit diesem Datensatz eine neue Art von KI-Modell trainiert und damit den gesamten Arbeitsmarkt umkrempeln will, gilt das einfach als Silicon-Valley-Innovation und bekommt beinahe noch einen Orden dafür

    • Wenn eine Einzelperson urheberrechtlich geschütztes Material illegal herunterlädt, ist es ein Verbrechen. Wenn ein multinationaler Konzern urheberrechtlich geschütztes Material illegal herunterlädt, ist es der einzige verbliebene Wachstumsbereich der US-Wirtschaft und essenziell für die nationale Sicherheit
    • Nachdem Aaron seine lokalen Kopien gelöscht hatte, zog Jstor die Klage zurück. Das DOJ tat das nicht
      Ich bezweifle, dass Meta seine lokalen Kopien gelöscht hat
    • Aaron Swartz wurde ungerecht behandelt, und der Grund dafür ist, dass das Urheberrecht ein miserables Gesetzesgebiet ist
      Man sollte sich gegen solche Gesetze und diese Behandlung wenden, statt sie als Werkzeug zur Vergeltung gegen andere einzusetzen
      Zu fordern, dass alle gleichermaßen ungerecht behandelt werden, ist falsch. Besser wäre es, die schlechten Gesetze und Strukturen abzuschaffen
    • Meta hat seine KI-Modelle ja ebenfalls kostenlos mit der Welt geteilt
    • Er war seiner Zeit wirklich voraus