Zuckerberg habe Metas Urheberrechtsverletzungen „persönlich genehmigt und aktiv gefördert“
(variety.com)- Meta und CEO Mark Zuckerberg werden von fünf Verlagen und Scott Turow verklagt, weil sie für das Training von AI-Systemen angeblich Millionen urheberrechtlich geschützter Bücher, Fachaufsätze und Artikel illegal kopiert haben
- Meta wird vorgeworfen, Millionen urheberrechtlich geschützter Materialien per Torrent von berüchtigten Piratenseiten heruntergeladen und mehrfach unautorisiert per Web-Scraping erfasste Daten kopiert zu haben, um damit Llama zu trainieren
- Die Klage wurde am 5. Mai 2026 beim US-Bezirksgericht für den südlichen Bezirk von New York eingereicht; Hachette, Macmillan, McGraw Hill, Elsevier, Cengage und Scott Turow fordern nicht näher bezifferten Schadensersatz
- Meta erklärte, es werde sich energisch verteidigen, und verwies auf Gerichtsentscheidungen, wonach die Nutzung urheberrechtlich geschützter Werke für AI-Training unter Fair Use fallen könne; im Juni 2025 waren bereits Ansprüche von Autoren im Zusammenhang mit dem Llama-Training abgewiesen worden
- Die neue Klage stellt als zentrales Unterscheidungsmerkmal heraus, dass Meta eine Lizenzstrategie nach Prüfung auf persönliche Anweisung Zuckerbergs gestoppt und trotz bekannter Risiken bei der Nutzung von LibGen den Download von mehr als 267 TB an Raubkopien genehmigt habe
Kern der Klage
- Meta und CEO Mark Zuckerberg werden von fünf Verlagen und dem Autor Scott Turow verklagt, weil sie für das Training von AI-Systemen angeblich Millionen urheberrechtlich geschützter Bücher, Fachaufsätze und Artikel illegal kopiert haben
- Meta und Zuckerberg sollen beim Aufbau generativer AI-Modelle dem bekannten Meta-Motto „move fast and break things“ gefolgt sein und Millionen urheberrechtlich geschützter Bücher und wissenschaftlicher Zeitschriftenaufsätze per Torrent von berüchtigten Piratenseiten heruntergeladen haben
- Meta wird außerdem vorgeworfen, unautorisiert per Web-Scraping erfasste Daten heruntergeladen zu haben, die nahezu dem gesamten Internet entsprächen, diese mehrfach kopiert und zum Training von Metas milliardenschwerem generativen AI-System Llama verwendet zu haben
- Dieses Vorgehen wird als „eine der größten Verletzungen urheberrechtlich geschützter Materialien in der Geschichte“ bezeichnet
Kläger und Forderungen
- Die Klage wurde am Dienstag, dem 5. Mai 2026, beim US-Bezirksgericht für den südlichen Bezirk von New York eingereicht
- Kläger sind die fünf Verlage Hachette, Macmillan, McGraw Hill, Elsevier, Cengage sowie Scott Turow persönlich
- Die vorgeschlagene Sammelklage verlangt wegen des Vorwurfs der Urheberrechtsverletzung nicht näher bezifferten Schadensersatz
- Eine Kopie der Klageschrift ist unter diesem Link verfügbar
Metas Gegenargumente und bisherige Rechtsprechung
- Ein Sprecher von Meta erklärte: „AI ermöglicht Innovation, Produktivität und Kreativität für Einzelpersonen und Unternehmen, und Gerichte haben richtigerweise entschieden, dass die Nutzung urheberrechtlich geschützter Materialien für AI-Training unter Fair Use fallen kann“
- Meta kündigte an, die Klage energisch abzuwehren
- Es gibt Fälle, in denen Autoren mit Urheberrechtsklagen gegen AI-Unternehmen gescheitert sind
- Im Juni 2025 wies ein Bundesrichter Ansprüche von 13 Autoren, darunter Sarah Silverman und Junot Díaz, ab, die geltend gemacht hatten, Metas Training seiner AI-Modelle verletze das Urheberrecht
- Richter Vincent Chhabria entschied damals, dass Metas Nutzung eines Datensatzes aus rund 200.000 Büchern zum Training des Sprachmodells Llama unter Fair Use falle
Was diese Klage unterscheidet
- Diese Klage hebt hervor, dass Meta und Zuckerberg Urheberrechtsschutzmaßnahmen bewusst umgangen hätten
- Meta soll geprüft haben, Werke zu lizenzieren, diese Strategie aber auf „persönliche Anweisung Zuckerbergs“ aufgegeben haben
- Die Klage vertritt die Auffassung, dass das beanstandete Verhalten außerhalb des Schutzbereichs der Fair-Use-Regelung des US-Urheberrechts liege
- In der Klageschrift heißt es, Meta habe auf Weisung Zuckerbergs ohne Erlaubnis Millionen Bücher, wissenschaftliche Zeitschriftenaufsätze und andere Werke kopiert, darunter Werke im Eigentum oder unter Verwaltung der Kläger und der Mitglieder der Sammelklage, und zusätzliche Kopien für das Training von Llama erstellt
- Zuckerberg wird vorgeworfen, die Verletzungen „persönlich genehmigt und aktiv gefördert“ zu haben
- Meta soll aus den gestohlenen Werken Informationen zur Rechteverwaltung entfernt haben, um die Herkunft des Trainingsmaterials zu verschleiern und die unautorisierte Nutzung zu erleichtern
Prüfung und Stopp von Lizenzen
- Laut Klage prüfte Meta nach dem Start von Llama 1 kurzzeitig den Abschluss von Lizenzverträgen mit großen Verlagen
- Meta diskutierte von Januar bis April 2023 darüber, das Budget des Unternehmens für Datensatz-Lizenzen auf bis zu 200 Millionen US-Dollar zu erhöhen
- Anfang April 2023 soll Meta die Lizenzstrategie abrupt gestoppt haben
- In der Klageschrift heißt es, die Frage, ob urheberrechtlich geschützte Materialien künftig lizenziert oder Raubkopien genutzt werden sollten, sei an Zuckerberg „eskaliert“ worden
- Nach dieser Eskalation habe Metas Business-Development-Team laut Klägern die mündliche Anweisung erhalten, die Lizenzbemühungen einzustellen
- Die Klageschrift enthält zudem die Aussage, ein Meta-Mitarbeiter habe den Grund sinngemäß damit erklärt, dass es schwerer werde, sich auf eine Fair-Use-Strategie zu stützen, wenn auch nur ein einziges Buch lizenziert werde
Metas bisherige Lizenzierungserfahrung
- Es wird angeführt, dass Meta und Zuckerberg den Markt für die Lizenzierung von AI-Trainingsmaterial gut kannten
- Laut Klage schloss Meta 2022 vier Lizenzvereinbarungen mit Buchverlagen aus afrikanischen Sprachräumen für begrenzte Trainingssätze ab
- Später schloss Meta außerdem Lizenzverträge mit großen Nachrichtenverlagen, darunter Fox News, CNN und USA Today
Nutzung von LibGen und interne Risikoprüfung
- Laut Klage zirkulierten Meta-Mitarbeiter am 13. Dezember 2023 ein internes Memo zu den rechtlichen Risiken der Nutzung von LibGen
- Dieses Meta-Memo bezeichnete LibGen als „einen Datensatz, von dem wir wissen, dass er Raubkopien enthält“
- In derselben Notiz habe laut Klageschrift auch gestanden, dass man die Nutzung des für das Training verwendeten LibGen-Datensatzes nicht offenlegen werde
- Diese Bedenken seien letztlich jedoch nicht berücksichtigt worden
- Laut Klage genehmigten und veranlassten Zuckerberg und andere Meta-Führungskräfte den Torrent-Download von mehr als 267 TB an Raubkopien
- Dieses Volumen entspreche Hunderten Millionen Publikationen und übersteige die gesamte gedruckte Sammlung der US-Kongressbibliothek um ein Vielfaches
Vorwürfe zu Llama-Ausgaben
- Als Folge der mutmaßlichen Verletzungen soll Metas AI-System schnell und in großem Maßstab Ausgaben erzeugen, die die im Training verwendeten Werke der Kläger und der Mitglieder der Sammelklage ersetzen können
- Laut Klageschrift umfassen solche Ersatzprodukte nahezu identische Kopien der Originale, Ersatzkapitel für akademische Lehrbücher sowie Zusammenfassungen und alternative Versionen berühmter Romane und wissenschaftlicher Zeitschriftenaufsätze
- Llama soll außerdem minderwertige Nachahmungen erzeugen, die kreative Elemente der Originalwerke kopieren, sowie Bearbeitungen, die ausschließlich den Rechteinhabern vorbehalten sind
- Laut Klageschrift kann Llama Ausgaben auch gezielt so erzeugen, dass Ausdruckselemente und kreative Entscheidungen bestimmter Autoren nachgeahmt werden
1 Kommentare
Hacker-News-Kommentare
Viele würden sich wohl freuen, wenn Zuckerberg dafür auch nur den gesetzlichen Mindestschadensersatz von 750 Dollar pro Verstoß zahlen müsste
Im früheren Anthropic-Verfahren wurde festgestellt, dass KI-Training selbst eine transformative Nutzung ist und als solches keine Verletzung darstellt, das rechtswidrige Kopieren urheberrechtlich geschützter Werke zu diesem Zweck jedoch eindeutig eine Verletzung ist
Die Vergleichssumme lag bei 1,5 Milliarden Dollar, also fast 3.000 Dollar pro 500.000 illegal kopierter Werke; wenn Zuckerberg „Millionen“ Werke illegal kopiert hat, wirkt ein Vergleich über 6 Milliarden Dollar also durchaus plausibel
Dieser Mann scheint dagegen fast alle existierenden Medien gestohlen und genutzt zu haben und wird wohl trotzdem davonkommen, weil er zu reich ist, um angeklagt zu werden
[1] z. B.: https://en.wikipedia.org/wiki/Oink%27s_Pink_Palace#Legal_pro...
Es ist, als hätte er sich den besten Schutz gekauft, den man haben kann, um Gesetze zu brechen
Im Grunde eignet er sich einfach alles ohne zu fragen an und will erst hinterher über den Preis verhandeln. Wo bleibt die strafrechtliche Verfolgung, und wenn schon nicht Freiheitsentzug, dann wenigstens die Einziehung von Beteiligungsvermögen?
Früher wurden Studenten mit Klagen überzogen, die nur MP3s heruntergeladen und nicht einmal weiterverbreitet hatten
Damals hieß es, das sei keine faire Nutzung, weil es keinerlei Transformation gebe und es bloß ein Dateidownload sei; die Lektion daraus scheint zu sein, dass diese Studenten lieber Millionen Werke hätten stehlen sollen
Wenn sogar Endnutzer angeklagt werden können, kippt der Diskurs von positiv zu negativ, und die Mächtigen können dieses Verhalten leichter unterdrücken
Vor ein paar Wochen musste ich auf meinem privaten cgit-Server das ASN von Meta blockieren. Sie haben die robots.txt ignoriert und den Server praktisch niedergebrannt
Sie schienen klar über verschiedene Netzblöcke verteilt zu sein, um IP-basierte Limits zu umgehen, und allein ihretwegen liefen die Access-Logs auf mehrere hundert MB auf. Unglaublich
Es sah so aus, als wollten sie Benutzeranfragen an einen Suchendpunkt weiterleiten, und da das ASN übereinstimmte, war das auch niemand, der sich nur als Meta ausgab
Es ist schon komisch, wie plötzlich Leute Partei für Elsevier ergreifen. Nach geltendem Recht scheint KI-Training klar eine transformative faire Nutzung zu sein
Vielleicht wird dieser Fall sogar zum Präzedenzfall, der genau das bestätigt
Ich kann für die Entkriminalisierung oder Legalisierung kleiner Mengen Cannabis für den Eigengebrauch sein, ohne deshalb riesige industrielle Drogenproduktion zu befürworten, die die Wirtschaft verzerrt, oder Firmen, die Methamphetamin in jedes Produkt mischen wollen
Man sagt: „Sie haben die gestohlenen Früchte erneut kopiert“ – aber was genau wurde denn „gestohlen“? Der ursprüngliche Eigentümer hat das angeblich Gestohlene doch immer noch, oder nicht?
In Dowling v. United States, 473 U.S. 207 (1985), entschied der Supreme Court, dass der unerlaubte Verkauf von Tonträgern mit urheberrechtlich geschützten Musikwerken nicht unter den National Stolen Property Act als „gestohlene, veruntreute oder betrügerisch erlangte“ Güter fällt
Und selbst wenn man zum Zweck des Arguments annimmt, dass hier etwas gestohlen wurde, besteht der Zweck des Urheberrechts darin, „den Fortschritt von Wissenschaft und nützlichen Künsten zu fördern, indem Autoren und Erfindern für begrenzte Zeit das ausschließliche Recht an ihren jeweiligen Schriften und Entdeckungen gesichert wird“
Es dürfte sehr schwer sein zu beweisen, dass LLMs Kunst und Wissenschaft nicht vorangebracht haben, daher sehe ich darin zumindest eine transformative Nutzung, also Fair Use
[0] https://news.ycombinator.com/item?id=48026207#48029072
Es ist ungefähr so, als würde jemand, der eine Tastatur verkauft hat, Tantiemen für Software verlangen, die mit dieser Tastatur geschrieben wurde
Dass der Autor eines Buches die neue Nutzung als LLM-Trainingsmaterial nicht vorhergesehen hat, ist unerheblich. Das Buch befindet sich nicht im LLM und wird auch nicht zusammen mit dem LLM verkauft. Es ist nur eines von Milliarden Werkzeugen, die zum Bau des LLM verwendet wurden
Es ist verrückt, das so darzustellen, als würden KI-Firmen armen Inhabern geistiger Eigentumsrechte wie Disney Wert entziehen. Diese Inhalte sind unser kulturelles Erbe und gehören uns bereits. Es wurde nur irgendeinem Idioten das lebenslange Recht eingeräumt, daraus ein Monopol auszubeuten
LLMs werden mit Daten trainiert, die wir bereits besitzen. Disney und andere wollen mit neuer Technik noch mehr Geld aus Dingen pressen, die vor Jahrzehnten geschaffen wurden
Im schlimmsten Fall ist es Reverse Engineering, und das sollte in den USA durch Fair Use geschützt sein, auch wenn dieser Schutz offenbar teilweise ausgehöhlt wurde
Ich bin gespannt, was aus der persönlichen Haftung wird
In Unternehmen verflüchtigt sich Verantwortung viel zu oft, und ich habe mich gefragt, was eigentlich die rechtliche Begründung dafür ist. Bisher scheint nur ein „Achselzucken“ und „die einschlägige Vorschrift scheint nicht zu greifen“ übrig zu sein, und beides sind keine guten Gründe
Ich wollte schon den Witz machen, dass man, wenn man einen Magneten an Aaron Swartz’ Leiche hielte, damit inzwischen eine starke Energiequelle hätte, weil er sich so schnell drehen würde
Aber ehrlich gesagt hätte er so etwas vermutlich erwartet, wenn man bedenkt, wie sein Fall behandelt wurde und dass es seitdem kaum besser geworden ist
Die Vorwürfe lauteten auf Betrug, unbefugten Zugriff auf geschützte Computer und Computerschädigung
Mit der Zeit geriet die Grundlage des Falls in Vergessenheit und wurde durch die Annahme ersetzt, es habe sich um einen Pirateriefall gehandelt, doch tatsächlich ging es um unbefugten Zugriff
Wenn Zuckerberg dafür nicht hart bestraft wird, hoffe ich wenigstens, dass daraus ein juristischer Präzedenzfall entsteht, der allen anderen dasselbe erlaubt
Alle künftigen Aaron Swartz sollten wissenschaftliche Aufsätze frei mit der ganzen Welt teilen dürfen
Ich kenne persönlich einen Ingenieur, dem aufgetragen wurde, etwas zu tun, obwohl klar war, dass es viele rechtliche Probleme geben würde, mit der Begründung, genau dafür habe die Firma ja Anwälte
Whistleblowing ist bei der aktuellen Wirtschaftslage auch keine attraktive Option, aber ich wünschte trotzdem, mehr Menschen würden es tun
Also lautet das Motto jetzt: „move fast and steal things“?
Die Geschwindigkeit, mit der sie Websites durchforsteten und absaugten, lag weit über allem, was man bei sogenannten legitimen Crawlern sieht, und das schien die plausibelste Erklärung zu sein
Ob der CEO es genehmigt hat oder ein anderer hochrangiger Mitarbeiter, wird an der Haftung des Unternehmens wohl nichts ändern
Die zu beantwortende Frage ist, ob so etwas stattgefunden hat und falls ja, ob es eine Urheberrechtsverletzung ist, die nicht durch Fair Use geschützt ist, nicht welcher Unternehmensmanager das genehmigt hat
Aaron Swartz sah sich mit mehreren Jahren Gefängnis bedroht, weil er wissenschaftliche Zeitschriftenartikel herunterladen und der Welt kostenlos zugänglich machen wollte, ohne daran zu verdienen, und nahm sich am Ende das Leben
Wenn dagegen ein Milliardenunternehmen Millionen urheberrechtlich geschützter Werke herunterlädt, mit diesem Datensatz eine neue Art von KI-Modell trainiert und damit den gesamten Arbeitsmarkt umkrempeln will, gilt das einfach als Silicon-Valley-Innovation und bekommt beinahe noch einen Orden dafür
Ich bezweifle, dass Meta seine lokalen Kopien gelöscht hat
Man sollte sich gegen solche Gesetze und diese Behandlung wenden, statt sie als Werkzeug zur Vergeltung gegen andere einzusetzen
Zu fordern, dass alle gleichermaßen ungerecht behandelt werden, ist falsch. Besser wäre es, die schlechten Gesetze und Strukturen abzuschaffen