Meta Platforms trainierte seine KI-Modelle mit Raubkopien urheberrechtlich geschützter Bücher – mit der Zustimmung seines CEO Mark Zuckerberg.
Laut neu veröffentlichten Gerichtsakten behauptet eine Gruppe von Autoren, dass der Social-Media-Riese wusste, dass sie raubkopierte Werke zum Trainieren ihrer KI-Systeme verwendeten.
Interne Dokumente von Meta „enthüllen“ die Behauptungen
In ihrer Klageschrift gaben die Autoren an, dass interne Dokumente, die Meta im Rahmen des Beweisaufnahmeverfahrens vorgelegt hatte, belegten, dass das soziale Netzwerk von den Raubkopien der Bücher wusste. Laut „ The Guardian“ befürwortete CEO Zuckerberg die Nutzung des LibGen-Datensatzes, eines riesigen Online-Archivs von Büchern. Dies geschah trotz Warnungen innerhalb des KI-Führungsteams des Unternehmens, dass es sich um einen Datensatz handele, „von dem wir wissen, dass er raubkopiert wird“.
Der US-amerikanische Autor Ta-Nehisi Coates, die Komikerin Sarah Silverman und andere Schriftsteller, die das Unternehmen wegen Urheberrechtsverletzung verklagen, erhoben diese Anschuldigungen in Schriftsätzen, die am Mittwoch vor einem kalifornischen Bundesgericht veröffentlicht wurden.
Die Autoren verklagten Meta im Jahr 2023 mit der Begründung, das Social-Media-Unternehmen missbrauche ihre Bücher, um KI-Modelle, insbesondere Llama, das große Sprachmodell, das die Chatbots des Unternehmens antreibt, zu trainieren.
Die aus Russland stammende Library Genesis oder LibGen-Datenbank ist eine „Schattenbibliothek“, die nach eigenen Angaben Millionen von Romanen, Informationsbroschüren sowie wissenschaftlichen Zeitschriftenartikeln enthält.
Im Jahr 2024 forderte ein Bundesgericht in New York die anonymen Betreiber von LibGen auf, einer Gruppe von Verlagen 30 Millionen US-Dollar Schadenersatz wegen Urheberrechtsverletzung
Dies ist nur einer von vielen Fällen, in denen behauptet wird, dass urheberrechtlich geschützte Werke von Autoren, Künstlern und anderen ohne deren Zustimmung zum Training von KI-Tools wie dem Chatbot ChatGPT verwendet wurden. Kreative Fachleute warnen davor, dass die unbefugte Nutzung ihrer Werke ihre Geschäftsmodelle gefährdet.
Laut Reuters argumentieren die Angeklagten jedoch, dass sie urheberrechtlich geschütztes Material im Rahmen des Fair Use verwendet hätten.
Der Richter gestattete den Autoren, eine geänderte Klage einzureichen
Im Fall Meta beantragten die Autoren am Mittwoch beim Gericht die Zulassung einer aktualisierten Klage. Sie führten an, dass neue Beweise zeigten, dass Social-Media-Unternehmen den KI-Trainingsdatensatz LibGen, der Millionen raubkopierter Werke enthält, nutzten und über Peer-to-Peer-Torrents verbreiteten.
Laut ihren Angaben genehmigte Zuckerberg „Metas Verwendung des LibGen-Datensatzes trotz Bedenken innerhalb des KI-Führungsteams von Meta (und anderer Mitarbeiter bei Meta), dass LibGen ein Datensatz ist, von dem wir wissen, dass er illegal kopiert wurde.“
In der Akte wird auch ein Memo zitiert, in dem auf Zuckerbergs Initialen Bezug genommen wird, und es wird vermerkt, dass „nach Eskalation an MZ“ das KI-Team von Meta „die Genehmigung zur Nutzung von LibGen erhalten hat“
Im vergangenen Jahr wies der US-Bezirksrichter Vince Chhabria Klagen ab, wonach von Metas KI-Modellen generierte Texte die Urheberrechte der Autoren verletzten und Meta unrechtmäßig die Urheberrechtsinformationen von Büchern entfernt habe. Diese Informationen umfassen Titel, Namen des Autors und des Urheberrechtsinhabers.
Den Klägern wurde jedoch gestattet, ihre Klage zu ändern. In ihren Ausführungen diese Woche erklärten die Autoren, die Beweise stützten ihre Ansprüche wegen Urheberrechtsverletzung und rechtfertigten die Wiederaufnahme ihres Verfahrens bezüglich urheberrechtlich geschützter Verwaltungsinformationen, ergänzt um den Vorwurf des Computerbetrugs.
Während einer Anhörung am Donnerstag erklärte der Richter, er werde den Autoren die Einreichung einer geänderten Klage gestatten, obwohl er Zweifel an der Stichhaltigkeit der Betrugsvorwürfe habe.

