NEUESTE NACHRICHTEN
FÜR SIE AUSGEWÄHLT
WÖCHENTLICH
BLEIBEN SIE AN DER SPITZE

Die besten Krypto-Einblicke direkt in Ihren Posteingang.

Laut Gerichtsakten diskutierten Mitarbeiter von Meta die Verwendung urheberrechtlich geschützter Inhalte für das KI-Training

VonOwotunse AdebayoOwotunse Adebayo
3 Minuten Lesezeit
Laut Gerichtsakten diskutierten Mitarbeiter von Meta die Verwendung urheberrechtlich geschützter Inhalte für das KI-Training
  • Aus Gerichtsdokumenten geht hervor, dass Mitarbeiter von Meta die Verwendung urheberrechtlich geschützter Inhalte zum Trainieren ihrer künstlichen Intelligenzmodelle (KI) diskutierten.
  • Interne Arbeitschats zeigten auch, wie das Unternehmen möglicherweise rechtlich heikle Inhalte verwendet hat, um seine KI-Modelle zu trainieren.
  • Aus den Gerichtsakten gingen weitere Verstöße hervor, woraufhin die Kläger ihre Klage änderten.

Gerichtsdokumente belegen, dass Mitarbeiter von Meta die Verwendung urheberrechtlich geschützter Inhalte zum Trainieren ihrer KI-Modelle diskutiert haben. Laut den jüngsten Gerichtsdokumenten bezogen sich die meisten Diskussionen auf Inhalte, die auf rechtlich fragwürdige Weise beschafft wurden.

Die Dokumente wurden von den Klägern im Fall Kadrey gegen Meta zur Verfügung gestellt, einem der zahlreichen Urheberrechtsstreitigkeiten im Bereich KI, die vor US-Gerichten verhandelt wurden. Laut Meta fällt die Verwendung urheberrechtlich geschützter Werke, insbesondere von Büchern, zum Trainieren ihrer Modelle unter die Fair-Use-Regelung. Die Kläger, angeführt von Sarah Silverman und Ta-Nehisi Coates, widersprechen dieser Darstellung des Unternehmens jedoch.

Laut zuvor eingereichten Dokumenten genehmigte Meta-CEO Mark Zuckerberg dem KI-Team des Unternehmens die Verwendung urheberrechtlich geschützter Inhalte zum Trainieren seiner Modelle. Die Dokumente belegen weiterhin, dass das Unternehmen auch die Verhandlungen über Datenlizenzen mit Buchverlagen abgebrochen hat.

Meta verwendet angeblich urheberrechtlich geschützte Inhalte, um seine KI-Modelle zu trainieren

Laut neuen Unterlagen zeigen interne Arbeitschats, die zwischen Mitarbeitern von Meta ausgetauscht wurden, ein klares Bild davon, wie das Unternehmen möglicherweise urheberrechtlich geschützte Daten zum Trainieren seiner KI-Modelle verwendet hat, darunter die meisten Modelle der Llama-Familie.

In einem der Chats war Melanie Kambadur, eine leitende Angestellte von Meta und Senior Managerin des Llama-Forschungsteams, beteiligt. Sie sprach darin über das Training der KI-Modelle mit Inhalten, die rechtlich nicht gerechtfertigt waren.

„Meine Meinung wäre (frei nach dem Motto ‚Lieber um Verzeihung bitten als um Erlaubnis fragen‘): Wir versuchen, die Bücher zu beschaffen und die Angelegenheit an die Geschäftsleitung weiterzuleiten, damit diese die Entscheidung trifft“, sagte Meta-Forschungsingenieur Xavier Martinet laut den Akten in einem Chat vom Februar 2023. „Deshalb wurde diese KI-Organisation gegründet: damit wir weniger risikoscheu sein können“, fügte er hinzu.

Martinet erwähnte, dass das Unternehmen einfach E-Books zum Einzelhandelspreis kaufen könnte, um den Trainingsdatensatz zu erstellen, anstatt Lizenzverträge mit verschiedenen Verlagen abzuschließen. Ein anderer Mitarbeiter warnte zwar vor der Verwendung solcher Inhalte und den damit verbundenen rechtlichen Konsequenzen, doch Martinet merkte an, dass andere Firmen wahrscheinlich ebenfalls Raubkopien für Schulungszwecke verwenden würden.

Im selben Chat erwähnte Kambadur, dass das Unternehmen mit einigen Plattformen über Lizenzen verhandele. Er merkte jedoch an, dass die Nutzung öffentlich zugänglicher Daten zwar Genehmigungen erfordere, die Anwälte des Unternehmens aber weniger zurückhaltend seien als früher. „Der Unterschied ist jetzt, dass wir mehr Geld, mehr Anwälte und mehr Unterstützung im Bereich Geschäftsentwicklung haben, die Möglichkeit, Prozesse zu tracund zu eskalieren, und dass unsere Anwälte bei Genehmigungen etwas weniger vorsichtig sind“, sagte Kambadur.

Mitarbeiter diskutieren die Verwendung von Libgen

Laut den Akten belegen weitere Chatprotokolle, dass Kambadur die Nutzung von Libgen, einer Aggregator-Website, die Links zu urheberrechtlich geschützten Inhalten von Verlagen bereitstellt, als Datenquelle für Meta als Lizenzierungsmöglichkeit erwog. Libgen wurde bereits mehrfach wegen Urheberrechtsverletzungen verklagt und zur Einstellung seiner Dienste gezwungen.

Während ein anderer Kollege im Chat ein Bild postete und dazu schrieb: „Nein, Libgen ist nicht legal“, schien es, als befürchteten einige Führungskräfte, dass ein Verzicht auf Libgen die Wettbewerbsfähigkeit des Unternehmens im KI-Wettlauf beeinträchtigen könnte. In einer E-Mail von Sony Theakanath, Produktmanagement-Direktor bei Meta, an Joelle Pineau, Vizepräsidentin für KI bei Meta, betonte er, dass Libgen wichtig sei, um in allen Kategorien Bestleistungen zu erzielen.

Theakanath sprach auch über verschiedene Möglichkeiten, wie das Unternehmen das rechtliche Risiko minimieren könnte, darunter die Entfernung von Daten, die als gestohlen/piratiert gekennzeichnet wurden, und das Unterlassen der öffentlichen Nennung anderer Nutzungsarten. „Wir würden die Verwendung der für das Training verwendeten Libgen-Datensätze nicht offenlegen“, sagte er. In der Praxis bedeutete dies, dass das Unternehmen zunächst die Libgen-Dateien auf „gestohlene oder raubkopierte“ Werke überprüfen würde.

Gerichtsdokumente enthüllen weitere Verstöße

In einem der Arbeitsgespräche schlug Kambadur außerdem vor, dass das Meta AI-Team die Modelle so einstellen sollte, dass sie „riskante IP-Abfragen vermeiden“. Dies würde die Modelle so konfigurieren, dass sie keine Antworten an Benutzer geben, die wissen möchten, mit welchen E-Books die Modelle trainiert wurden.

Die Unterlagen enthüllten auch weitere Details. So zeigte sich unter anderem, dass Meta möglicherweise Reddit -Daten verwendet hatte, um sein Modell so zu trainieren, dass es das Verhalten der Drittanbieter-Anwendung Pushshift nachahmte. Reddit hatte im April 2023 in einer Erklärung angekündigt, KI-Unternehmen künftig Gebühren für den Zugriff auf Trainingsdaten in Rechnung zu stellen.

Die Kläger im vorliegenden Fall haben ihre Klage seit Klageerhebung im Jahr 2023 mehrfach geändert. Die Klage wurde beim US-Bezirksgericht für den nördlichen Bezirk von Kalifornien in San Francisco eingereicht. In der jüngsten Änderung behaupten die Kläger, Meta habe Raubkopien mit urheberrechtlich geschützten Büchern abgeglichen, um zu prüfen, ob ein Lizenzvertrag sinnvoll wäre . Meta selbst betrachtet den Fall als juristisch brisant und hat zwei auf den Obersten Gerichtshof spezialisierte Anwälte in sein Verteidigungsteam aufgenommen.

Wenn Sie das hier lesen, sind Sie schon einen Schritt voraus. Bleiben Sie mit unserem Newsletter auf dem Laufenden.

Diesen Artikel teilen

Haftungsausschluss. Die bereitgestellten Informationen stellen keine Anlageberatung dar. Cryptopolitan/ übernimmt keine Haftung für Investitionen, die auf Grundlage der Informationen auf dieser Seite getätigt werden. Wirtrondentdentdentdentdentdentdentdent oder einen qualifizierten Fachmann zu konsultieren

MEHR … NACHRICHTEN
DEEP CRYPTO
CRASH-KURS