Your bank is using your money. You’re getting the scraps.WATCH FREE

NVIDIA steht wegen des mutmaßlichen unlizenzierten Datensammelns für KI-Modelle unter Beobachtung

In diesem Beitrag:

  • Durchgesickerte Dokumente zeigen, dass NVIDIA ohne Zustimmung Daten aus Filmen und YouTube-Videos gesammelt hat.
  • NVIDIA behauptet, das Daten-Scraping sei gemäß den Bestimmungen zur fairen Nutzung legal.
  • Interne Mitteilungen zeigen, dass einige Mitarbeiter Bedenken hinsichtlich rechtlicher Fragen hatten.

Aus durchgesickerten Dokumenten, die 404 Media zugespielt wurden, geht hervor, dass NVIDIA unlizenzierte Datensammlung betrieben und Film- und Spielmaterial aus dem gesamten Internet verwendet hat, um seine Produkte für künstliche Intelligenz zu trainieren. 

Die durchgesickerten Dokumente enthüllen, dass sie versuchten, ganze Filme von verschiedenen Anbietern, darunter Netflix, herunterzuladen, wobei ihr Hauptinteresse YouTube-Videos galt. Aus den von 404 Media erhaltenen E-Mails geht hervor, dass die Projektmanager planten, zwischen 20 und 30 virtuelle Maschinen auf Amazon Web Services einzusetzen, um täglich 80 Jahre Videomaterial abzurufen.

NVIDIA verteidigt sein Vorgehen und beruft sich auf die Bestimmungen zum fairen Gebrauch.

Data Scraping bezeichnet dastracvon Video-, Text- und Audioinhalten aus dem Internet ohne die Erlaubnis der Rechteinhaber, um KI-Modelle zu trainieren. Dies kann beispielsweise als die Nutzung urheberrechtlich geschützter Inhalte von Social-Media-Plattformen verstanden werden. 

NVIDIA hat erklärt, beim Daten-Scraping keine Urheberrechte verletzt zu haben. Das Unternehmen gab außerdem an, dass seine Aktivitäten unter die Fair-Use-Doktrin fallen, da es urheberrechtlich geschütztes Material zum Training von KI verwendet.

Aus internen Kommunikationsunterlagen, die 404 Media vorliegen, geht hervor, dass einige NVIDIA-Mitarbeiter Bedenken hinsichtlich dieser Datensammlungsaktivitäten äußerten. Projektmanager spielten diese Bedenken jedoch angeblich herunter und erklärten, rechtliche Bedenken, beispielsweise Verstöße gegen die Nutzungsbedingungen von YouTube, würden später behandelt. 

Siehe auch  Kasachstan führt sein erstes großes Sprachmodell ein

Ein Mitarbeiter wies darauf hin, dass die KI-Ingenieure von NVIDIA versuchten, so viele Spielclips wie möglich zu sammeln, um den Trainingsdatensatz anzureichern. Dazu wurde das Gameplay an NVIDIAs Cloud-Dienst GeForceNow gestreamt, um Gameplay-Videos in hoher defiaufzuzeichnen. Jim Fan, leitender Forschungsanalyst, betonte in internen Nachrichten ebenfalls die Wichtigkeit solcher Aufnahmen als Trainingsgrundlage für das KI-Modell.

Das Unternehmen ergreift Maßnahmen, um die öffentliche Wahrnehmung seiner Datenpraktiken zu steuern

Die Dokumente beschreiben auch NVIDIAs Versuche, den Schaden im Zusammenhang mit diesen Praktiken zu begrenzen. Laut durchgesickerten E-Mails empfahl Forschungs-Vizepräsident Ming-Yu Liu, dass das Unternehmen die Veröffentlichung von Dokumenten zu den Datenerfassungsmethoden vermeiden sollte, um öffentliche Kritik zu verhindern. NVIDIA entwickelte außerdem eigene Tools und API-Zugänge zur YouTube-Datenerfassung, um den Datenerfassungsprozess zu vereinfachen.

Die Rechtslage bezüglich der Regeln für den Einsatz von KI beim Web-Scraping ist noch immer unklar. Laut Robert Mahari vom MIT kann es recht kompliziert sein, nachzuweisen, dass tatsächlich Web-Scraping stattgefunden hat. Organisationen könnten davon profitieren, die Quellen ihrer Trainingsdaten nicht offenzulegen, da es ohne handfeste Beweise schwierig ist, Missbrauch nachzuweisen. 

Eine weitere Plattform, Suno, eine KI-basierte Musikgenerierungsplattform, geriet kürzlich in die Schlagzeilen, weil sie die Verwendung von Data Scraping zum Trainieren von KI-Modellen zugab. Wie Cryptopolitanbereits berichtete, erklärte Reddit-CEO Steve Huffman, dass das Unternehmen Microsoft und anderen KI-Firmen weiterhin Data Scraping untersagen werde, bis eine Zahlung erfolgt und Reddit die Kontrolle über die Datennutzung erlangt. Er betonte, dass Reddit Data Scraping zum Trainieren von KI-Modellen ohne die entsprechende Lizenz nicht zulassen werde. 

Siehe auch:  Google-Suchanfragen nach „KI“ übertreffen Bitcoin und Kryptowährungen im Jahr 2023

Die Kryptokarte ohne Ausgabenlimit. Erhalten Sie 3 % cash und zahlen Sie sofort mobil. Fordern Sie Ihre Ether.fi-Karte an.

Link teilen:

Haftungsausschluss. Die bereitgestellten Informationen stellen keine Anlageberatung dar. Cryptopolitan übernimmt keine Haftung für Investitionen, die auf Grundlage der Informationen auf dieser Seite getätigt werden. Wir empfehlen dringend, vor jeder Anlageentscheidung eigene Recherchen durchzuführen tron / oder einen qualifizierten Fachmann zu konsultieren dent

Meistgelesen

Meistgelesene Artikel werden geladen...

Bleiben Sie über Krypto-News auf dem Laufenden und erhalten Sie täglich Updates in Ihren Posteingang

Empfehlung der Redaktion

Artikel der Redaktionsauswahl werden geladen...

- Der Krypto-Newsletter, der Sie immer einen Schritt voraus hält -

Die Märkte bewegen sich schnell.

Wir sind schneller.

Abonnieren Sie Cryptopolitan Daily und erhalten Sie zeitnahe, prägnante und relevante Krypto-Einblicke direkt in Ihren Posteingang.

Jetzt anmelden und
keinen Film mehr verpassen.

Steig ein. Informiere dich.
Verschaffe dir einen Vorsprung.

Abonnieren Sie CryptoPolitan