NEUESTE NACHRICHTEN
FÜR SIE AUSGEWÄHLT
WÖCHENTLICH
BLEIBEN SIE AN DER SPITZE

Die besten Krypto-Einblicke direkt in Ihren Posteingang.

Neue Forschungsergebnisse zeigen, dass KI-Unternehmen für ihre Trainingsdaten auf Premium-Verlage angewiesen sind

VonBrenda KananaBrenda Kanana
Lesezeit: 2 Minuten
KI-Roboter und Logos großer Medienunternehmen im Hintergrund
  • OpenAI und Google, zwei führende KI-Unternehmen, nutzen Artikel aus führenden Veröffentlichungskanälen, um Sprachmodelle zu trainieren.
  • Einer Studie von Ziff Davis zufolge werden die Quellen anhand der Suchergebnisse gefiltert.
  • Verlage befürchten, dass KI-Unternehmen ihre Inhalte ohne Erlaubnis verwenden.

Große Technologieunternehmen wie OpenAI, Google, Meta und Anthropic verwenden hochwertiges, urheberrechtlich geschütztes Material von namhaften Verlagen, um ihre großen Sprachmodelle (LLMs) zu trainieren. 

Dies geht aus einer Studie von Ziff Davis, dem Mutterkonzern von CNET, IGN und Mashable, hervor. Die Studie belegt die entscheidende Rolle, die qualitativ hochwertige Inhalte beim Training von KI-Modellen spielen. Sie zeigt, dass KI-Unternehmen für ihre Trainingsdatensätze zwar auf autoritative Quellen zurückgreifen, um die Modellleistung zu verbessern, deren Beitrag jedoch häufig vernachlässigt wird.

In der Studie behaupteten George Wukoson, KI-Anwalt von Ziff Davis, und der CTO Joey Fortuna, dass KI-Unternehmen Trainingsdaten anhand des Rankings autoritativer Websites mit hohen Suchmaschinenplatzierungen auswählen. Hochwertige und populäre Websites würden zur Verbesserung der Modelle herangezogen, da sie einen guten Ruf genießen. Laut der Studie ermöglicht diese Strategie den KI-Entwicklern, das Sprachmodell zu optimieren.

Ziff Davis hat darauf hingewiesen, dass führende Content-Anbieter wie Axel Springer, Future PLC, Hearst, News Corp und die New York Times unter anderem zur Entwicklung von Trainingsdatensätzen beigetragen haben. Insbesondere wurdedent, dass 12,04 % von OpenWebText2, das für die Erstellung von OpenAIs GPT-3 verwendet wurde, von diesen vertrauenswürdigen Verlagen stammen.

Mark Zuckerberg äußerte sich ebenfalls zur laufenden Debatte um die Nutzung von Inhalten im KI-Training. In einem kürzlich geführten Interview mit The Verge räumte Zuckerberg ein, dass das Sammeln von Daten für KI eine Herausforderung darstelle, wies aber auch darauf hin, dass die Inhalte einzelner Urheber oder Verlage möglicherweise nicht so wirkungsvoll seien. Er erklärte: „Ich denke, einzelne Urheber oder Verlage neigen dazu, den Wert ihrer spezifischen Inhalte im Gesamtkontext zu überschätzen.“ 

Verlage reichen Klagen gegen KI-Unternehmen ein

Die Geheimhaltung der Trainingsdatenquellen hat bei Verlagen und Verbrauchern gleichermaßen Besorgnis ausgelöst. Die New York Times und das Wall Street Journal haben kürzlich Klagen gegen KI-Unternehmen eingereicht, da diese durch die Verwendung ihrer Inhalte Urheberrechte verletzt hätten. 

Während OpenAI verstärkte Bemühungen unternommen hat, Lizenzen für Inhalte von Medienunternehmen wie der Financial Times und DotDash Meredith zu erhalten, arbeiten mehrere KI-Firmen weiterhin ohne entsprechende Lizenzen. Der Bericht stellt außerdem fest, dass „große LLM-Entwickler ihre Trainingsdaten nicht mehr so ​​offenlegen wie früher“. 

Während die Werte von KI-Unternehmen steigen, bleibt die Kluft zwischen Technologiegiganten und traditionellen Medienunternehmen enorm. Tech-Giganten wie Google und Meta, deren Wert auf 2,2 Billionen bzw. 1,5 Billionen US-Dollar geschätzt wird, sind weiterhin führend im Bereich der generativen KI, während Startups wie OpenAI und Anthropic mit 157 Milliarden bzw. 40 Milliarden US-Dollar bewertet werden. 

 Andererseits sehen sich Verlage weiterhin mit Entlassungen und Umstrukturierungen konfrontiert, was den finanziellen Druck verdeutlicht, sich an ein zunehmend von KI defiUmfeld anzupassen. Aufgrund des Wettbewerbs mit nutzergenerierten und KI-basierten Inhalten stehen zahlreiche Verlage vor der Herausforderung, Kosten und Personal zu reduzieren.

Wenn Sie das hier lesen, sind Sie schon einen Schritt voraus. Bleiben Sie mit unserem Newsletter auf dem Laufenden.

Diesen Artikel teilen

Haftungsausschluss. Die bereitgestellten Informationen stellen keine Anlageberatung dar. Cryptopolitan/ übernimmt keine Haftung für Investitionen, die auf Grundlage der Informationen auf dieser Seite getätigt werden. Wirtronempfehlen dringend, vor jeder Anlageentscheidung eigene Recherchen durchzuführendent oder einen qualifizierten Fachmann zu konsultieren

Brenda Kanana

Brenda Kanana

Brenda verfügt über mehr als vier Jahre Erfahrung in den Bereichen Kryptowährung, künstliche Intelligenz und Zukunftstechnologien. Sie arbeitete bereits für Zycrypto, Blockchain Reporter und The Coin Republic und ist nun bei Cryptopolitan tätig. Ihr Soziologiestudium an der Technischen Universität Mombasa ermöglicht es ihr, stets am Puls ihrer Leserschaft zu sein.

MEHR … NACHRICHTEN
DEEP CRYPTO
CRASH-KURS