NEUESTE NACHRICHTEN

live LIVE: Die US-Notenbank Federal Reserve belässt die Zinssätze in Kevin Warshs erster Sitzung unverändert

17. Juni 2026 – Live-Updates
CZ argumentiert, dass KI-Agenten Milliarden von Menschen weltweit den Zugang zu kryptobasierten Finanzdienstleistungen ermöglichen werden

Nachrichten vor 2 Stunden
Solana führt alle Blockchains hinsichtlich der Anzahl realer Vermögensinhaber an und gestaltet die Wettbewerbslandschaft der Tokenisierung neu

Nachrichten vor 3 Stunden
OpenAI führt tracund Ausgabenlimits für ChatGPT Enterprise ein

Vor 5 Stunden Technik

FÜR SIE AUSGEWÄHLT

WÖCHENTLICH

BLEIBEN SIE AN DER SPITZE

Die besten Krypto-Einblicke direkt in Ihren Posteingang.

Neue Forschungsergebnisse zeigen, dass KI-Unternehmen für ihre Trainingsdaten auf Premium-Verlage angewiesen sind

Von

Brenda Kanana

Lesezeit: 2 Minuten , 9. November 2024

KI-Roboter und Logos großer Medienunternehmen im Hintergrund

OpenAI und Google, zwei führende KI-Unternehmen, nutzen Artikel aus führenden Veröffentlichungskanälen, um Sprachmodelle zu trainieren.
Einer Studie von Ziff Davis zufolge werden die Quellen anhand der Suchergebnisse gefiltert.
Verlage befürchten, dass KI-Unternehmen ihre Inhalte ohne Erlaubnis verwenden.

Große Technologieunternehmen wie OpenAI, Google, Meta und Anthropic verwenden hochwertiges, urheberrechtlich geschütztes Material von namhaften Verlagen, um ihre großen Sprachmodelle (LLMs) zu trainieren.

Dies geht aus einer Studie von Ziff Davis, dem Mutterkonzern von CNET, IGN und Mashable, hervor. Die Studie belegt die entscheidende Rolle, die qualitativ hochwertige Inhalte beim Training von KI-Modellen spielen. Sie zeigt, dass KI-Unternehmen für ihre Trainingsdatensätze zwar auf autoritative Quellen zurückgreifen, um die Modellleistung zu verbessern, deren Beitrag jedoch häufig vernachlässigt wird.

In der Studie behaupteten George Wukoson, KI-Anwalt von Ziff Davis, und der CTO Joey Fortuna, dass KI-Unternehmen Trainingsdaten anhand des Rankings autoritativer Websites mit hohen Suchmaschinenplatzierungen auswählen. Hochwertige und populäre Websites würden zur Verbesserung der Modelle herangezogen, da sie einen guten Ruf genießen. Laut der Studie ermöglicht diese Strategie den KI-Entwicklern, das Sprachmodell zu optimieren.

Ziff Davis hat darauf hingewiesen, dass führende Content-Anbieter wie Axel Springer, Future PLC, Hearst, News Corp und die New York Times unter anderem zur Entwicklung von Trainingsdatensätzen beigetragen haben. Insbesondere wurdedent, dass 12,04 % von OpenWebText2, das für die Erstellung von OpenAIs GPT-3 verwendet wurde, von diesen vertrauenswürdigen Verlagen stammen.

Mark Zuckerberg äußerte sich ebenfalls zur laufenden Debatte um die Nutzung von Inhalten im KI-Training. In einem kürzlich geführten Interview mit The Verge räumte Zuckerberg ein, dass das Sammeln von Daten für KI eine Herausforderung darstelle, wies aber auch darauf hin, dass die Inhalte einzelner Urheber oder Verlage möglicherweise nicht so wirkungsvoll seien. Er erklärte: „Ich denke, einzelne Urheber oder Verlage neigen dazu, den Wert ihrer spezifischen Inhalte im Gesamtkontext zu überschätzen.“

Verlage reichen Klagen gegen KI-Unternehmen ein

Die Geheimhaltung der Trainingsdatenquellen hat bei Verlagen und Verbrauchern gleichermaßen Besorgnis ausgelöst. Die New York Times und das Wall Street Journal haben kürzlich Klagen gegen KI-Unternehmen eingereicht, da diese durch die Verwendung ihrer Inhalte Urheberrechte verletzt hätten.

Während OpenAI verstärkte Bemühungen unternommen hat, Lizenzen für Inhalte von Medienunternehmen wie der Financial Times und DotDash Meredith zu erhalten, arbeiten mehrere KI-Firmen weiterhin ohne entsprechende Lizenzen. Der Bericht stellt außerdem fest, dass „große LLM-Entwickler ihre Trainingsdaten nicht mehr so offenlegen wie früher“.

Während die Werte von KI-Unternehmen steigen, bleibt die Kluft zwischen Technologiegiganten und traditionellen Medienunternehmen enorm. Tech-Giganten wie Google und Meta, deren Wert auf 2,2 Billionen bzw. 1,5 Billionen US-Dollar geschätzt wird, sind weiterhin führend im Bereich der generativen KI, während Startups wie OpenAI und Anthropic mit 157 Milliarden bzw. 40 Milliarden US-Dollar bewertet werden.

Andererseits sehen sich Verlage weiterhin mit Entlassungen und Umstrukturierungen konfrontiert, was den finanziellen Druck verdeutlicht, sich an ein zunehmend von KI defiUmfeld anzupassen. Aufgrund des Wettbewerbs mit nutzergenerierten und KI-basierten Inhalten stehen zahlreiche Verlage vor der Herausforderung, Kosten und Personal zu reduzieren.

Wenn Sie das hier lesen, sind Sie schon einen Schritt voraus. Bleiben Sie mit unserem Newsletter auf dem Laufenden.

Google Meta OpenAI

Diesen Artikel teilen

Haftungsausschluss. Die bereitgestellten Informationen stellen keine Anlageberatung dar. Cryptopolitan/ übernimmt keine Haftung für Investitionen, die auf Grundlage der Informationen auf dieser Seite getätigt werden. Wirtronempfehlen dringend, vor jeder Anlageentscheidung eigene Recherchen durchzuführendent oder einen qualifizierten Fachmann zu konsultieren

Brenda Kanana

Brenda verfügt über mehr als vier Jahre Erfahrung in den Bereichen Kryptowährung, künstliche Intelligenz und Zukunftstechnologien. Sie arbeitete bereits für Zycrypto, Blockchain Reporter und The Coin Republic und ist nun bei Cryptopolitan tätig. Ihr Soziologiestudium an der Technischen Universität Mombasa ermöglicht es ihr, stets am Puls ihrer Leserschaft zu sein.

INHALTSVERZEICHNIS

1. Verlage reichen Klagen gegen KI-Unternehmen ein

Diesen Artikel teilen

MEHR … NACHRICHTEN

ALLE ANZEIGEN

Was ist Base? Das von Coinbase ins Leben gerufene Ethereum Layer-2-Netzwerk

21. Oktober 2025 Krypto lernen: Leitfaden für Anfänger
Dogecoin vs. Bitcoin: Wichtigste technische Unterschiede

20. Oktober 2025 Krypto lernen: Leitfaden für Anfänger
Was ist TVL (Total Value Locked) bei Kryptowährungen?

14. Oktober 2025 Krypto lernen: Leitfaden für Anfänger
Wie liest man ein Krypto-Whitepaper?

13. Oktober 2025 Krypto lernen: Leitfaden für Anfänger
Ripple vs. XRP vs. XRP Ledger: Was ist der Unterschied?

13. Oktober 2025 Krypto lernen: Leitfaden für Anfänger
Was ist eine Multisig-Wallet im Kryptobereich?

10. Oktober 2025 Krypto lernen: Leitfaden für Anfänger

DEEP CRYPTO
CRASH-KURS

Mit welchen Kryptowährungen kann man Geld verdienen?
Wie Sie Ihre Sicherheit mit einer digitalen Geldbörse erhöhen können (und welche sich tatsächlich lohnen)
Wenig bekannte Anlagestrategien, die Profis anwenden
Wie man mit dem Investieren in Kryptowährungen beginnt (welche Börsen man nutzen sollte, welche Kryptowährung am besten zum Kauf geeignet ist usw.)

Neue Forschungsergebnisse zeigen, dass KI-Unternehmen für ihre Trainingsdaten auf Premium-Verlage angewiesen sind

Verlage reichen Klagen gegen KI-Unternehmen ein

5 geniale Anwendungsmöglichkeiten von ChatGPT und was Sie damit anfangen sollten

93 % der Unternehmensführer bevorzugen KI-gestützte Lösungen für das Nachhaltigkeitsmanagement von Marken, Reuters

So unterstützt Macron Frankreichs dynamisches und produktives KI-Ökosystem

Bloomberg schätzt, dass der Markt für generative KI bis 2032 ein Volumen von 1,3 Billionen US-Dollar erreichen wird

Ein prägnanter Brief.
Jeden Tag.

Neue Forschungsergebnisse zeigen, dass KI-Unternehmen für ihre Trainingsdaten auf Premium-Verlage angewiesen sind

Verlage reichen Klagen gegen KI-Unternehmen ein

5 geniale Anwendungsmöglichkeiten von ChatGPT und was Sie damit anfangen sollten

93 % der Unternehmensführer bevorzugen KI-gestützte Lösungen für das Nachhaltigkeitsmanagement von Marken, Reuters

So unterstützt Macron Frankreichs dynamisches und produktives KI-Ökosystem

Bloomberg schätzt, dass der Markt für generative KI bis 2032 ein Volumen von 1,3 Billionen US-Dollar erreichen wird

Ein prägnanter Brief.Jeden Tag.

Ein prägnanter Brief.
Jeden Tag.