Künstliche Intelligenz kann ohne menschliches Wissen nicht gedeihen – eine Entschädigung der ursprünglichen Entwickler ist unerlässlich

- Das Training von KI-Modellen erfordert große Datensätze, und es ist von Vorteil, wenn diese auf menschlichem Wissen basieren.
- Zeitungen und Forschungsorganisationen sowie Webportale verwenden ihre Ressourcen für das Sammeln und Veröffentlichen von Informationen.
- Eine Entschädigung der ursprünglichen Urheber von Inhalten ist unerlässlich, da KI-Firmen mittlerweile Inhalte von Unternehmen lizenzieren.
Das Training von KI-Modellen erfordert riesige Datenmengen, und ihre Leistungsfähigkeit hängt direkt von den Trainingsdaten ab. Informationen sind nicht kostenlos, und es geht hier um zahlreiche geistige Eigentumsrechte.
Doch KI-Firmen denken nicht so; sie betrachten das gesamte Wissen, das Generationen von Autoren geschaffen haben, als selbstverständlich; ihr Verständnis von Fair Use hat sich ebenfalls verändert; und sie zahlen nicht gern an die Urheber der Inhalte, die die Grundlage für ihre heutigen Fähigkeiten bildeten.
Diebstahl menschlichen Wissens
Die Erstellung der Inhalte, die wir in Zeitungen, Zeitschriften, Büchern, Online-Archiven und Forschungsarbeiten sehen, erfordert viel harte Arbeit und Schweiß, aber das wäre nicht möglich ohne Autoren, Redakteure, Forscher und Verleger, die diese Inhalte in verschiedenen Formen der Öffentlichkeit zugänglich gemacht haben.
Solch hart erarbeitete Anerkennung und dieses Wissen sollten nicht einfach so von einem Unternehmen ausgenutzt werden können, wie es in einem Fall geschehen ist.
„Informationen, die im Internet öffentlich zugänglich sind.“
Quelle: OpenAI.
Ja, genau das sagt OpenAI, wenn man es nach den Inhalten fragt, mit denen es seine KI-Systeme trainiert hat, sowie nach den Informationen, die es von Dritten lizenziert hat, und den Informationen, die seine Benutzer und menschlichen Trainer bereitstellen.
Was die lizenzierten Inhalte betrifft, so suchen Unternehmen derzeit danach, aber es liegen uns keine Informationen darüber vor, ob OpenAI vor der Veröffentlichung seines ersten GPT-Modells Informationen von einem Anbieter lizenziert hat. Das Modell muss mit urheberrechtlich geschütztem Material trainiert worden sein, dessen kommerzielle Nutzung nicht frei war.

Entschädigung für die Urheber
Bis vor einem Jahr wurde der Großteil der online und offline verfassten Texte von Menschenhand erstellt. Zwar gab es neben reißerischen Artikeln auch minderwertige Inhalte, doch diese stammten zumindest von Menschen, die die menschliche Psyche und Denkprozesse verstanden, und auf Basis solcher Erkenntnisse wurden generative KI-Anwendungen entwickelt.
Unternehmen stehen heute vor einem neuen Problem beim Training ihrer KI-Modelle: dem maschinell generierten Inhalt, der das gesamte Internet dominiert und keinesfalls als qualitativ hochwertig gilt. Dieser Inhalt belastet die verfügbaren Trainingsressourcen, da die Modelle keine qualitativ hochwertigen Ergebnisse liefern können, wenn sie mit nutzlosem, wortreichem Material trainiert werden – und genau so produzieren diese Modelle üblicherweise Inhalte. Dieses gegenseitige Klonen von KI-Modellen wird oft als KI-Kannibalismus oder KI-Klonen bezeichnet.
Um dies zu verhindern, müssen KI-Unternehmen ihre Quellen auf glaubwürdige Quellen beschränken. Dazu gehören vor allem Zeitungen, Zeitschriften und öffentliche Foren, die eine Fülle von menschengeneriertem Wissen bergen. Wie bereits erwähnt, gibt es noch einige weitere Quellen, doch diese Notwendigkeit und Klagen von Zeitungen haben sie gezwungen, Inhalte zu lizenzieren und für deren Nutzung zu bezahlen.
Unternehmen wie Reddit, ein großes webbasiertes öffentliches Forum, erwägen ebenfalls, ihre Inhalte an KI-Firmen zu lizenzieren. In einer Stellungnahme hieß es, man bevorzuge zwar geschäftliche Lösungen gegenüber Rechtsstreitigkeiten, schloss Klagen aber nicht aus, falls die Verhandlungen scheitern sollten. Wenn es Ihnen nicht erlaubt ist, einen urheberrechtlich geschützten Soundtrack in Ihr YouTube-Video einzubindentracwarum sollte es dann einem KI-Unternehmen erlaubt sein, diesen für das Training seiner Modelle zur kommerziellen Nutzung zu verwenden?
Das Urheberrecht stellt hier ein Problem dar, da KI-Firmen es immer wieder verletzen. Andererseits ist KI nicht in der Lage, selbstständig neue Nachrichten zu sammeln. Es bedarf menschlicher Anstrengung, Nachrichten zu recherchieren und aus verschiedenen Quellen zu bestätigen, bevor sie veröffentlicht werden. Erst dann kann ein KI-Modell diese Informationen nutzen. Die fehlende Vergütung dieser menschlichen Arbeitskraft stellt Ausbeutung dar.
Die klügsten Köpfe der Krypto-Szene lesen bereits unseren Newsletter. Möchten Sie auch dabei sein? Dann schließen Sie sich ihnen an.
Haftungsausschluss: Die bereitgestellten Informationen stellen keine Anlageberatung dar. Cryptopolitanübernimmt keine Haftung für Investitionen, die auf Grundlage der Informationen auf dieser Seite getätigt werden. Wirtronempfehlen dringend, vor jeder Anlageentscheidung eigene Recherchen durchzuführendent /oder einen qualifizierten Fachmann zu konsultieren

Aamir Sheikh
Aamir ist Technologiejournalist mit fast sechs Jahren Erfahrung in der Krypto- und Technologiebranche. Er absolvierte die MAJ University mit einem MBA in Finanzen und Marketing. Derzeit arbeitet er für Cryptopolitan, wo er über die neuesten Entwicklungen auf den Kryptowährungsmärkten und Preisprognosen berichtet.
CRASH-KURS
- Mit welchen Kryptowährungen kann man Geld verdienen?
- Wie Sie Ihre Sicherheit mit einer digitalen Geldbörse erhöhen können (und welche sich tatsächlich lohnen)
- Wenig bekannte Anlagestrategien, die Profis anwenden
- Wie man mit dem Investieren in Kryptowährungen beginnt (welche Börsen man nutzen sollte, welche Kryptowährung am besten zum Kauf geeignet ist usw.)















