in einer aktuellen juristischen Entwicklung, die in der KI-Community für Aufsehen gesorgt hat, eine umfassende Urheberrechtsklage gegen OpenAI
Die Klage wirft ihnen vor, mit ihren großen Sprachmodellen (LLMs), insbesondere GPT-4 und verwandten Produkten, ein Geschäftsmodell zu verfolgen, das auf massenhaften Urheberrechtsverletzungen beruht. Der Rechtsstreit hat die ethischen Bedenken hinsichtlich der Beschaffung von Trainingsdaten für generative KI-Modelle in den Vordergrund gerückt.
Vorwürfe der Urheberrechtsverletzung
Kern der Klage ist der Vorwurf, dass OpenAI und Microsoft urheberrechtlich geschützte Texte und andere Inhalte, darunter auch Inhalte der New York Times, ohne entsprechende Genehmigung zum Trainieren ihrer Sprachlernmodelle verwendet haben. Die Klage argumentiert, dass diese Sprachlernmodelle wiederholt wörtliche Zitate aus der New York Times und verschiedenen anderen Quellen reproduziert haben.
Die Klage unterstreicht eine wachsende Besorgnis in der KI-Community und darüber hinaus hinsichtlich der ethischen Beschaffung von Trainingsdaten für Lernmanagementsysteme. Sie wirft Fragen nach dem Ursprung der Trainingsdaten auf, ob diese gestohlenes geistiges Eigentum enthalten und wie sich dies auf die Urheber und Branchen auswirkt, die auf Originalinhalte angewiesen sind.
Auswirkungen auf Journalismus und Content-Erstellung
Die Klage unterstreicht die potenziell verheerenden Folgen von Urheberrechtsverletzungen durch KI für Content-Ersteller und den Journalismus. Sie argumentiert, dass die unerlaubte Übernahme von Ideen und Formulierungen durch KI-Plattformen wie Google und Bing die Monetarisierungsmöglichkeiten von Content-Anbietern untergräbt. Dies wiederum gefährdet die finanzielle Stabilität von Nachrichtenorganisationen und deren Fähigkeit, qualitativ hochwertigen Journalismus zu finanzieren.
In der Klage heißt es: „Der Schutz des geistigen Eigentums der Times ist entscheidend für ihre Fähigkeit, auch weiterhin erstklassigen Journalismus im öffentlichen Interesse zu finanzieren. Wenn die Times und vergleichbare Medien die Nutzung ihrer Inhalte nicht kontrollieren können, wird ihre Fähigkeit, diese Inhalte zu monetarisieren, beeinträchtigt.“.
Mit sinkenden Einnahmen stehen Nachrichtenorganisationen weniger Journalisten zur Verfügung, die Zeit und Ressourcen für wichtige, tiefgründige Recherchen aufwenden können. Dadurch besteht die Gefahr, dass diese Geschichten unerzählt bleiben. Es wird weniger Journalismus produziert, und die Kosten für die Gesellschaft werden enorm sein
Reaktion von KI-Modellen auf urheberrechtlich geschützte Inhalte
Die Klage verdeutlicht, dass LLMs oft uneinheitlich auf Vorgaben reagieren und urheberrechtlich geschützte Texte teils wörtlich wiedergeben, teils paraphrasieren. Sie wirft jedoch eine grundlegende Frage auf: Stellt die Verwendung urheberrechtlich geschützten Materials zum Trainieren von KI-Software eine Urheberrechtsverletzung dar?
Die New York Times argumentiert, dass die Ausbildung von LLMs ( ) an sich eine Urheberrechtsverletzung darstellt, unabhängig davon, ob die Modelle Formulierungen aus dem Quellmaterial wiederholen. Diese Ansicht wird in einer Sammelklage der Autoren Sarah Silverman, Christopher Golden und Richard Kadrey bekräftigt, die behaupten, dass LLMs abgeleitete Werke verletzen, da sie ohne die aus urheberrechtlich geschützten Werken extrahierten Ausdrucksinformationen nicht funktionieren trac .
Die anhaltende Debatte über die Ethik der KI
Die von der New York Times eingeleiteten rechtlichen Schritte haben eine breitere Debatte über die ethischen Überlegungen im Zusammenhang mit KI und die Verantwortung von Technologieunternehmen ausgelöst, sicherzustellen, dass ihre KI-Modelle auf ethisch einwandfrei gewonnenen Daten basieren.
Mit dem Fortschritt der KI und ihrer zunehmend prominenten Rolle in verschiedenen Branchen werden Fragen zur Datennutzung, zu Rechten an geistigem Eigentum und zur Ethik der Inhaltserstellung immer dringlicher.

