KI-Trainingsdatensätze enthalten beunruhigende Mengen an Material über sexuellen Kindesmissbrauch

Sexueller Kindesmissbrauch
- Eine Studie der Stanford University kommt zu dem Schluss, dass KI-Modelle wie Stable Diffusion, die mit Datensätzen trainiert wurden, die Material über sexuellen Kindesmissbrauch enthielten, ethische Bedenken aufwerfen.
- Die Forscher reagieren schnell und melden missbräuchliche Bild-URLs an NCMEC und C3P, wobei sie die Notwendigkeit eines verantwortungsvollen Umgangs mit KI-Daten unterstreichen.
- Die SIO-Untersuchung hebt die Herausforderungen bei der Bereinigung offener Datensätze hervor und mahnt zu künftigen Vorsichtsmaßnahmen sowie zur Zusammenarbeit mit Kinderschutzorganisationen.
Eine kürzlich vom Stanford Internet Observatory (SIO) durchgeführte UntersuchungdentHunderte bekannter Bilder mit kinderpornografischem Material in einem öffentlich zugänglichen Datensatz, der zum Training gängiger KI-Modelle zur Text-zu-Bild-Erzeugung, darunter Stable Diffusion, verwendet wird. Die Ergebnisse verdeutlichen den besorgniserregenden Einsatz frei verfügbarer Datensätze bei der Entwicklung fortschrittlicher KI-Modelle.
Aufdeckung beunruhigender Trainingsdatenquellen
Die SIO-Untersuchung ergab, dass diese KI-Modelle direkt mit kinderpornografischem Material aus dem LAION-5B-Datensatz trainiert wurden. Dieser Datensatz umfasst Milliarden von Bildern verschiedener Plattformen, darunter gängige soziale Medien und beliebte Erwachsenenvideoportale. Die Enthüllung gibt Anlass zur Sorge, dass Kindesmissbrauch durch die Verwendung von Datensätzen mit illegalen und schädlichen Inhalten unbeabsichtigt weiter gefördert wird.
Schnelle Maßnahmen zur Behebung des Problems
Nachdentdes Quellmaterials leiteten die Forscher die Entfernung ein, indem sie die Bild-URLs an das National Center for Missing and Exploited Children (NCMEC) in den USA und das Canadian Centre for Child Protection (C3P) meldeten. Der Einsatz von Hashing-Tools wie PhotoDNA spielte eine entscheidende Rolle beim Abgleich der Bild-Fingerabdrücke mit Datenbanken von gemeinnützigen Organisationen, die sich dem Kampf gegen sexuelle Ausbeutung und Missbrauch von Kindern im Internet widmen.
Herausforderungen bei der Bereinigung offener Datensätze
Es gibt zwar Methoden, um das Vorkommen von CSAM in Trainingsdatensätzen zu minimieren, doch der Bericht unterstreicht die Herausforderungen bei der Bereinigung oder dem Stopp der Verbreitung offener Datensätze ohne zentrale Instanz. Das Fehlen einer Hosting-Organisation für diese Datensätze erschwert die Bemühungen, deren Integrität und Sicherheit zu gewährleisten. Die Studie betont die Notwendigkeit proaktiver Maßnahmen, um die unbeabsichtigte Aufnahme illegaler Inhalte in KI-Trainingsdaten zu verhindern.
Sicherheitsempfehlungen für die zukünftige Datenverarbeitung
Angesichts dieser Erkenntnisse enthält der Bericht Sicherheitsempfehlungen für die Datenerfassung, das Training von Modellen und das Hosting von Modellen, die mit gesammelten Datensätzen trainiert wurden. Er plädiert für gründliche Überprüfungen von Bildern anhand bekannter Listen kinderpornografischer Inhalte mithilfe von Erkennungstools wie Microsoft PhotoDNA. Die Zusammenarbeit mit Kinderschutzorganisationen wie NCMEC und C3P wird ebenfalls empfohlen, um den ethischen und rechtmäßigen Einsatz von KI-Technologie zu gewährleisten.
Mit dem fortschreitenden Fortschritt der KI wird der verantwortungsvolle Umgang mit Trainingsdatensätzen unerlässlich, um unbeabsichtigte Beiträge zu illegalen Aktivitäten zu verhindern. Die Untersuchung des SIO dient als Weckruf für die KI-Community und fordert die Beteiligten nachdrücklich auf, strenge Maßnahmen bei der Datenaufbereitung, dem Modelltraining und der Zusammenarbeit mit relevanten Kinderschutzbehörden zu ergreifen.
Als Reaktion auf diese Enthüllungen ist die KI-Community aufgefordert, ihre ethischen Standards zu überdenken und entschlossen gegen die unbeabsichtigte Verwendung von CSAM in Trainingsdatensätzen vorzugehen. Durch die Umsetzung der empfohlenen Sicherheitsmaßnahmen kann die Branche verantwortungsvoll und ethisch zur Entwicklung von KI-Technologien beitragen und sich vor den unbeabsichtigten Folgen unkontrollierter Datenquellen schützen.
Die Ergebnisse der SIO-Untersuchung unterstreichen die Bedeutung von Wachsamkeit in einer Zeit, in der technologische Fortschritte mit einemtronEngagement für ethische KI-Entwicklung einhergehen müssen. Die Zusammenarbeit zwischen Forschern, Branchenführern und Kinderschutzorganisationen ist unerlässlich, um sicherzustellen, dass die KI-Technologie im Einklang mit gesellschaftlichen Werten entwickelt wird und das Wohl schutzbedürftiger Personen in den Vordergrund stellt.
Die klügsten Köpfe der Krypto-Szene lesen bereits unseren Newsletter. Möchten Sie auch dabei sein? Dann schließen Sie sich ihnen an.
Haftungsausschluss. Die bereitgestellten Informationen stellen keine Anlageberatung dar. Cryptopolitan/ übernimmt keine Haftung für Investitionen, die auf Grundlage der Informationen auf dieser Seite getätigt werden. Wirtronempfehlen dringend, vor jeder Anlageentscheidung eigene Recherchen durchzuführendent oder einen qualifizierten Fachmann zu konsultieren

Derrick Clinton
Derrick ist freiberuflicher Autor mit Schwerpunkt auf Blockchain und Kryptowährungen. Er beschäftigt sich hauptsächlich mit Problemen und Lösungen von Kryptoprojekten und bietet Markteinblicke für Investitionen. Seine analytischen Fähigkeiten setzt er in seinen wissenschaftlichen Arbeiten ein.
CRASH-KURS
- Mit welchen Kryptowährungen kann man Geld verdienen?
- Wie Sie Ihre Sicherheit mit einer digitalen Geldbörse erhöhen können (und welche sich tatsächlich lohnen)
- Wenig bekannte Anlagestrategien, die Profis anwenden
- Wie man mit dem Investieren in Kryptowährungen beginnt (welche Börsen man nutzen sollte, welche Kryptowährung am besten zum Kauf geeignet ist usw.)














