NEUESTE NACHRICHTEN

Der Handel mit Meme-Coins steigerte Solana -Adressen um 38 % und BNB -Chain-Volumen um 45 %

Nachrichten vor 5 Minuten
Chinas KI-Regeln zwingen ByteDance und Alibaba zur Abschaltung ihrer Begleit-Bots

vor 1 Stunde Technik
Won-Stablecoins kommen vor dem Inkrafttreten der südkoreanischen Regelungen auf den Markt

Vor 2 Stunden Geschäft
Vitalik Buterin beschreibt „Lean Ethereum“ als die dritte große Überarbeitung des Netzwerks

Nachrichten vor 20 Stunden

FÜR SIE AUSGEWÄHLT

KI-Trainingsdatensätze enthalten beunruhigende Mengen an Material über sexuellen Kindesmissbrauch

Von

Derrick Clinton

2 Minuten Lesezeit , 20. Dezember 2023

Sexueller Kindesmissbrauch

Eine Studie der Stanford University kommt zu dem Schluss, dass KI-Modelle wie Stable Diffusion, die mit Datensätzen trainiert wurden, die Material über sexuellen Kindesmissbrauch enthielten, ethische Bedenken aufwerfen.
Die Forscher reagieren schnell und melden missbräuchliche Bild-URLs an NCMEC und C3P, wobei sie die Notwendigkeit eines verantwortungsvollen Umgangs mit KI-Daten unterstreichen.
Die SIO-Untersuchung hebt die Herausforderungen bei der Bereinigung offener Datensätze hervor und mahnt zu künftigen Vorsichtsmaßnahmen sowie zur Zusammenarbeit mit Kinderschutzorganisationen.

Eine kürzlich vom Stanford Internet Observatory (SIO) durchgeführte UntersuchungdentHunderte bekannter Bilder mit kinderpornografischem Material in einem öffentlich zugänglichen Datensatz, der zum Training gängiger KI-Modelle zur Text-zu-Bild-Erzeugung, darunter Stable Diffusion, verwendet wird. Die Ergebnisse verdeutlichen den besorgniserregenden Einsatz frei verfügbarer Datensätze bei der Entwicklung fortschrittlicher KI-Modelle.

Aufdeckung beunruhigender Trainingsdatenquellen

Die SIO-Untersuchung ergab, dass diese KI-Modelle direkt mit kinderpornografischem Material aus dem LAION-5B-Datensatz trainiert wurden. Dieser Datensatz umfasst Milliarden von Bildern verschiedener Plattformen, darunter gängige soziale Medien und beliebte Erwachsenenvideoportale. Die Enthüllung gibt Anlass zur Sorge, dass Kindesmissbrauch durch die Verwendung von Datensätzen mit illegalen und schädlichen Inhalten unbeabsichtigt weiter gefördert wird.

Schnelle Maßnahmen zur Behebung des Problems

Nachdentdes Quellmaterials leiteten die Forscher die Entfernung ein, indem sie die Bild-URLs an das National Center for Missing and Exploited Children (NCMEC) in den USA und das Canadian Centre for Child Protection (C3P) meldeten. Der Einsatz von Hashing-Tools wie PhotoDNA spielte eine entscheidende Rolle beim Abgleich der Bild-Fingerabdrücke mit Datenbanken von gemeinnützigen Organisationen, die sich dem Kampf gegen sexuelle Ausbeutung und Missbrauch von Kindern im Internet widmen.

Herausforderungen bei der Bereinigung offener Datensätze

Es gibt zwar Methoden, um das Vorkommen von CSAM in Trainingsdatensätzen zu minimieren, doch der Bericht unterstreicht die Herausforderungen bei der Bereinigung oder dem Stopp der Verbreitung offener Datensätze ohne zentrale Instanz. Das Fehlen einer Hosting-Organisation für diese Datensätze erschwert die Bemühungen, deren Integrität und Sicherheit zu gewährleisten. Die Studie betont die Notwendigkeit proaktiver Maßnahmen, um die unbeabsichtigte Aufnahme illegaler Inhalte in KI-Trainingsdaten zu verhindern.

Sicherheitsempfehlungen für die zukünftige Datenverarbeitung

Angesichts dieser Erkenntnisse enthält der Bericht Sicherheitsempfehlungen für die Datenerfassung, das Training von Modellen und das Hosting von Modellen, die mit gesammelten Datensätzen trainiert wurden. Er plädiert für gründliche Überprüfungen von Bildern anhand bekannter Listen kinderpornografischer Inhalte mithilfe von Erkennungstools wie Microsoft PhotoDNA. Die Zusammenarbeit mit Kinderschutzorganisationen wie NCMEC und C3P wird ebenfalls empfohlen, um den ethischen und rechtmäßigen Einsatz von KI-Technologie zu gewährleisten.

Mit dem fortschreitenden Fortschritt der KI wird der verantwortungsvolle Umgang mit Trainingsdatensätzen unerlässlich, um unbeabsichtigte Beiträge zu illegalen Aktivitäten zu verhindern. Die Untersuchung des SIO dient als Weckruf für die KI-Community und fordert die Beteiligten nachdrücklich auf, strenge Maßnahmen bei der Datenaufbereitung, dem Modelltraining und der Zusammenarbeit mit relevanten Kinderschutzbehörden zu ergreifen.

Als Reaktion auf diese Enthüllungen ist die KI-Community aufgefordert, ihre ethischen Standards zu überdenken und entschlossen gegen die unbeabsichtigte Verwendung von CSAM in Trainingsdatensätzen vorzugehen. Durch die Umsetzung der empfohlenen Sicherheitsmaßnahmen kann die Branche verantwortungsvoll und ethisch zur Entwicklung von KI-Technologien beitragen und sich vor den unbeabsichtigten Folgen unkontrollierter Datenquellen schützen.

Die Ergebnisse der SIO-Untersuchung unterstreichen die Bedeutung von Wachsamkeit in einer Zeit, in der technologische Fortschritte mit einemtronEngagement für ethische KI-Entwicklung einhergehen müssen. Die Zusammenarbeit zwischen Forschern, Branchenführern und Kinderschutzorganisationen ist unerlässlich, um sicherzustellen, dass die KI-Technologie im Einklang mit gesellschaftlichen Werten entwickelt wird und das Wohl schutzbedürftiger Personen in den Vordergrund stellt.

Wenn Sie das hier lesen, sind Sie schon einen Schritt voraus. Bleiben Sie mit unserem Newsletter auf dem Laufenden.

Diesen Artikel teilen

Haftungsausschluss. Die bereitgestellten Informationen stellen keine Anlageberatung dar. Cryptopolitan/ übernimmt keine Haftung für Investitionen, die auf Grundlage der Informationen auf dieser Seite getätigt werden. Wirtronempfehlen dringend, vor jeder Anlageentscheidung eigene Recherchen durchzuführendent oder einen qualifizierten Fachmann zu konsultieren

Derrick Clinton

Derrick ist freiberuflicher Autor mit Schwerpunkt auf Blockchain und Kryptowährungen. Er beschäftigt sich hauptsächlich mit Problemen und Lösungen von Kryptoprojekten und bietet Markteinblicke für Investitionen. Seine analytischen Fähigkeiten setzt er in seinen wissenschaftlichen Arbeiten ein.

INHALTSVERZEICHNIS

1. Aufdeckung beunruhigender Trainingsdatenquellen

2. Schnelle Maßnahmen zur Behebung des Problems

3. Herausforderungen bei der Bereinigung offener Datensätze

4. Sicherheitsempfehlungen für die zukünftige Datenverarbeitung

Diesen Artikel teilen

MEHR … NACHRICHTEN

ALLE ANZEIGEN

Was ist Base? Das von Coinbase ins Leben gerufene Ethereum Layer-2-Netzwerk

21. Oktober 2025 Krypto lernen: Leitfaden für Anfänger
Dogecoin vs. Bitcoin: Wichtigste technische Unterschiede

20. Oktober 2025 Krypto lernen: Leitfaden für Anfänger
Was ist TVL (Total Value Locked) bei Kryptowährungen?

14. Oktober 2025 Krypto lernen: Leitfaden für Anfänger
Wie liest man ein Krypto-Whitepaper?

13. Oktober 2025 Krypto lernen: Leitfaden für Anfänger
Ripple vs. XRP vs. XRP Ledger: Was ist der Unterschied?

13. Oktober 2025 Krypto lernen: Leitfaden für Anfänger
Was ist eine Multisig-Wallet im Kryptobereich?

10. Oktober 2025 Krypto lernen: Leitfaden für Anfänger

DEEP CRYPTO
CRASH-KURS

Mit welchen Kryptowährungen kann man Geld verdienen?
Wie Sie Ihre Sicherheit mit einer digitalen Geldbörse erhöhen können (und welche sich tatsächlich lohnen)
Wenig bekannte Anlagestrategien, die Profis anwenden
Wie man mit dem Investieren in Kryptowährungen beginnt (welche Börsen man nutzen sollte, welche Kryptowährung am besten zum Kauf geeignet ist usw.)

KI-Trainingsdatensätze enthalten beunruhigende Mengen an Material über sexuellen Kindesmissbrauch

Aufdeckung beunruhigender Trainingsdatenquellen

Schnelle Maßnahmen zur Behebung des Problems

Herausforderungen bei der Bereinigung offener Datensätze

Sicherheitsempfehlungen für die zukünftige Datenverarbeitung

5 geniale Anwendungsmöglichkeiten von ChatGPT und was Sie damit anfangen sollten

93 % der Unternehmensführer bevorzugen KI-gestützte Lösungen für das Nachhaltigkeitsmanagement von Marken, Reuters

So unterstützt Macron Frankreichs dynamisches und produktives KI-Ökosystem

Bloomberg schätzt, dass der Markt für generative KI bis 2032 ein Volumen von 1,3 Billionen US-Dollar erreichen wird

Ein prägnanter Brief.
Jeden Tag.

KI-Trainingsdatensätze enthalten beunruhigende Mengen an Material über sexuellen Kindesmissbrauch

Aufdeckung beunruhigender Trainingsdatenquellen

Schnelle Maßnahmen zur Behebung des Problems

Herausforderungen bei der Bereinigung offener Datensätze

Sicherheitsempfehlungen für die zukünftige Datenverarbeitung

5 geniale Anwendungsmöglichkeiten von ChatGPT und was Sie damit anfangen sollten

93 % der Unternehmensführer bevorzugen KI-gestützte Lösungen für das Nachhaltigkeitsmanagement von Marken, Reuters

So unterstützt Macron Frankreichs dynamisches und produktives KI-Ökosystem

Bloomberg schätzt, dass der Markt für generative KI bis 2032 ein Volumen von 1,3 Billionen US-Dollar erreichen wird

Ein prägnanter Brief.Jeden Tag.

Ein prägnanter Brief.
Jeden Tag.