Les ensembles de données d'entraînement à l'IA contiennent des niveaux inquiétants de matériel pédopornographique

abus sexuels sur enfants
- Une étude de Stanford révèle que des modèles d'IA, comme Stable Diffusion, ont été entraînés sur des ensembles de données contenant du matériel pédopornographique, ce qui soulève des questions d'éthique.
- Les chercheurs agissent rapidement, signalant les URL d'images abusives au NCMEC et au C3P, soulignant la nécessité d'une gestion responsable des données d'IA.
- L’enquête du SIO met en lumière les difficultés liées au nettoyage des ensembles de données ouverts, et appelle à des précautions futures et à une collaboration avec les organismes de protection de l’enfance.
Une enquête récente menée par le Stanford Internet Observatory (SIO) adentd'identifier des centaines d'images pédopornographiques dans un ensemble de données ouvert utilisé pour l'entraînement de modèles d'IA populaires de génération d'images à partir de texte, notamment Stable Diffusion. Ces résultats mettent en lumière l'utilisation inquiétante de jeux de données accessibles au public dans le développement de modèles d'intelligence artificielle (IA) avancés.
Découverte de sources de données d'entraînement inquiétantes
L'enquête du SIO a révélé que ces modèles d'IA ont été entraînés directement sur des images pédopornographiques présentes dans l'ensemble de données LAION-5B, qui comprend des milliards d'images provenant de diverses plateformes, notamment des réseaux sociaux grand public et des sites de vidéos pour adultes populaires. Cette révélation soulève des inquiétudes quant à la perpétuation involontaire de l'exploitation des enfants par l'utilisation d'ensembles de données contaminés par des contenus illégaux et préjudiciables.
Des mesures rapides pour régler le problème
Aprèsdentidentifié la source des images, les chercheurs ont entamé le processus de retrait en signalant les URL des images au Centre national pour les enfants disparus et exploités (NCMEC) aux États-Unis et au Centre canadien de protection de l'enfance (C3P). L'utilisation d'outils de hachage, tels que PhotoDNA, a joué un rôle crucial dans la comparaison des empreintes numériques des images avec les bases de données gérées par des organisations à but non lucratif luttant contre l'exploitation et les abus sexuels d'enfants en ligne.
Défis liés au nettoyage des jeux de données ouverts
Bien qu'il existe des méthodes pour minimiser la présence de contenu pédopornographique dans les jeux de données d'entraînement, le rapport souligne les difficultés liées au nettoyage ou à l'arrêt de la distribution de jeux de données ouverts en l'absence d'autorité centrale. L'absence d'un organisme hébergeant ces jeux de données complique les efforts visant à garantir leur intégrité et leur sécurité. L'étude insiste sur la nécessité de mesures proactives pour prévenir l'inclusion involontaire de contenu illégal dans les données d'entraînement de l'IA.
Recommandations de sécurité pour la gestion future des ensembles de données
À la lumière de ces conclusions, le rapport formule des recommandations de sécurité concernant la collecte de données, l'entraînement de modèles et l'hébergement de modèles entraînés sur des données extraites de ces bases de données. Il préconise une vérification approfondie des images par rapport aux listes connues de contenus pédopornographiques, à l'aide d'outils de détection tels que PhotoDNA de Microsoft. La collaboration avec des organismes de protection de l'enfance, comme le NCMEC et le C3P, est également recommandée afin de garantir une utilisation éthique et légale de l'intelligence artificielle.
À mesure que l'IA progresse, la gestion responsable des jeux de données d'entraînement devient primordiale pour prévenir toute contribution involontaire à des activités illicites. L'enquête du SIO sonne l'alarme pour la communauté de l'IA et incite les acteurs concernés à adopter des mesures rigoureuses en matière de curation des jeux de données, d'entraînement des modèles et de collaboration avec les organismes de protection de l'enfance compétents.
Face à ces révélations, la communauté de l'IA est invitée à réévaluer ses normes éthiques et à prendre des mesures décisives pour lutter contre l'utilisation involontaire de CSAM dans les jeux de données d'entraînement. En appliquant les mesures de sécurité recommandées, le secteur peut contribuer au développement de l'IA de manière responsable et éthique, en se prémunissant contre les conséquences imprévues liées à l'utilisation de sources de données non contrôlées.
Les conclusions de l'enquête du SIO soulignent l'importance de la vigilance à une époque où les progrès technologiques doivent s'accompagner d'un engagementtronen faveur d'un développement éthique de l'IA. La collaboration entre les chercheurs, les chefs d'entreprise et les organismes de protection de l'enfance est essentielle pour garantir que l'IA progresse en accord avec les valeurs sociétales et en priorisant le bien-être des personnes vulnérables.
Les plus grands experts en cryptomonnaies lisent déjà notre newsletter. Envie d'en faire partie ? Rejoignez-les !
Avertissement : Les informations fournies ne constituent pas un conseil en investissement. CryptopolitanCryptopolitan.com toute responsabilité quant aux investissements réalisés sur la base des informations présentées sur cette page. Nous voustronrecommandons vivement d’effectuer vosdent et/ou de consulter un professionnel qualifié avant toute décision d’investissement.

Derrick Clinton
Derrick est un rédacteur indépendant passionné par la blockchain et les cryptomonnaies. Il travaille principalement sur les problématiques et les solutions liées aux projets crypto, et propose des analyses de marché pour les investissements. Il met ses compétences analytiques au service de ses thèses.
LES
- Quelles cryptomonnaies peuvent vous faire gagner de l'argent ?
- Comment renforcer la sécurité de votre portefeuille (et lesquels valent vraiment la peine d'être utilisés)
- Stratégies d'investissement peu connues utilisées par les professionnels
- Comment débuter en investissement crypto (quelles plateformes d'échange utiliser, quelles cryptomonnaies acheter, etc.)














