DERNIÈRES NOUVELLES

Les échanges de cryptomonnaies liées aux mèmes font grimper le volume des adresses Solana de 38 % et celui de la chaîne BNB de 45 %

Actualités d'il y a 5 minutes
La réglementation chinoise sur l'IA contraint ByteDance et Alibaba à fermer leurs chatbots compagnons

Il y a 1 heure - Technologie
Les stablecoins en won arrivent avant le règlementation de la Corée du Sud

Il y a 2 heures - Entreprise
Vitalik Buterin décrit « Lean Ethereum» comme la troisième refonte majeure du réseau

Actualités d'il y a 20 heures

SÉLECTIONNÉ POUR VOUS

Les ensembles de données d'entraînement à l'IA contiennent des niveaux inquiétants de matériel pédopornographique

Par

Derrick Clinton

Temps de lecture : 2 min - 20 décembre 2023

abus sexuels sur enfants

abus sexuels sur enfants

Une étude de Stanford révèle que des modèles d'IA, comme Stable Diffusion, ont été entraînés sur des ensembles de données contenant du matériel pédopornographique, ce qui soulève des questions d'éthique.
Les chercheurs agissent rapidement, signalant les URL d'images abusives au NCMEC et au C3P, soulignant la nécessité d'une gestion responsable des données d'IA.
L’enquête du SIO met en lumière les difficultés liées au nettoyage des ensembles de données ouverts, et appelle à des précautions futures et à une collaboration avec les organismes de protection de l’enfance.

Une enquête récente menée par le Stanford Internet Observatory (SIO) adentd'identifier des centaines d'images pédopornographiques dans un ensemble de données ouvert utilisé pour l'entraînement de modèles d'IA populaires de génération d'images à partir de texte, notamment Stable Diffusion. Ces résultats mettent en lumière l'utilisation inquiétante de jeux de données accessibles au public dans le développement de modèles d'intelligence artificielle (IA) avancés.

Découverte de sources de données d'entraînement inquiétantes

L'enquête du SIO a révélé que ces modèles d'IA ont été entraînés directement sur des images pédopornographiques présentes dans l'ensemble de données LAION-5B, qui comprend des milliards d'images provenant de diverses plateformes, notamment des réseaux sociaux grand public et des sites de vidéos pour adultes populaires. Cette révélation soulève des inquiétudes quant à la perpétuation involontaire de l'exploitation des enfants par l'utilisation d'ensembles de données contaminés par des contenus illégaux et préjudiciables.

Des mesures rapides pour régler le problème

Aprèsdentidentifié la source des images, les chercheurs ont entamé le processus de retrait en signalant les URL des images au Centre national pour les enfants disparus et exploités (NCMEC) aux États-Unis et au Centre canadien de protection de l'enfance (C3P). L'utilisation d'outils de hachage, tels que PhotoDNA, a joué un rôle crucial dans la comparaison des empreintes numériques des images avec les bases de données gérées par des organisations à but non lucratif luttant contre l'exploitation et les abus sexuels d'enfants en ligne.

Défis liés au nettoyage des jeux de données ouverts

Bien qu'il existe des méthodes pour minimiser la présence de contenu pédopornographique dans les jeux de données d'entraînement, le rapport souligne les difficultés liées au nettoyage ou à l'arrêt de la distribution de jeux de données ouverts en l'absence d'autorité centrale. L'absence d'un organisme hébergeant ces jeux de données complique les efforts visant à garantir leur intégrité et leur sécurité. L'étude insiste sur la nécessité de mesures proactives pour prévenir l'inclusion involontaire de contenu illégal dans les données d'entraînement de l'IA.

Recommandations de sécurité pour la gestion future des ensembles de données

À la lumière de ces conclusions, le rapport formule des recommandations de sécurité concernant la collecte de données, l'entraînement de modèles et l'hébergement de modèles entraînés sur des données extraites de ces bases de données. Il préconise une vérification approfondie des images par rapport aux listes connues de contenus pédopornographiques, à l'aide d'outils de détection tels que PhotoDNA de Microsoft. La collaboration avec des organismes de protection de l'enfance, comme le NCMEC et le C3P, est également recommandée afin de garantir une utilisation éthique et légale de l'intelligence artificielle.

À mesure que l'IA progresse, la gestion responsable des jeux de données d'entraînement devient primordiale pour prévenir toute contribution involontaire à des activités illicites. L'enquête du SIO sonne l'alarme pour la communauté de l'IA et incite les acteurs concernés à adopter des mesures rigoureuses en matière de curation des jeux de données, d'entraînement des modèles et de collaboration avec les organismes de protection de l'enfance compétents.

Face à ces révélations, la communauté de l'IA est invitée à réévaluer ses normes éthiques et à prendre des mesures décisives pour lutter contre l'utilisation involontaire de CSAM dans les jeux de données d'entraînement. En appliquant les mesures de sécurité recommandées, le secteur peut contribuer au développement de l'IA de manière responsable et éthique, en se prémunissant contre les conséquences imprévues liées à l'utilisation de sources de données non contrôlées.

Les conclusions de l'enquête du SIO soulignent l'importance de la vigilance à une époque où les progrès technologiques doivent s'accompagner d'un engagementtronen faveur d'un développement éthique de l'IA. La collaboration entre les chercheurs, les chefs d'entreprise et les organismes de protection de l'enfance est essentielle pour garantir que l'IA progresse en accord avec les valeurs sociétales et en priorisant le bien-être des personnes vulnérables.

Si vous lisez ceci, vous avez déjà une longueur d'avance. Restez-y grâce à notre newsletter.

Partagez cet article

Avertissement : Les informations fournies ne constituent pas un conseil en investissement. CryptopolitanCryptopolitan.com toute responsabilité quant aux investissements réalisés sur la base des informations présentées sur cette page. Nous voustronrecommandons vivement d’effectuer vosdent et/ou de consulter un professionnel qualifié avant toute décision d’investissement.

Derrick Clinton

Derrick Clinton

Derrick est un rédacteur indépendant passionné par la blockchain et les cryptomonnaies. Il travaille principalement sur les problématiques et les solutions liées aux projets crypto, et propose des analyses de marché pour les investissements. Il met ses compétences analytiques au service de ses thèses.

TABLE DES MATIÈRES

1. Découverte de sources de données d'entraînement inquiétantes

2. Des mesures rapides pour régler le problème

3. Défis liés au nettoyage des jeux de données ouverts

4. Recommandations de sécurité pour la gestion future des ensembles de données

Partagez cet article

PLUS D'ACTUALITÉS

chat gpt

5 applications ingénieuses de ChatGPT et ce que vous devriez en faire

Il y a 3 ans, John Palmer, technicien

solutions basées sur l'IA

93 % des dirigeants d'entreprise privilégient les solutions basées sur l'IA pour la gestion de la durabilité de leur marque (Reuters)

Il y a 3 ans, John Palmer, technicien

L'écosystème de l'IA en France

Voici comment Macron soutient l'écosystème d'IA dynamique et productif de la France

Il y a 3 ans, Tech Glory Kaburu

IA générative

Bloomberg estime que le marché de l'IA générative atteindra 1 300 milliards de dollars d'ici 2032

Il y a 3 ans, Tech Aamir Sheikh

Base est-il le réseau Ethereum de couche 2 lancé par Coinbase ?

21 octobre 2025 Apprendre la crypto : Guides pour débutants
Dogecoin contre Bitcoin: Principales différences techniques

20 octobre 2025 Apprendre la crypto : Guides pour débutants
Qu'est-ce que la TVL (Total Value Locked) en cryptomonnaie ?

14 octobre 2025 Apprendre la crypto : Guides pour débutants
Comment lire un livre blanc sur les cryptomonnaies ?

13 octobre 2025 Apprendre la crypto : Guides pour débutants
Ripple vs. XRP vs. XRP Ledger : quelle est la différence ?

13 octobre 2025 Apprendre la crypto : Guides pour débutants
Qu'est-ce qu'un portefeuille multisignature dans le monde des cryptomonnaies ?

10 octobre 2025 Apprendre la crypto : Guides pour débutants

COURS ACCÉLÉRÉ SUR LES CRYPTOMONNAIES

Quelles cryptomonnaies peuvent vous faire gagner de l'argent ?
Comment renforcer la sécurité de votre portefeuille (et lesquels valent vraiment la peine d'être utilisés)
Stratégies d'investissement peu connues utilisées par les professionnels
Comment débuter en investissement crypto (quelles plateformes d'échange utiliser, quelles cryptomonnaies acheter, etc.)