Polémique autour d'un jeu de données d'images IA : des images pédopornographiques suscitent l'inquiétude

Your bank is using your money. You’re getting the scraps.WATCH FREE

convertisseur

Nouvelles

Entreprise

Crypto

Économie

Tribune libre

Règlement

Technologie

Apprendre

Cours

Investir

NFT

Technologie

Salle Pulse

Analyse approfondie

Réflexions de l'industrie

Entretiens

Recherche

Leadership éclairé

Prévisions de prix

Bulletin

Accueil » Actualités » Technologie » Polémique autour d'un jeu de données d'images IA : des images pédopornographiques suscitent l'inquiétude

Polémique autour d'un jeu de données d'images IA : des images pédopornographiques suscitent l'inquiétude

By Editah Patrick

Mise à jour : 23 décembre 2023 à 9 h 51 UTC

2 minutes de lecture

Ajoutez-nous comme source privilégiée sur Google

429263

Contenu

1. Découverte inquiétante dans l'ensemble de données LAION-5B
2. Décryptage du processus d'entraînement de l'IA
3. Ambiguïtés juridiques et dilemmes éthiques
4. La menace croissante des contenus pédopornographiques générés par l'IA
5. Vers une solution : une approche multipartite
6. Naviguer dans les méandres des progrès de l'IA

Partager le lien :

Dans cet article :

L'ensemble de données d'IA LAION-5B, essentiel pour l'entraînement des modèles, contenait des images suspectées d'abus d'enfants, ce qui a entraîné son retrait et une enquête.

Le modèle stable Diffusion AI affirme que ses filtres internes empêchent la diffusion de contenus illégaux, répondant ainsi aux préoccupations soulevées par la controverse autour de l'ensemble de données LAION-5B.

Des incertitudes juridiques entourent les ensembles de données d'IA, comme LAION-5B, une étude révélant les difficultés à distinguer les contenus générés par l'IA des contenus réellement illégaux.

Une récente révélation de l'Observatoire Internet de Stanford a mis au jour une réalité inquiétante dans le domaine du développement de l'intelligence artificielle (IA). Le plus grand ensemble de données d'images utilisé pour l'entraînement des modèles de génération d'images par IA, LAION-5B, contenait 3 226 images soupçonnées d'être de la pornographie infantile. Suite à cette révélation, LAION a immédiatementtracson ensemble de données de l'accès public et s'est engagé à procéder à un examen approfondi afin d'éliminer tout contenu dangereux.

Découverte inquiétante dans l'ensemble de données LAION-5B

LAION-5B, un ensemble de données open source comprenant plus de 5,8 milliards de paires d'URL d'images en ligne et leurs légendes correspondantes, sert de base à l'entraînement de divers modèles d'IA, dont le très populaire modèle de diffusion stable. Créé par extraction de données d'Internet à l'aide de Common Crawl, cet ensemble de données a fait l'objet d'un examen minutieux lorsque des chercheurs dirigés par David Thiel à Stanford ont utilisé les classificateurs de contenu inapproprié de LAION et PhotoDNA, un outil courant de modération de contenu. Leur enquête a révélé la présence alarmante de contenu pédopornographique présumé au sein de l'ensemble de données, ce qui a nécessité une action immédiate.

Décryptage du processus d'entraînement de l'IA

Le processus d'entraînement de l'IA repose sur l'utilisation de vastes ensembles de données comme LAION-5B, permettant aux modèles d'apprendre et de générer du contenu. Stable Diffusion, un modèle d'IA de premier plan dans ce domaine, a assuré à 404 Media que des filtres internes sont en place pour éliminer les contenus illégaux et offensants des données utilisées pour l'entraînement. De plus, l'entreprise affirme que ces filtres s'appliquent également aux données générées, garantissant ainsi que les invites de saisie et les images générées par l'IA sont exemptes de tout contenu illicite.

Voir aussi : 1 milliard de dollars de coupes budgétaires : le principal scientifique de Microsoft affirme que Trump donne un avantage à la Chine en matière d’IA.
Ambiguïtés juridiques et dilemmes éthiques

La légalité des ensembles de données comme LAION-5B constitue une zone grise au regard du droit fédéral américain. Si la possession et la transmission de contenu pédopornographique sont incontestablement illégales, le fait que cet ensemble de données ne contienne que des URL et non les images elles-mêmes contribue à cette ambiguïté. Le défi majeur réside dans la difficulté croissante à distinguer le contenu pédopornographique généré par l'IA du contenu illicite authentique. Face à la prolifération de l'IA, la résolution de ces problématiques exige une collaboration étroite entre les législateurs, les forces de l'ordre, l'industrie technologique, le monde universitaire et le grand public.

La menace croissante des contenus pédopornographiques générés par l'IA

Bien que le nombre d'images signalées dans l'immense ensemble de données LAION-5B puisse paraître statistiquement insignifiant (3 226 sur 5,8 milliards), l'impact potentiel sur les modèles d'IA génératifs est considérable. La frontière floue entre les images CSAM authentiques et leurs homologues générées par l'IA souligne l'urgence de traiter ce problème de manière exhaustive. À mesure que l'IA progresse, il devient impératif d'atténuer les risques liés aux données d'entraînement contaminées.

Vers une solution : une approche multipartite

L'étude menée par David Thiel et son équipe souligne la nécessité d'une approche multidimensionnelle pour faire face aux conséquences néfastes de la prolifération de l'IA. Les solutions doivent s'appuyer sur des mesures législatives, des stratégies policières, les meilleures pratiques du secteur, la recherche universitaire et la sensibilisation du public. La collaboration de ces acteurs est essentielle pour appréhender de manière responsable la complexité du développement de l'IA.

Voir aussi : Wikipedia fait appel dans sa bataille juridique contre un site d’information indien local
Naviguer dans les méandres des progrès de l'IA

La controverse autour des données LAION-5B nous rappelle brutalement les enjeux éthiques liés à l'évolution rapide de l'IA. L'imbrication des technologies et du bien-être sociétal exige une action proactive et concertée pour garantir un développement de l'IA éthique et conforme aux normes juridiques. Les années à venir verront sans aucun doute une mobilisation de divers acteurs pour traiter et corriger les conséquences préoccupantes mises en lumière par l'étude de l'Observatoire Internet de Stanford. Dans ce contexte, la responsabilité collective de se prémunir contre le mésusage de l'IA devient plus cruciale que jamais.

Vous laissez encore la banque garder le meilleur ? Regardez notre vidéo gratuite sur comment devenir votre propre banque.

Partager le lien :

Lire l'avertissement

Avertissement : Les informations fournies ne constituent pas un conseil en investissement. CryptopolitanCryptopolitan.com toute responsabilité quant aux investissements réalisés sur la base des informations présentées sur cette page. Nous voustrondentdentdentdentdentdentdentdent et/ou de consulter un professionnel qualifié avant toute décision d’investissement.

Articles les plus lus

Chargement des articles les plus lus...

Restez informé(e) de l'actualité crypto, recevez des mises à jour quotidiennes dans votre boîte mail

E-mail

Choix de la rédaction

Chargement des articles sélectionnés par la rédaction...

PrécédentLes anciensprésidencedentsont invités à aborder l'impact de l'IA lors de leur prochain mandat.

Applese lance dans l'IA générative : des négociations sont en cours pour l'accès aux archives d'actualités.Suivant

Inscrivez-vous et restez au sommet

Restez informé grâce aux newsletters de Cryptopolitan, directement dans votre boîte mail.

s'abonner

Votre passerelle vers le web3.

section supérieure

Crypto

Prédiction des prix

Règlement

Technologie

Podcasts

Apprendre

Blockchain 101

Crypto 101

Investissement en cryptomonnaies

Minage de cryptomonnaies

Portefeuilles crypto

Entreprise

À propos

Notre équipe

Contact

Événements

Note de la rédaction

Écrivez pour nous

Faites de la publicité avec nous

Dossier de presse

Nos produits

Convertisseur de devises

Bulletin

Gazouillement Instagram LinkedIn Télégramme Facebook YouTube Reddit

Copyright 2025 Cryptopolitan

politique de confidentialité

Politique éditoriale

Politique relative aux cookies

Politique relative aux commentaires

Termes et conditions

RECHERCHE

Sections supérieures

Entreprise

Crypto

Économie

Tribune libre

Prévisions de prix

Règlement

Technologie

Apprendre

Cours

Investir

NFT

Technologie

Salle Pulse

Analyse approfondie

Réflexions de l'industrie

Entretiens

Recherche

Leadership éclairé

Suivez-nous

Gazouillement Instagram LinkedIn Télégramme Facebook YouTube Reddit

Recherche

- La newsletter crypto qui vous donne une longueur d'avance -

Les marchés évoluent rapidement.

Nous avançons plus vite.

Abonnez-vous à Cryptopolitan Daily et recevez directement dans votre boîte mail des informations crypto pertinentes, pointues et actualisées.

Dernières nouvelles et mises à jour réglementaires

Analyse d'experts sur les tendances du marché

Pas de sensationnalisme, juste des faits qui comptent

Inscrivez-vous maintenant et
ne manquez plus aucun mouvement.

Entrez. Renseignez-vous.
Prenez de l'avance.

E-mail

Abonnez-vous à CryptoPolitan