Your bank is using your money. You’re getting the scraps.WATCH FREE

Polémique autour d'un jeu de données d'images IA : des images pédopornographiques suscitent l'inquiétude

Dans cet article :

  • L'ensemble de données d'IA LAION-5B, essentiel pour l'entraînement des modèles, contenait des images suspectées d'abus d'enfants, ce qui a entraîné son retrait et une enquête.
  • Le modèle stable Diffusion AI affirme que ses filtres internes empêchent la diffusion de contenus illégaux, répondant ainsi aux préoccupations soulevées par la controverse autour de l'ensemble de données LAION-5B.
  • Des incertitudes juridiques entourent les ensembles de données d'IA, comme LAION-5B, une étude révélant les difficultés à distinguer les contenus générés par l'IA des contenus réellement illégaux.

Une récente révélation de l'Observatoire Internet de Stanford a mis au jour une réalité inquiétante dans le domaine du développement de l'intelligence artificielle (IA). Le plus grand ensemble de données d'images utilisé pour l'entraînement des modèles de génération d'images par IA, LAION-5B, contenait 3 226 images soupçonnées d'être de la pornographie infantile. Suite à cette révélation, LAION a immédiatementtracson ensemble de données de l'accès public et s'est engagé à procéder à un examen approfondi afin d'éliminer tout contenu dangereux.

Découverte inquiétante dans l'ensemble de données LAION-5B

LAION-5B, un ensemble de données open source comprenant plus de 5,8 milliards de paires d'URL d'images en ligne et leurs légendes correspondantes, sert de base à l'entraînement de divers modèles d'IA, dont le très populaire modèle de diffusion stable. Créé par extraction de données d'Internet à l'aide de Common Crawl, cet ensemble de données a fait l'objet d'un examen minutieux lorsque des chercheurs dirigés par David Thiel à Stanford ont utilisé les classificateurs de contenu inapproprié de LAION et PhotoDNA, un outil courant de modération de contenu. Leur enquête a révélé la présence alarmante de contenu pédopornographique présumé au sein de l'ensemble de données, ce qui a nécessité une action immédiate.

Décryptage du processus d'entraînement de l'IA

Le processus d'entraînement de l'IA repose sur l'utilisation de vastes ensembles de données comme LAION-5B, permettant aux modèles d'apprendre et de générer du contenu. Stable Diffusion, un modèle d'IA de premier plan dans ce domaine, a assuré à 404 Media que des filtres internes sont en place pour éliminer les contenus illégaux et offensants des données utilisées pour l'entraînement. De plus, l'entreprise affirme que ces filtres s'appliquent également aux données générées, garantissant ainsi que les invites de saisie et les images générées par l'IA sont exemptes de tout contenu illicite.

Voir aussi :  1 milliard de dollars de coupes budgétaires : le principal scientifique de Microsoft affirme que Trump donne un avantage à la Chine en matière d’IA.

Ambiguïtés juridiques et dilemmes éthiques

La légalité des ensembles de données comme LAION-5B constitue une zone grise au regard du droit fédéral américain. Si la possession et la transmission de contenu pédopornographique sont incontestablement illégales, le fait que cet ensemble de données ne contienne que des URL et non les images elles-mêmes contribue à cette ambiguïté. Le défi majeur réside dans la difficulté croissante à distinguer le contenu pédopornographique généré par l'IA du contenu illicite authentique. Face à la prolifération de l'IA, la résolution de ces problématiques exige une collaboration étroite entre les législateurs, les forces de l'ordre, l'industrie technologique, le monde universitaire et le grand public.

La menace croissante des contenus pédopornographiques générés par l'IA

Bien que le nombre d'images signalées dans l'immense ensemble de données LAION-5B puisse paraître statistiquement insignifiant (3 226 sur 5,8 milliards), l'impact potentiel sur les modèles d'IA génératifs est considérable. La frontière floue entre les images CSAM authentiques et leurs homologues générées par l'IA souligne l'urgence de traiter ce problème de manière exhaustive. À mesure que l'IA progresse, il devient impératif d'atténuer les risques liés aux données d'entraînement contaminées.

Vers une solution : une approche multipartite

L'étude menée par David Thiel et son équipe souligne la nécessité d'une approche multidimensionnelle pour faire face aux conséquences néfastes de la prolifération de l'IA. Les solutions doivent s'appuyer sur des mesures législatives, des stratégies policières, les meilleures pratiques du secteur, la recherche universitaire et la sensibilisation du public. La collaboration de ces acteurs est essentielle pour appréhender de manière responsable la complexité du développement de l'IA.

Voir aussi :  Wikipedia fait appel dans sa bataille juridique contre un site d’information indien local

Naviguer dans les méandres des progrès de l'IA

La controverse autour des données LAION-5B nous rappelle brutalement les enjeux éthiques liés à l'évolution rapide de l'IA. L'imbrication des technologies et du bien-être sociétal exige une action proactive et concertée pour garantir un développement de l'IA éthique et conforme aux normes juridiques. Les années à venir verront sans aucun doute une mobilisation de divers acteurs pour traiter et corriger les conséquences préoccupantes mises en lumière par l'étude de l'Observatoire Internet de Stanford. Dans ce contexte, la responsabilité collective de se prémunir contre le mésusage de l'IA devient plus cruciale que jamais.

Vous laissez encore la banque garder le meilleur ? Regardez notre vidéo gratuite sur comment devenir votre propre banque.

Partager le lien :

Avertissement : Les informations fournies ne constituent pas un conseil en investissement. CryptopolitanCryptopolitan.com toute responsabilité quant aux investissements réalisés sur la base des informations présentées sur cette page. Nous voustrondentdentdentdentdentdentdentdent et/ou de consulter un professionnel qualifié avant toute décision d’investissement.

Articles les plus lus

Chargement des articles les plus lus...

Restez informé(e) de l'actualité crypto, recevez des mises à jour quotidiennes dans votre boîte mail

Choix de la rédaction

Chargement des articles sélectionnés par la rédaction...

- La newsletter crypto qui vous donne une longueur d'avance -

Les marchés évoluent rapidement.

Nous avançons plus vite.

Abonnez-vous à Cryptopolitan Daily et recevez directement dans votre boîte mail des informations crypto pertinentes, pointues et actualisées.

Inscrivez-vous maintenant et
ne manquez plus aucun mouvement.

Entrez. Renseignez-vous.
Prenez de l'avance.

Abonnez-vous à CryptoPolitan