Conjuntos de dados para treinamento de IA contêm níveis alarmantes de material de abuso sexual infantil

Abuso sexual infantil
- Um estudo de Stanford descobriu que modelos de IA, como o Stable Diffusion, foram treinados em conjuntos de dados com material de abuso sexual infantil, o que levanta preocupações éticas.
- Os pesquisadores agem rapidamente, denunciando URLs de imagens abusivas ao NCMEC e ao C3P, enfatizando a necessidade de um tratamento responsável dos dados de IA.
- A investigação da SIO destaca os desafios na limpeza de conjuntos de dados abertos, recomendando precauções futuras e a colaboração com organizações de proteção à infância.
Em uma investigação recente conduzida pelo Stanford Internet Observatory (SIO), centenas de imagens conhecidas de material de abuso sexual infantil (CSAM, na sigla em inglês) foramdentem um conjunto de dados aberto utilizado para o treinamento de modelos populares de IA para geração de imagens a partir de texto, incluindo o Stable Diffusion. As descobertas lançam luz sobre o uso preocupante de conjuntos de dados disponíveis publicamente no desenvolvimento de modelos avançados de inteligência artificial (IA).
Revelando fontes de dados de treinamento perturbadoras
A investigação da SIO revelou que esses modelos de IA foram treinados diretamente com CSAM presente no conjunto de dados LAION-5B, que compreende bilhões de imagens provenientes de diversas plataformas, incluindo redes sociais populares e sites de vídeos adultos. A revelação levanta preocupações sobre a perpetuação inadvertida da exploração infantil por meio do uso de conjuntos de dados contaminados com conteúdo ilegal e prejudicial.
Ações rápidas para resolver o problema
Apósdenta fonte do material, os pesquisadores iniciaram o processo de remoção, relatando os URLs das imagens ao Centro Nacional para Crianças Desaparecidas e Exploradas (NCMEC) nos EUA e ao Centro Canadense de Proteção à Criança (C3P). O uso de ferramentas de hash, como o PhotoDNA, desempenhou um papel crucial na correspondência das impressões digitais das imagens com bancos de dados mantidos por organizações sem fins lucrativos dedicadas ao combate à exploração e ao abuso sexual infantil online.
Desafios na limpeza de conjuntos de dados abertos
Embora existam métodos para minimizar a presença de CSAM (Conteúdo Abusivo por Mídia Digital) em conjuntos de dados de treinamento, o relatório destaca os desafios na limpeza ou interrupção da distribuição de conjuntos de dados abertos que não possuem uma autoridade central. A ausência de uma entidade que hospede esses conjuntos de dados complica os esforços para garantir sua integridade e segurança. O estudo enfatiza a necessidade de medidas proativas para evitar a inclusão inadvertida de conteúdo ilegal em dados de treinamento de IA.
Recomendações de segurança para o manuseio futuro de conjuntos de dados.
À luz dessas descobertas, o relatório descreve recomendações de segurança para a coleta de conjuntos de dados, o treinamento de modelos e a hospedagem de modelos treinados com dados extraídos. Defende a verificação minuciosa das imagens em relação a listas conhecidas de CSAM (Abuso Sexual Infantil e Adolescente) usando ferramentas de detecção como o PhotoDNA da Microsoft. A colaboração com organizações de proteção à infância, como o NCMEC (Centro Nacional para Crianças Desaparecidas e Exploradas) e o C3P (Centro para Crianças Desaparecidas e Exploradas), também é recomendada para garantir o uso ético e legal da tecnologia de IA (Inteligência Artificial).
Com o avanço contínuo da IA, o manuseio responsável dos conjuntos de dados de treinamento torna-se fundamental para evitar contribuições não intencionais para atividades ilícitas. A investigação do SIO serve como um alerta para a comunidade de IA, instando as partes interessadas a adotarem medidas rigorosas na curadoria de conjuntos de dados, no treinamento de modelos e na colaboração com as agências de proteção à criança relevantes.
Em resposta a essas revelações, a comunidade de IA é levada a reavaliar seus padrões éticos e a tomar medidas decisivas para lidar com o uso não intencional de CSAM (material de abuso sexual infantil) em conjuntos de dados de treinamento. Ao implementar as medidas de segurança recomendadas, o setor pode contribuir para o desenvolvimento da tecnologia de IA de maneira responsável e ética, protegendo-se contra as consequências indesejadas de fontes de dados não verificadas.
As conclusões da investigação da SIO sublinham a importância da vigilância numa era em que os avanços tecnológicos devem ser acompanhados por umtroncompromisso com o desenvolvimento ético da IA. A colaboração entre investigadores, líderes da indústria e organizações de proteção infantil é essencial para garantir que a tecnologia de IA progrida de uma forma que esteja alinhada com os valores da sociedade e priorize o bem-estar dos indivíduos vulneráveis.
As mentes mais brilhantes do mundo das criptomoedas já leem nossa newsletter. Quer participar? Junte-se a elas.
Aviso Legal. As informações fornecidas não constituem aconselhamento de investimento. CryptopolitanO não se responsabiliza por quaisquer investimentos realizados com base nas informações fornecidas nesta página. Recomendamostrona realização de pesquisas independentesdent /ou a consulta a um profissional qualificado antes de tomar qualquer decisão de investimento.

Derrick Clinton
Derrick é um escritor freelancer com interesse em blockchain e criptomoedas. Ele trabalha principalmente com problemas e soluções de projetos de criptomoedas, oferecendo uma perspectiva de mercado para investimentos. Ele aplica suas habilidades analíticas em teses.
CURSO
- Quais criptomoedas podem te fazer ganhar dinheiro?
- Como aumentar a segurança da sua carteira digital (e quais realmente valem a pena usar)
- Estratégias de investimento pouco conhecidas que os profissionais utilizam
- Como começar a investir em criptomoedas (quais corretoras usar, as melhores criptomoedas para comprar etc.)














