ÚLTIMAS NOTÍCIAS

Negociação de moedas meme impulsiona endereços Solana em 38% e volume BNB Chain em 45%

Notícias de 5 minutos atrás
As novas regras de IA da China levam a ByteDance e a Alibaba a desativarem seus bots de apoio

1 hora atrás Tecnologia
As stablecoins Won estão chegando antes do regulamento da Coreia do Sul

2 horas atrás Negócios
Vitalik Buterin descreve o 'Lean Ethereum' como a terceira grande reformulação da rede

Notícias de 20 horas atrás

SELECIONADO PARA VOCÊ

As novas regras de IA da China levam a ByteDance e a Alibaba a desativarem seus bots de apoio

1 hora atrás Tecnologia
O CEO da Tether faz um alerta preocupante em meio ao aumento exorbitante dos gastos com infraestrutura de IA

4 de julho de 2026 Tecnologia
A Micron aposta tudo em IA com uma fábrica de chips de US$ 9,3 bilhões no Japão

4 de julho de 2026 Tecnologia

Conjuntos de dados para treinamento de IA contêm níveis alarmantes de material de abuso sexual infantil

Por

Derrick Clinton

Tempo de leitura: 2 minutos - 20 de dezembro de 2023

Abuso sexual infantil

Um estudo de Stanford descobriu que modelos de IA, como o Stable Diffusion, foram treinados em conjuntos de dados com material de abuso sexual infantil, o que levanta preocupações éticas.
Os pesquisadores agem rapidamente, denunciando URLs de imagens abusivas ao NCMEC e ao C3P, enfatizando a necessidade de um tratamento responsável dos dados de IA.
A investigação da SIO destaca os desafios na limpeza de conjuntos de dados abertos, recomendando precauções futuras e a colaboração com organizações de proteção à infância.

Em uma investigação recente conduzida pelo Stanford Internet Observatory (SIO), centenas de imagens conhecidas de material de abuso sexual infantil (CSAM, na sigla em inglês) foramdentem um conjunto de dados aberto utilizado para o treinamento de modelos populares de IA para geração de imagens a partir de texto, incluindo o Stable Diffusion. As descobertas lançam luz sobre o uso preocupante de conjuntos de dados disponíveis publicamente no desenvolvimento de modelos avançados de inteligência artificial (IA).

Revelando fontes de dados de treinamento perturbadoras

A investigação da SIO revelou que esses modelos de IA foram treinados diretamente com CSAM presente no conjunto de dados LAION-5B, que compreende bilhões de imagens provenientes de diversas plataformas, incluindo redes sociais populares e sites de vídeos adultos. A revelação levanta preocupações sobre a perpetuação inadvertida da exploração infantil por meio do uso de conjuntos de dados contaminados com conteúdo ilegal e prejudicial.

Ações rápidas para resolver o problema

Apósdenta fonte do material, os pesquisadores iniciaram o processo de remoção, relatando os URLs das imagens ao Centro Nacional para Crianças Desaparecidas e Exploradas (NCMEC) nos EUA e ao Centro Canadense de Proteção à Criança (C3P). O uso de ferramentas de hash, como o PhotoDNA, desempenhou um papel crucial na correspondência das impressões digitais das imagens com bancos de dados mantidos por organizações sem fins lucrativos dedicadas ao combate à exploração e ao abuso sexual infantil online.

Desafios na limpeza de conjuntos de dados abertos

Embora existam métodos para minimizar a presença de CSAM (Conteúdo Abusivo por Mídia Digital) em conjuntos de dados de treinamento, o relatório destaca os desafios na limpeza ou interrupção da distribuição de conjuntos de dados abertos que não possuem uma autoridade central. A ausência de uma entidade que hospede esses conjuntos de dados complica os esforços para garantir sua integridade e segurança. O estudo enfatiza a necessidade de medidas proativas para evitar a inclusão inadvertida de conteúdo ilegal em dados de treinamento de IA.

Recomendações de segurança para o manuseio futuro de conjuntos de dados.

À luz dessas descobertas, o relatório descreve recomendações de segurança para a coleta de conjuntos de dados, o treinamento de modelos e a hospedagem de modelos treinados com dados extraídos. Defende a verificação minuciosa das imagens em relação a listas conhecidas de CSAM (Abuso Sexual Infantil e Adolescente) usando ferramentas de detecção como o PhotoDNA da Microsoft. A colaboração com organizações de proteção à infância, como o NCMEC (Centro Nacional para Crianças Desaparecidas e Exploradas) e o C3P (Centro para Crianças Desaparecidas e Exploradas), também é recomendada para garantir o uso ético e legal da tecnologia de IA (Inteligência Artificial).

Com o avanço contínuo da IA, o manuseio responsável dos conjuntos de dados de treinamento torna-se fundamental para evitar contribuições não intencionais para atividades ilícitas. A investigação do SIO serve como um alerta para a comunidade de IA, instando as partes interessadas a adotarem medidas rigorosas na curadoria de conjuntos de dados, no treinamento de modelos e na colaboração com as agências de proteção à criança relevantes.

Em resposta a essas revelações, a comunidade de IA é levada a reavaliar seus padrões éticos e a tomar medidas decisivas para lidar com o uso não intencional de CSAM (material de abuso sexual infantil) em conjuntos de dados de treinamento. Ao implementar as medidas de segurança recomendadas, o setor pode contribuir para o desenvolvimento da tecnologia de IA de maneira responsável e ética, protegendo-se contra as consequências indesejadas de fontes de dados não verificadas.

As conclusões da investigação da SIO sublinham a importância da vigilância numa era em que os avanços tecnológicos devem ser acompanhados por umtroncompromisso com o desenvolvimento ético da IA. A colaboração entre investigadores, líderes da indústria e organizações de proteção infantil é essencial para garantir que a tecnologia de IA progrida de uma forma que esteja alinhada com os valores da sociedade e priorize o bem-estar dos indivíduos vulneráveis.

Se você está lendo isto, já está um passo à frente. Continue assim assinando nossa newsletter.

Compartilhe este artigo

Aviso Legal. As informações fornecidas não constituem aconselhamento de investimento. CryptopolitanO não se responsabiliza por quaisquer investimentos realizados com base nas informações fornecidas nesta página. Recomendamostrona realização de pesquisas independentesdent /ou a consulta a um profissional qualificado antes de tomar qualquer decisão de investimento.

Derrick Clinton

Derrick é um escritor freelancer com interesse em blockchain e criptomoedas. Ele trabalha principalmente com problemas e soluções de projetos de criptomoedas, oferecendo uma perspectiva de mercado para investimentos. Ele aplica suas habilidades analíticas em teses.

ÍNDICE

1. Revelando fontes de dados de treinamento perturbadoras

2. Ações rápidas para resolver o problema

3. Desafios na limpeza de conjuntos de dados abertos

4. Recomendações de segurança para o manuseio futuro de conjuntos de dados.

Compartilhe este artigo

MAIS… NOTÍCIAS

MOSTRAR TUDO

5 aplicações engenhosas do ChatGPT e o que você deve fazer a respeito

Há 3 anos, John Palmer, da área de tecnologia

93% dos líderes empresariais preferem soluções baseadas em IA para a gestão da sustentabilidade da marca, segundo a Reuters

Há 3 anos, John Palmer, da área de tecnologia

Eis como Macron apoia o ecossistema de IA vibrante e produtivo da França

Há 3 anos, Tech Glory Kaburu

A Bloomberg estima que o mercado de IA generativa atingirá US$ 1,3 trilhão até 2032

3 anos atrás, Aamir Sheikh, da área de tecnologia

O que é Base? A rede Ethereum de camada 2 lançada pela Coinbase

21 de outubro de 2025 Aprenda Criptomoedas: Guias para Iniciantes
Dogecoin vs. Bitcoin: Principais Diferenças Técnicas

20 de outubro de 2025 Aprenda Criptomoedas: Guias para Iniciantes
O que é TVL (Valor Total Bloqueado) em criptomoedas?

14 de outubro de 2025 Aprenda Criptomoedas: Guias para Iniciantes
Como ler um white paper de criptomoedas?

13 de outubro de 2025 Aprenda Criptomoedas: Guias para Iniciantes
Ripple vs. XRP vs. XRP Ledger: Qual a diferença?

13 de outubro de 2025 Aprenda Criptomoedas: Guias para Iniciantes
O que é uma carteira multisig em criptomoedas?

10 de outubro de 2025 Aprenda Criptomoedas: Guias para Iniciantes

CURSO INTENSIVO DE CRIPTOMOEDAS AVANÇADAS

Quais criptomoedas podem te fazer ganhar dinheiro?
Como aumentar a segurança da sua carteira digital (e quais realmente valem a pena usar)
Estratégias de investimento pouco conhecidas que os profissionais utilizam
Como começar a investir em criptomoedas (quais corretoras usar, as melhores criptomoedas para comprar etc.)