ÚLTIMAS NOTÍCIAS

O ex-veterano da NBA, Tristan Thompson, vira notícia ao processar o adversário por US$ 2 milhões e exigir um ultimato para que ele faça vasectomia

de 3 horas atrás Notícias
Hackers drenam US$ 5,4 milhões da ponte Ethereum - Cosmos da Gravity

de 6 horas atrás Notícias
Baleia do mundo das criptomoedas faz aposta inesperada de US$ 31,5 milhões na Microsoft e na Oracle

de 7 horas atrás Notícias
A Bitdeer vende todos os Bitcoin minerados pela 14ª semana consecutiva e não possui mais nenhum BTC em sua carteira

de 9 horas atrás Notícias

SELECIONADO PARA VOCÊ

A Anthropic lança o Opus 4.8 com um desconto de 3x no modo rápido e afirma que o Mythos será lançado em algumas semanas

29 de maio de 2026 Tecnologia
Um engenheiro do Google supostamente tinha um código de trapaça para o Polymarket e o transformou em US$ 1,2 milhão

28 de maio de 2026 Tecnologia
A Fundação OpenAI destina US$ 250 milhões a trabalhadores deslocados pela tecnologia que desenvolve

27 de maio de 2026 Tecnologia

SEMANALMENTE

MANTENHA-SE NO TOPO

As melhores informações sobre criptomoedas direto na sua caixa de entrada.

Startups de IA usam fotos de crianças brasileiras para treinar modelos sem consentimento

Por

Enacy Mapakame

Tempo de leitura: 3 minutos - 11 de junho de 2024

As imagens abrangem toda a infância deles, tornando suasdentfacilmente trac.
As imagens foram retiradas de bilhões de fotos de família carregadas em blogs pessoais.
A LAION argumentou que os pais e responsáveis devem ser responsabilizados por remover as imagens de crianças da internet.

Um grupo de defesa dos direitos humanos revelou que geradores de imagens usaram bilhões de fotos de crianças brasileiras para treinar seus modelos de inteligência artificial sem o consentimento delas. A Human Rights Watch (HRW) realizou uma pesquisa que mostra que geradores de imagens populares, como o Stable Diffusion, usaram imagens de crianças "abrangendo toda a sua infância" para treinar seus modelos.

O estudo da HRW revela que essas imagens foram tiradas em cerca de 10 estados brasileiros. O relatório indica que essas fotos representam um enorme “risco à privacidade das crianças”, pois o ato também aumenta a produção de imagens não consensuais com a sua semelhança.

Bilhões de imagens de crianças brasileiras são usadas para treinar modelos de IA

A pesquisadora da HRW, Hye Jung Han, expôs o problema após analisar uma fração (menos de 0,0001%) do LAION-5B, um conjunto de dados construído a partir de capturas de tela do Common Crawl na web pública. Ela revelou que o conjunto de dados não continha as fotos em si, mas sim "pares de texto e imagem" extraídos de quase 6 bilhões de fotos e legendas publicadas desde 2008.

Foram encontradas fotos de crianças de 10 estados brasileiros, a maioria delas fotos de família publicadas em blogs pessoais e de pais. Segundo a reportagem, são imagens que os internautas não encontram facilmente.

A HRW removeu os links para as imagens em colaboração com a LAION, a organização alemã sem fins lucrativos que criou o conjunto de dados. Ainda persistem as preocupações de que o conjunto de dados possa continuar a fazer referência a imagens de crianças de todo o mundo, uma vez que a remoção dos links por si só não resolve completamente o problema.

“Este é um problema maior e muito preocupante e, como organização de voluntários, faremos a nossa parte para ajudar”, disse Nate Tyler, porta-voz da LAION, ao Ars.

Asdentdas crianças são facilmente trac

O relatório da HRW revelou ainda que asdentde muitas crianças brasileiras poderiam ser trac, uma vez que seus nomes e locais foram usados nas legendas que compuseram o conjunto de dados. O relatório também expressou preocupação com o risco de as crianças serem alvo de bullying e de suas imagens serem usadas para conteúdo explícito.

“As fotos analisadas abrangem toda a infância”, diz um trecho do relatório.

“Elas capturam momentos íntimos de bebês nascendo nas mãos enluvadas de médicos, crianças pequenas soprando as velas do cake de aniversário ou dançando de roupa íntima em casa…”

HRW.

Han, no entanto, revelou que "todas as versões publicamente disponíveis do LAION-5B foram removidas" e, portanto, o risco de as fotos das crianças brasileiras serem usadas é menor agora.

Segundo a HRW, o conjunto de dados não estará disponível novamente até que a LAION tenha certeza de que todo o conteúdo sinalizado foi removido. A decisão foi tomada após um relatório também ter "encontrado links no conjunto de dados que apontavam para conteúdo ilegal na internet pública", incluindo mais de 3.000 casos suspeitos de de abuso sexual infantil .

Pelo menos 85 meninas no Brasil também relataram que seus colegas de classe as assediaram usando inteligência artificial para gerar conteúdo deepfake sexualmente explícito "com base em fotos tiradas de suas redes sociais"

Proteger a privacidade das crianças

Segundo o Ars Technica, o LAION-5B foi lançado em 2022, supostamente para replicar o conjunto de dados da OpenAI, e foi anunciado como o maior "conjunto de dados de imagem e texto disponível gratuitamente".

Quando a HRW contatou a LAION a respeito das imagens, a organização respondeu dizendo que os modelos de IA treinados no LAION-5B "não conseguiam reproduzir os dados das crianças palavra por palavra", embora reconhecessem os riscos à privacidade e à segurança.

A organização então começou a remover algumas imagens, mas também opinou que pais e responsáveis eram responsáveis por remover fotos pessoais de crianças da internet. Han discordou do argumento, dizendo:

“As crianças e seus pais não devem ser responsabilizados por proteger os filhos contra uma tecnologia que é fundamentalmente impossível de se proteger. Não é culpa deles.”

Han.

A HRW pediu a intervenção urgente dos legisladores brasileiros para proteger os direitos das crianças contra as tecnologias emergentes. Novas leis devem ser implementadas para proibir a extração de dados de crianças para modelos de IA, conforme as recomendações da HRW.

Reportagem Cryptopolitan de Enacy Mapakame

As mentes mais brilhantes do mundo das criptomoedas já leem nossa newsletter. Quer participar? Junte-se a elas.

Brasil

Compartilhe este artigo

Aviso Legal. As informações fornecidas não constituem aconselhamento de investimento. CryptopolitanO não se responsabiliza por quaisquer investimentos realizados com base nas informações fornecidas nesta página. Recomendamostrona realização de pesquisas independentesdent /ou a consulta a um profissional qualificado antes de tomar qualquer decisão de investimento.

Enacy Mapakame

Enacy Mapakame é jornalista com mais de 10 anos de experiência em notícias de negócios e finanças. Ela cobre mercados de capitais e tecnologias emergentes – o metaverso, IA e criptomoedas. Enacy é formada em Estudos de Mídia e Sociedade (BSc) com honras.

ÍNDICE

1. Bilhões de imagens de crianças brasileiras são usadas para treinar modelos de IA

2. Asdentdas crianças são facilmente trac

3. Proteger a privacidade das crianças

Compartilhe este artigo

MAIS… NOTÍCIAS

MOSTRAR TUDO

5 aplicações engenhosas do ChatGPT e o que você deve fazer a respeito

Há 3 anos, da área de tecnologia John Palmer,

93% dos líderes empresariais preferem soluções baseadas em IA para a gestão da sustentabilidade da marca, segundo a Reuters

Há 3 anos, da área de tecnologia John Palmer,

Eis como Macron apoia o ecossistema de IA vibrante e produtivo da França

Há 3 anos, Tech Glory Kaburu

A Bloomberg estima que o mercado de IA generativa atingirá US$ 1,3 trilhão até 2032

3 anos atrás, da área de tecnologia Aamir Sheikh,

O que é Base? A rede Ethereum de camada 2 lançada pela Coinbase

21 de outubro de 2025 Aprenda Criptomoedas: Guias para Iniciantes
Dogecoin vs. Bitcoin: Principais Diferenças Técnicas

20 de outubro de 2025 Aprenda Criptomoedas: Guias para Iniciantes
O que é TVL (Valor Total Bloqueado) em criptomoedas?

14 de outubro de 2025 Aprenda Criptomoedas: Guias para Iniciantes
Como ler um white paper de criptomoedas?

13 de outubro de 2025 Aprenda Criptomoedas: Guias para Iniciantes
Ripple vs. XRP vs. XRP Ledger: Qual a diferença?

13 de outubro de 2025 Aprenda Criptomoedas: Guias para Iniciantes
O que é uma carteira multisig em criptomoedas?

10 de outubro de 2025 Aprenda Criptomoedas: Guias para Iniciantes

INTENSIVO AVANÇADAS
CURSO

Quais criptomoedas podem te fazer ganhar dinheiro?
Como aumentar a segurança da sua carteira digital (e quais realmente valem a pena usar)
Estratégias de investimento pouco conhecidas que os profissionais utilizam
Como começar a investir em criptomoedas (quais corretoras usar, as melhores criptomoedas para comprar etc.)