Controvérsia sobre conjunto de dados de imagens de IA: Material de abuso sexual infantil gera alarmes

By Editah Patrick
Atualizado em: 23 de dezembro de 2023, 9h51 UTC

2 minutos de leitura

Adicione-nos como sua fonte preferida no Google

429263

Conteúdo

1. Descoberta perturbadora no conjunto de dados LAION-5B

2. Desvendando o processo de treinamento de IA

3. Ambigüidades legais e dilemas éticos

4. A crescente ameaça do CSAM gerado por IA

5. Em busca de uma solução: abordagem multissetorial

6. Navegando pelo lado sombrio do avanço da IA

Compartilhar link:

Neste post:

O conjunto de dados de IA LAION-5B, crucial para o treinamento de modelos, continha imagens suspeitas de abuso infantil, o que levou à sua remoção e investigação.

O modelo estável Diffusion AI afirma que filtros internos impedem a obtenção de conteúdo ilegal, abordando as preocupações levantadas pela controvérsia do conjunto de dados LAION-5B.

Incertezas legais cercam conjuntos de dados de IA, como o LAION-5B, conforme um estudo revela desafios em distinguir conteúdo gerado por IA de conteúdo ilegal real.

Em uma revelação recente, o Observatório da Internet de Stanford descobriu uma realidade preocupante no campo do desenvolvimento da inteligência artificial (IA). O maior conjunto de dados de imagens usado para treinar modelos de geração de imagens por IA, o LAION-5B, continha 3.226 imagens suspeitas de serem material de abuso sexual infantil (CSAM). Essa revelação levou o LAION atracrapidamente o conjunto de dados do acesso público, prometendo garantir uma análise minuciosa para eliminar qualquer conteúdo inseguro.

Descoberta perturbadora no conjunto de dados LAION-5B

O LAION-5B, um conjunto de dados de código aberto com mais de 5,8 bilhões de pares de URLs de imagens online e suas respectivas legendas, serve como base para o treinamento de diversos modelos de IA, incluindo o popular Stable Diffusion. Criado por meio da coleta de dados da internet utilizando o Common Crawl, o conjunto de dados passou a ser alvo de escrutínio quando pesquisadores liderados por David Thiel, da Universidade Stanford, utilizaram os classificadores NSFW do LAION e o PhotoDNA, uma ferramenta comum de moderação de conteúdo. A investigação revelou a presença alarmante de conteúdo suspeito de abuso sexual infantil online (CSAM, na sigla em inglês) no conjunto de dados, o que levou a medidas imediatas.

Desvendando o processo de treinamento de IA

O processo de treinamento de IA envolve a utilização de vastos conjuntos de dados, como o LAION-5B, permitindo que os modelos aprendam e gerem conteúdo. A Stable Diffusion, um modelo de IA proeminente nesse cenário, garantiu à 404 Media que filtros internos estão em vigor para eliminar materiais ilegais e ofensivos dos dados usados no treinamento. Além disso, a empresa afirma que esses filtros se estendem à saída gerada, garantindo que tanto as instruções de entrada quanto as imagens geradas por IA estejam isentas de qualquer conteúdo ilícito.

Veja também: Cortes de US$ 1 bilhão: principal cientista da Microsoft afirma que Trump está dando vantagem à China em IA

Ambigüidades legais e dilemas éticos

A legalidade de conjuntos de dados como o LAION-5B torna-se uma área cinzenta sob a lei federal dos EUA. Embora a posse e a transmissão de CSAM (material de abuso sexual infantil) sejam inequivocamente ilegais, o conjunto de dados, que contém apenas URLs e não as imagens em si, complica a situação. O desafio maior reside na crescente dificuldade de distinguir CSAM gerado por IA (inteligência artificial) de conteúdo ilícito real. Com a proliferação da IA, abordar essas preocupações exige a colaboração entre legisladores, autoridades policiais, a indústria de tecnologia, a academia e o público em geral.

A crescente ameaça do CSAM gerado por IA

Embora o número de imagens sinalizadas no vasto conjunto de dados LAION-5B possa parecer estatisticamente insignificante, com 3.226 imagens em um total de 5,8 bilhões, o impacto potencial em modelos generativos de IA é substancial. A tênue linha que separa imagens autênticas de CSAM (Acidentes de Trânsito em Cadeia da Segurança) e suas contrapartes geradas por IA ressalta a urgência de abordar essa questão de forma abrangente. À medida que a IA continua a avançar, mitigar os riscos associados a dados de treinamento contaminados torna-se imprescindível.

Em busca de uma solução: abordagem multissetorial

O estudo conduzido por David Thiel e sua equipe enfatiza a necessidade de uma abordagem multifacetada para lidar com as implicações mais negativas da proliferação da IA. As soluções devem emanar de medidas legislativas, estratégias de aplicação da lei, melhores práticas da indústria, pesquisa acadêmica e conscientização da sociedade. A colaboração desses atores é fundamental para navegar de forma responsável pelo complexo cenário do desenvolvimento da IA.

Veja também: Wikipédia entra com recurso em batalha judicial contra site de notícias local indiano

Navegando pelo lado sombrio do avanço da IA

A controvérsia em torno do conjunto de dados LAION-5B serve como um forte lembrete dos desafios éticos que acompanham a rápida evolução da IA. A interseção entre tecnologia e bem-estar social exige um esforço proativo e colaborativo para garantir que o desenvolvimento da IA permaneça eticamente sólido e alinhado com os padrões legais. Os próximos anos, sem dúvida, testemunharão um esforço conjunto de diversas partes para abordar e retificar as consequências preocupantes reveladas pelo estudo do Observatório da Internet de Stanford. Nesse processo, a responsabilidade coletiva de proteger contra o uso indevido da tecnologia de IA torna-se mais crucial do que nunca.

Ainda deixa o banco ficar com a melhor parte? Assista ao nosso vídeo gratuito sobre como ser seu próprio banco.

Compartilhar link:

Leia o aviso legal

Aviso Legal. As informações fornecidas não constituem aconselhamento de investimento. CryptopolitanO não se responsabiliza por quaisquer investimentos realizados com base nas informações fornecidas nesta página. Recomendamostrondentdentdentdentdentdentdentdent /ou a consulta a um profissional qualificado antes de tomar qualquer decisão de investimento.

Escolha do editor

Carregando artigos selecionados pela equipe editorial...

Controvérsia sobre conjunto de dados de imagens de IA: Material de abuso sexual infantil gera alarmes

Conteúdo

Neste post:

Descoberta perturbadora no conjunto de dados LAION-5B

Desvendando o processo de treinamento de IA

Ambigüidades legais e dilemas éticos

A crescente ameaça do CSAM gerado por IA

Em busca de uma solução: abordagem multissetorial

Navegando pelo lado sombrio do avanço da IA

Compartilhar link:

Mais lidas

Fique por dentro das notícias sobre criptomoedas e receba atualizações diárias na sua caixa de entrada

Escolha do editor

Cadastre-se e fique por dentro do topo

Os mercados se movem rapidamente.

Nós nos movemos mais rápido.

Entre. Informe-se.
Saia na frente.

Controvérsia sobre conjunto de dados de imagens de IA: Material de abuso sexual infantil gera alarmes

Conteúdo

Neste post:

Descoberta perturbadora no conjunto de dados LAION-5B

Desvendando o processo de treinamento de IA

Ambigüidades legais e dilemas éticos

A crescente ameaça do CSAM gerado por IA

Em busca de uma solução: abordagem multissetorial

Navegando pelo lado sombrio do avanço da IA

Compartilhar link:

Mais lidas

Fique por dentro das notícias sobre criptomoedas e receba atualizações diárias na sua caixa de entrada

Escolha do editor

Cadastre-se e fique por dentro do topo

Siga-nos

- A newsletter de criptomoedas que te mantém sempre um passo à frente -

Os mercados se movem rapidamente.

Nós nos movemos mais rápido.

Entre. Informe-se. Saia na frente.

Entre. Informe-se.
Saia na frente.