Your bank is using your money. You’re getting the scraps.WATCH FREE

A NVIDIA enfrenta investigação por suposta coleta ilegal de dados para modelos de IA

Neste post:

  • Documentos vazados mostram que a NVIDIA coletou dados de filmes e vídeos do YouTube sem consentimento.
  • A NVIDIA afirma que a coleta de dados que realiza é legal sob as disposições de uso justo.
  • Comunicações internas mostram que alguns funcionários estavam preocupados com questões legais.

Documentos vazados obtidos pela 404 Media sugerem que a NVIDIA se envolveu em coleta de dados sem licença, usando imagens de filmes e jogos da internet para treinar seus produtos de inteligência artificial. 

Os documentos vazados revelam que eles estavam tentando baixar filmes completos de vários canais, incluindo a Netflix, e seu principal interesse eram vídeos do YouTube. De acordo com os e-mails obtidos pela 404 Media, os gerentes do projeto pretendiam usar entre 20 e 30 máquinas virtuais na Amazon Web Services para obter o equivalente a 80 anos de vídeos em um único dia.

A NVIDIA defende suas ações e invoca as disposições de uso justo

A extração de dados é a prática detracconteúdo de vídeo, texto e áudio da internet sem a permissão dos proprietários do conteúdo para treinar modelos de IA. Essa prática pode ser vista como o uso de conteúdo de plataformas de mídia social que contêm conteúdo protegido por direitos autorais. 

A NVIDIA afirmou que não infringiu nenhuma lei de direitos autorais no processo de coleta de dados. A empresa também declarou que suas atividades se enquadram na doutrina do uso justo, pois utiliza material protegido por direitos autorais para o treinamento de IA.

Documentos obtidos por meio de comunicações internas pela 404 Media indicam que alguns funcionários da NVIDIA expressaram preocupação com essas atividades de coleta de dados. No entanto, os gerentes de projeto supostamente minimizaram as preocupações, afirmando que questões legais, como violações dos Termos de Serviço do YouTube, seriam tratadas posteriormente. 

Veja também:  Cazaquistão lançará seu primeiro modelo linguístico abrangente

Um funcionário destacou que os engenheiros de IA da NVIDIA tentaram obter o máximo possível de clipes de jogos para enriquecer o conjunto de treinamento. Isso envolveu a transmissão das partidas para o serviço em nuvem GeForce Now da NVIDIA, a fim de gravar vídeos de jogos em alta defi. Jim Fan, analista sênior de pesquisa, também enfatizou, em mensagens internas, a importância dessas gravações como entrada para o treinamento do modelo de IA.

A empresa toma medidas para gerenciar a percepção pública das práticas de dados

Os documentos também detalham as tentativas da NVIDIA de minimizar os danos causados ​​pelas repercussões dessas práticas. De acordo com e-mails vazados, o vice-presidente de Pesquisa, Ming-Yu Liu, recomendou que a empresa evitasse divulgar quaisquer documentos relacionados às técnicas de coleta de dados para prevenir reações negativas do público. A empresa também criou seu próprio conjunto de ferramentas de coleta de dados do YouTube e contas de API para auxiliar no processo de coleta de dados.

A situação jurídica em relação às normas que regem o uso de IA na extração de dados ainda não está muito clara. Segundo Robert Mahari, do MIT, pode ser bastante complexo comprovar que a extração de dados de fato ocorreu. As organizações podem se beneficiar ao não revelar as fontes de seus dados de treinamento, já que fica difícil comprovar o uso indevido na ausência de provas concretas. 

Outra plataforma, a Suno, uma plataforma de geração de música por IA, recentemente ganhou destaque por admitir o uso de extração de dados para treinar modelos de inteligência artificial. Como relatado anteriormente pela Cryptopolitan, o CEO do Reddit, Steve Huffman, afirmou que a empresa continuará proibindo a Microsoft e outras empresas de IA de usar a extração de dados até que o pagamento seja feito e a plataforma obtenha o controle sobre como os dados são usados. Ele disse que o Reddit não permitirá a extração de dados para treinamento de modelos de IA sem a licença adequada. 

Veja também:  Buscas no Google por 'IA' superam Bitcoin e criptomoedas em 2023

O cartão de criptomoedas sem limite de gastos. Receba 3% cash e faça pagamentos instantâneos pelo celular. Solicite seu cartão Ether.fi.

Compartilhar link:

Aviso Legal. As informações fornecidas não constituem aconselhamento de investimento. O Cryptopolitan não se responsabiliza por quaisquer investimentos realizados com base nas informações fornecidas nesta página. Recomendamos tron a realização de pesquisas independentes dent /ou a consulta a um profissional qualificado antes de tomar qualquer decisão de investimento.

Mais lidas

Carregando os artigos mais lidos...

Fique por dentro das notícias sobre criptomoedas e receba atualizações diárias na sua caixa de entrada

Escolha do editor

Carregando artigos selecionados pela equipe editorial...

- A newsletter de criptomoedas que te mantém sempre um passo à frente -

Os mercados se movem rapidamente.

Nós nos movemos mais rápido.

Assine o Cryptopolitan Daily e receba informações oportunas, precisas e relevantes sobre criptomoedas diretamente na sua caixa de entrada.

Inscreva-se agora e
não perca nenhum lance.

Entre. Informe-se.
Saia na frente.

Inscreva-se no CryptoPolitan