ÚLTIMAS NOTÍCIAS
SELECIONADO PARA VOCÊ
SEMANALMENTE
MANTENHA-SE NO TOPO

As melhores informações sobre criptomoedas direto na sua caixa de entrada.

Documentos judiciais mostram que funcionários da Meta discutiram o uso de conteúdo protegido por direitos autorais para treinamento de IA

PorOwotunse AdebayoOwotunse Adebayo
Tempo de leitura: 3 minutos
Documentos judiciais mostram que funcionários da Meta discutiram o uso de conteúdo protegido por direitos autorais para treinamento de IA
  • Documentos judiciais mostraram que funcionários da Meta discutiram o uso de conteúdo protegido por direitos autorais para treinar seus modelos de inteligência artificial (IA).
  • Conversas internas de trabalho também mostraram como a empresa pode ter usado conteúdo juridicamente questionável para treinar seus modelos de IA.
  • Os documentos judiciais revelaram outras infrações, levando os demandantes a emendar o processo.

Documentos judiciais revelaram que funcionários da Meta discutiram o uso de conteúdo protegido por direitos autorais para treinar seus modelos de inteligência artificial. De acordo com documentos judiciais recentes, a maioria das discussões estava relacionada a conteúdo obtido por meios legalmente questionáveis.

Os documentos foram disponibilizados pelos autores da ação judicial Kadrey v. Meta, um dos muitos casos de direitos autorais envolvendo inteligência artificial que tramitaram nos tribunais dos Estados Unidos. Segundo a Meta, o uso de obras protegidas por direitos autorais, especialmente livros, para treinar seus modelos se enquadra na política de uso justo. No entanto, os autores da ação, liderados por Sarah Silverman e Ta-Nehisi Coates, discordam das alegações da empresa.

De acordo com documentos previamente divulgados, o CEO da Meta, Mark Zuckerberg, autorizou a equipe de IA da empresa a usar conteúdo protegido por direitos autorais para treinar seus modelos. Os documentos também mostraram que a empresa encerrou suas negociações de licenciamento de dados com editoras de livros.

A Meta supostamente usa conteúdo protegido por direitos autorais para treinar seus modelos de IA

De acordo com novos documentos apresentados ao tribunal, conversas internas de trabalho compartilhadas entre funcionários da Meta revelaram claramente como a empresa pode ter usado dados protegidos por direitos autorais para treinar seus modelos de IA, incluindo a maioria dos modelos da família Llama.

Uma das conversas envolveu uma executiva sênior da Meta, Melanie Kambadur, que é a Gerente Sênior da equipe de pesquisa Llama. Em sua conversa, ela falou sobre o treinamento dos modelos de IA em conteúdo que não tinha justificativa legal.

“Minha opinião seria (na linha de 'pedir perdão, não permissão'): tentamos obter os livros contábeis e levar a questão aos executivos para que eles tomem a decisão”, disse Xavier Martinet, engenheiro de pesquisa da Meta, em um bate-papo datado de fevereiro de 2023, de acordo com os documentos. “É por isso que eles criaram esta organização GenAI: para que possamos ser menos avessos ao risco”, acrescentou.

Martinet mencionou que a empresa poderia simplesmente comprar e-books a preços de varejo para construir o conjunto de dados de treinamento, em vez de firmar contratos de licenciamento com diferentes editoras. Embora outro funcionário tenha alertado sobre o uso desse conteúdo e as implicações legais, Martinet mencionou que outras empresas provavelmente também estavam usando livros pirateados para treinamento.

Na mesma conversa, Kambadur mencionou que a empresa estava em negociações com algumas plataformas para obter licenças, mas observou que, embora o uso de dados disponíveis publicamente exigisse aprovações, os advogados da empresa estavam menos conservadores do que no passado. "A diferença agora é que temos mais dinheiro, mais advogados, mais ajuda em desenvolvimento de negócios, capacidade de trac/escalar processos para obter maior rapidez, e os advogados estão sendo um pouco menos conservadores nas aprovações", disse Kambadur.

Os funcionários discutem o uso do Libgen

Segundo o processo, outra conversa de trabalho mostra Kambadur falando sobre o uso do Libgen, um site agregador que fornece links para conteúdo protegido por direitos autorais de editoras, como fonte de dados que a Meta poderia licenciar. O Libgen já foi processado diversas vezes, tendo a plataforma sido obrigada a encerrar seus serviços devido a alegações de violação de direitos autorais.

Enquanto um colega no chat postou uma foto com a legenda "Não, o Libgen não é legal", ficou evidente que alguns executivos da empresa acreditavam que não usar o Libgen poderia prejudicar sua competitividade na corrida da IA. Em um e-mail enviado por Sony Theakanath, diretor de gerenciamento de produtos da Meta, para Joelle Pineau, vice-presidente de IA da Meta, ele observou que o Libgen era importante para atingir os resultados de última geração (SOTA) em todas as categorias.

Theakanath também falou sobre várias maneiras pelas quais a empresa poderia reduzir a exposição legal, incluindo a remoção de dados marcados como roubados/pirateados e a não divulgação pública de outros usos. "Não divulgaríamos o uso dos conjuntos de dados Libgen utilizados para treinamento", disse ele. Na prática, a medida significava que a empresa primeiro revisaria os arquivos Libgen para verificar a presença de trabalhos "roubados ou pirateados".

Documentos judiciais revelam outras infrações

Em uma das conversas de trabalho, Kambadur também sugeriu que a equipe da Meta AI ajustasse os modelos para "evitar solicitações de IP arriscadas", o que configuraria os modelos para se recusarem a dar respostas aos usuários que tentam descobrir os e-books com os quais os modelos foram treinados.

Os documentos também revelaram outros detalhes, incluindo a possibilidade de a Meta ter usado do Reddit para treinar seu modelo e imitar o comportamento de um aplicativo de terceiros chamado Pushshift. O Reddit mencionou em um comunicado em abril de 2023 que começará a cobrar das empresas de IA pelo acesso aos dados para treinar seus modelos.

Os autores da presente ação judicial emendaram sua queixa diversas vezes desde o início do processo em 2023. O processo foi aberto no Tribunal Distrital dos EUA para o Distrito Norte da Califórnia, em São Francisco. Na última emenda, os autores alegaram que a Meta cruzou informações de livros pirateados com livros protegidos por direitos autorais para determinar se seria ideal firmar um de licenciamento . A Meta, por sua vez, considera o caso uma questão jurídica de grande importância e, por isso, contratou dois advogados com experiência em litígios perante a Suprema Corte para integrar sua equipe de defesa.

Se você está lendo isto, já está um passo à frente. Continue assim assinando nossa newsletter.

Compartilhe este artigo

Aviso Legal. As informações fornecidas não constituem aconselhamento de investimento. CryptopolitanO não se responsabiliza por quaisquer investimentos realizados com base nas informações fornecidas nesta página. Recomendamostrondentdentdentdentdentdentdentdent /ou a consulta a um profissional qualificado antes de tomar qualquer decisão de investimento.

MAIS… NOTÍCIAS
INTENSIVO AVANÇADAS
CURSO