ÚLTIMAS NOTÍCIAS

ao vivo O Federal Reserve mantém as taxas de juros inalteradas na primeira reunião de Kevin Warsh

Atualizações ao vivo há 9 minutos
ao vivo Bitcoin dispara para US$ 67.000 com o acordo de paz entre Trump e Irã impulsionando os mercados a um alto patamar

Atualizações ao vivo de 15 de junho de 2026
Frontier dobra fundo para remoção de carbono para US$ 1,8 bilhão com novo apoio de grandes empresas de tecnologia

53 minutos atrás Tecnologia
O novo parceiro da Kalshi permite que os empregadores tracas negociações do mercado de previsão de funcionários

Notícias de 1 hora atrás

SELECIONADO PARA VOCÊ

Frontier dobra fundo para remoção de carbono para US$ 1,8 bilhão com novo apoio de grandes empresas de tecnologia

53 minutos atrás Tecnologia
Os EUA investem US$ 500 milhões na SandboxAQ em materiais para chips projetados por IA

4 horas atrás Tecnologia
Xiaohongshu almeja avaliação de US$ 70 bilhões em IPO em Hong Kong

11 horas atrás Tecnologia

SEMANALMENTE

MANTENHA-SE NO TOPO

As melhores informações sobre criptomoedas direto na sua caixa de entrada.

Documentos judiciais mostram que funcionários da Meta discutiram o uso de conteúdo protegido por direitos autorais para treinamento de IA

Por

Owotunse Adebayo

Tempo de leitura: 3 minutos - 22 de fevereiro de 2025

Documentos judiciais mostram que funcionários da Meta discutiram o uso de conteúdo protegido por direitos autorais para treinamento de IA

Documentos judiciais mostraram que funcionários da Meta discutiram o uso de conteúdo protegido por direitos autorais para treinar seus modelos de inteligência artificial (IA).
Conversas internas de trabalho também mostraram como a empresa pode ter usado conteúdo juridicamente questionável para treinar seus modelos de IA.
Os documentos judiciais revelaram outras infrações, levando os demandantes a emendar o processo.

Documentos judiciais revelaram que funcionários da Meta discutiram o uso de conteúdo protegido por direitos autorais para treinar seus modelos de inteligência artificial. De acordo com documentos judiciais recentes, a maioria das discussões estava relacionada a conteúdo obtido por meios legalmente questionáveis.

Os documentos foram disponibilizados pelos autores da ação judicial Kadrey v. Meta, um dos muitos casos de direitos autorais envolvendo inteligência artificial que tramitaram nos tribunais dos Estados Unidos. Segundo a Meta, o uso de obras protegidas por direitos autorais, especialmente livros, para treinar seus modelos se enquadra na política de uso justo. No entanto, os autores da ação, liderados por Sarah Silverman e Ta-Nehisi Coates, discordam das alegações da empresa.

De acordo com documentos previamente divulgados, o CEO da Meta, Mark Zuckerberg, autorizou a equipe de IA da empresa a usar conteúdo protegido por direitos autorais para treinar seus modelos. Os documentos também mostraram que a empresa encerrou suas negociações de licenciamento de dados com editoras de livros.

A Meta supostamente usa conteúdo protegido por direitos autorais para treinar seus modelos de IA

De acordo com novos documentos apresentados ao tribunal, conversas internas de trabalho compartilhadas entre funcionários da Meta revelaram claramente como a empresa pode ter usado dados protegidos por direitos autorais para treinar seus modelos de IA, incluindo a maioria dos modelos da família Llama.

Uma das conversas envolveu uma executiva sênior da Meta, Melanie Kambadur, que é a Gerente Sênior da equipe de pesquisa Llama. Em sua conversa, ela falou sobre o treinamento dos modelos de IA em conteúdo que não tinha justificativa legal.

“Minha opinião seria (na linha de 'pedir perdão, não permissão'): tentamos obter os livros contábeis e levar a questão aos executivos para que eles tomem a decisão”, disse Xavier Martinet, engenheiro de pesquisa da Meta, em um bate-papo datado de fevereiro de 2023, de acordo com os documentos. “É por isso que eles criaram esta organização GenAI: para que possamos ser menos avessos ao risco”, acrescentou.

Martinet mencionou que a empresa poderia simplesmente comprar e-books a preços de varejo para construir o conjunto de dados de treinamento, em vez de firmar contratos de licenciamento com diferentes editoras. Embora outro funcionário tenha alertado sobre o uso desse conteúdo e as implicações legais, Martinet mencionou que outras empresas provavelmente também estavam usando livros pirateados para treinamento.

Na mesma conversa, Kambadur mencionou que a empresa estava em negociações com algumas plataformas para obter licenças, mas observou que, embora o uso de dados disponíveis publicamente exigisse aprovações, os advogados da empresa estavam menos conservadores do que no passado. "A diferença agora é que temos mais dinheiro, mais advogados, mais ajuda em desenvolvimento de negócios, capacidade de trac/escalar processos para obter maior rapidez, e os advogados estão sendo um pouco menos conservadores nas aprovações", disse Kambadur.

Os funcionários discutem o uso do Libgen

Segundo o processo, outra conversa de trabalho mostra Kambadur falando sobre o uso do Libgen, um site agregador que fornece links para conteúdo protegido por direitos autorais de editoras, como fonte de dados que a Meta poderia licenciar. O Libgen já foi processado diversas vezes, tendo a plataforma sido obrigada a encerrar seus serviços devido a alegações de violação de direitos autorais.

Enquanto um colega no chat postou uma foto com a legenda "Não, o Libgen não é legal", ficou evidente que alguns executivos da empresa acreditavam que não usar o Libgen poderia prejudicar sua competitividade na corrida da IA. Em um e-mail enviado por Sony Theakanath, diretor de gerenciamento de produtos da Meta, para Joelle Pineau, vice-presidente de IA da Meta, ele observou que o Libgen era importante para atingir os resultados de última geração (SOTA) em todas as categorias.

Theakanath também falou sobre várias maneiras pelas quais a empresa poderia reduzir a exposição legal, incluindo a remoção de dados marcados como roubados/pirateados e a não divulgação pública de outros usos. "Não divulgaríamos o uso dos conjuntos de dados Libgen utilizados para treinamento", disse ele. Na prática, a medida significava que a empresa primeiro revisaria os arquivos Libgen para verificar a presença de trabalhos "roubados ou pirateados".

Documentos judiciais revelam outras infrações

Em uma das conversas de trabalho, Kambadur também sugeriu que a equipe da Meta AI ajustasse os modelos para "evitar solicitações de IP arriscadas", o que configuraria os modelos para se recusarem a dar respostas aos usuários que tentam descobrir os e-books com os quais os modelos foram treinados.

Os documentos também revelaram outros detalhes, incluindo a possibilidade de a Meta ter usado do Reddit para treinar seu modelo e imitar o comportamento de um aplicativo de terceiros chamado Pushshift. O Reddit mencionou em um comunicado em abril de 2023 que começará a cobrar das empresas de IA pelo acesso aos dados para treinar seus modelos.

Os autores da presente ação judicial emendaram sua queixa diversas vezes desde o início do processo em 2023. O processo foi aberto no Tribunal Distrital dos EUA para o Distrito Norte da Califórnia, em São Francisco. Na última emenda, os autores alegaram que a Meta cruzou informações de livros pirateados com livros protegidos por direitos autorais para determinar se seria ideal firmar um de licenciamento . A Meta, por sua vez, considera o caso uma questão jurídica de grande importância e, por isso, contratou dois advogados com experiência em litígios perante a Suprema Corte para integrar sua equipe de defesa.

Se você está lendo isto, já está um passo à frente. Continue assim assinando nossa newsletter.

Libgen Meta Pushshift Reddit USD

Compartilhe este artigo

Aviso Legal. As informações fornecidas não constituem aconselhamento de investimento. CryptopolitanO não se responsabiliza por quaisquer investimentos realizados com base nas informações fornecidas nesta página. Recomendamostrona realização de pesquisas independentesdent /ou a consulta a um profissional qualificado antes de tomar qualquer decisão de investimento.

Owotunse Adebayo

Adebayo é um escritor com quatro anos de experiência no universo das criptomoedas. Ele se formou na Universidade de Lagos, onde estudou Planejamento Urbano e Regional. Adebayo trabalhou na Tokenhell e na CryptoTicker, escrevendo notícias sobre criptomoedas e fintechs. Atualmente, ele é colaborador do Cryptopolitan.

ÍNDICE

1. A Meta supostamente usa conteúdo protegido por direitos autorais para treinar seus modelos de IA

2. Os funcionários discutem o uso do Libgen

3. Documentos judiciais revelam outras infrações

Compartilhe este artigo

MAIS… NOTÍCIAS

MOSTRAR TUDO

5 aplicações engenhosas do ChatGPT e o que você deve fazer a respeito

Há 3 anos, John Palmer, da área de tecnologia

93% dos líderes empresariais preferem soluções baseadas em IA para a gestão da sustentabilidade da marca, segundo a Reuters

Há 3 anos, John Palmer, da área de tecnologia

Eis como Macron apoia o ecossistema de IA vibrante e produtivo da França

Há 3 anos, Tech Glory Kaburu

A Bloomberg estima que o mercado de IA generativa atingirá US$ 1,3 trilhão até 2032

3 anos atrás, Aamir Sheikh, da área de tecnologia

O que é Base? A rede Ethereum de camada 2 lançada pela Coinbase

21 de outubro de 2025 Aprenda Criptomoedas: Guias para Iniciantes
Dogecoin vs. Bitcoin: Principais Diferenças Técnicas

20 de outubro de 2025 Aprenda Criptomoedas: Guias para Iniciantes
O que é TVL (Valor Total Bloqueado) em criptomoedas?

14 de outubro de 2025 Aprenda Criptomoedas: Guias para Iniciantes
Como ler um white paper de criptomoedas?

13 de outubro de 2025 Aprenda Criptomoedas: Guias para Iniciantes
Ripple vs. XRP vs. XRP Ledger: Qual a diferença?

13 de outubro de 2025 Aprenda Criptomoedas: Guias para Iniciantes
O que é uma carteira multisig em criptomoedas?

10 de outubro de 2025 Aprenda Criptomoedas: Guias para Iniciantes

CURSO INTENSIVO DE CRIPTOMOEDAS AVANÇADAS

Quais criptomoedas podem te fazer ganhar dinheiro?
Como aumentar a segurança da sua carteira digital (e quais realmente valem a pena usar)
Estratégias de investimento pouco conhecidas que os profissionais utilizam
Como começar a investir em criptomoedas (quais corretoras usar, as melhores criptomoedas para comprar etc.)