ÚLTIMAS NOTÍCIAS
SELECIONADO PARA VOCÊ
SEMANALMENTE
MANTENHA-SE NO TOPO

As melhores informações sobre criptomoedas direto na sua caixa de entrada.

A OpenAI e a Microsoft enfrentam um novo processo judicial movido pelo CIR

PorRanda MosesRanda Moses
Tempo de leitura: 2 minutos
A OpenAI e a Microsoft enfrentam um novo processo judicial movido pelo Centro de Jornalismo Investigativo
  • O CIR está processando a OpenAI e a Microsoft por descumprimento das leis de direitos autorais.
  • A OpenAI utilizou 17.849 URLs do CIR para treinar seus LLMs sem pedir permissão ou oferecer qualquer compensação. 
  • O CIR está buscando indenização por violação de direitos autorais e da DMCA, que pode chegar a milhões de dólares.

A OpenAI e a Microsoft estão enfrentando um novo processo movido pelo Center for Investigative Reporting (CIR). O CIR alega que a OpenAI utilizou conteúdo publicado nos sites Mother Jones e Reveal para treinar versões anteriores do ChatGPT.

Leia também: OpenAI descarta a voz ChatGPT após controvérsia com Scarlett Johansson 

A CIR, autora da ação, alega que a OpenAI utilizou seu conteúdo sem permissão ou promessa de compensação. A CIR, fundada em 1977, administra a revista americana sem fins lucrativos Mother Jones e o podcast Reveal. 

A CIR processa a OpenAI e a Microsoft por violação de direitos autorais 

O Centro de Jornalismo Investigativo (CIR, na sigla em inglês) entrou com uma ação judicial em um tribunal federal de Nova York na quinta-feira. A organização sem fins lucrativos acusa a OpenAI e a Microsoft de usar seu conteúdo sem permissão ou compensação. O CIR afirma que a OpenAI violou as leis de direitos autorais ao usar seu conteúdo para treinar o ChatGPT.

A CEO do CIR, Monika Bauerlein, afirmou: “Esse comportamento oportunista não é apenas injusto, é uma violação de direitos autorais. O trabalho dos jornalistas, tanto no CIR quanto em qualquer outro lugar, é valioso, e a OpenAI e a Microsoft sabem disso.”

Na queixa formal, o autor contratou um cientista de dados para analisar o OpenWebText . O OpenWebText é uma aproximação do WebText, que é um conjunto de páginas da web coletadas por meio de raspagem de dados, criado pela OpenAI. O cientista de dados descobriu que o conjunto de dados contém 17.434 URLs da Mother Jones e 415 da Reveal. O OpenWebText e o WebText apresentam números ligeiramente diferentes de artigos da Mother Jones porque o processo de raspagem ocorreu em dias diferentes.

O autor da ação afirmou na queixa formal:

“Ao incluírem obras jornalísticas em seus materiais de treinamento, os réus tiveram que escolher: respeitar ou não as obras jornalísticas. Os réus escolheram a segunda opção.”

Leia também: O cientista-chefe da OpenAI, Ilya Sutskever, se despede.

A OpenAI utilizou dois algoritmos, Dragnet e Newspaper, para construir o banco de dados WebText. O Dragnet foi projetado para separar o conteúdo principal do artigo de outras partes do site, como cabeçalho, rodapé, título, nome do autor e avisos de direitos autorais. Quando a OpenAI coletou dados do site da Mother Jones, removeu tudo o que estava no cabeçalho e no rodapé. Além disso, o criador do ChatGPT removeu o aviso de direitos autorais e as informações sobre os termos de uso, conforme a denúncia

Além disso, o autor da ação alega que a Microsoft sabia que os URLs extraídos continham conteúdo jornalístico sem nomes de autores, títulos e avisos de direitos autorais, facilitando a violação de direitos autorais pelo Bing AI e pelo ChatGPT.

O CIR busca ressarcimento dos lucros obtidos pela OpenAI e pela Microsoft, além de indenizações por danos reais ou estatutários. O valor estipulado é de, no mínimo, US$ 750 por obra infringida e US$ 2.500 por violação da DMCA.

A OpenAI enfrenta processos judiciais de outras publicações

Este não é o primeiro processo movido contra a OpenAI por violação de direitos autorais. Desde o lançamento do ChatGPT no final de 2022, a OpenAI e a Microsoft enfrentaram inúmeros processos judiciais movidos por grandes veículos de comunicação, como o New York Times, The Intercept, New York Daily News e Chicago Tribune.

Leia também: Funcionários alegam que OpenAI e Google DeepMind estão ocultando riscos de IA

Entretanto, algumas das principais editoras e gigantes da internet assinaram contratos de licenciamento com a OpenAI, dando-lhe acesso aos seus arquivos. Entre elas estão a revista TIME, a News Corp, o Financial Times, a Vox Media, a Associated Press, a The Atlantic, o Stack Overflow e o Reddit.


Reportagem Cryptopolitan por Randa Moses

As mentes mais brilhantes do mundo das criptomoedas já leem nossa newsletter. Quer participar? Junte-se a elas.

Compartilhe este artigo

Aviso Legal. As informações fornecidas não constituem aconselhamento de investimento. CryptopolitanO não se responsabiliza por quaisquer investimentos realizados com base nas informações fornecidas nesta página. Recomendamostrondentdentdentdentdentdentdentdent /ou a consulta a um profissional qualificado antes de tomar qualquer decisão de investimento.

MAIS… NOTÍCIAS
INTENSIVO AVANÇADAS
CURSO