ÚLTIMAS NOTÍCIAS
SELECIONADO PARA VOCÊ
SEMANALMENTE
MANTENHA-SE NO TOPO

As melhores informações sobre criptomoedas direto na sua caixa de entrada.

A OpenAI e a Microsoft enfrentam um novo processo judicial movido pelo CIR

PorRanda MosesRanda Moses
Tempo de leitura: 2 minutos
A OpenAI e a Microsoft enfrentam um novo processo judicial movido pelo Centro de Jornalismo Investigativo

Os logotipos do CIR e da OpenAI com um martelo de juiz ao fundo.

  • O CIR está processando a OpenAI e a Microsoft por descumprimento das leis de direitos autorais.
  • A OpenAI utilizou 17.849 URLs do CIR para treinar seus LLMs sem pedir permissão ou oferecer qualquer compensação. 
  • O CIR está buscando indenização por violação de direitos autorais e da DMCA, que pode chegar a milhões de dólares.

A OpenAI e a Microsoft estão enfrentando um novo processo movido pelo Center for Investigative Reporting (CIR). O CIR alega que a OpenAI utilizou conteúdo publicado nos sites Mother Jones e Reveal para treinar versões anteriores do ChatGPT.

Leia também: OpenAI descarta a voz ChatGPT após controvérsia com Scarlett Johansson 

A CIR, autora da ação, alega que a OpenAI utilizou seu conteúdo sem permissão ou promessa de compensação. A CIR, fundada em 1977, administra a revista americana sem fins lucrativos Mother Jones e o podcast Reveal. 

A CIR processa a OpenAI e a Microsoft por violação de direitos autorais 

O Centro de Jornalismo Investigativo (CIR, na sigla em inglês) entrou com uma ação judicial em um tribunal federal de Nova York na quinta-feira. A organização sem fins lucrativos acusa a OpenAI e a Microsoft de usar seu conteúdo sem permissão ou compensação. O CIR afirma que a OpenAI violou as leis de direitos autorais ao usar seu conteúdo para treinar o ChatGPT.

A CEO do CIR, Monika Bauerlein, afirmou: “Esse comportamento oportunista não é apenas injusto, é uma violação de direitos autorais. O trabalho dos jornalistas, tanto no CIR quanto em qualquer outro lugar, é valioso, e a OpenAI e a Microsoft sabem disso.”

Na queixa formal, o autor contratou um cientista de dados para analisar o OpenWebText . O OpenWebText é uma aproximação do WebText, que é um conjunto de páginas da web coletadas por meio de raspagem de dados, criado pela OpenAI. O cientista de dados descobriu que o conjunto de dados contém 17.434 URLs da Mother Jones e 415 da Reveal. O OpenWebText e o WebText apresentam números ligeiramente diferentes de artigos da Mother Jones porque o processo de raspagem ocorreu em dias diferentes.

O autor da ação afirmou na queixa formal:

“Ao incluírem obras jornalísticas em seus materiais de treinamento, os réus tiveram que escolher: respeitar ou não as obras jornalísticas. Os réus escolheram a segunda opção.”

Leia também: O cientista-chefe da OpenAI, Ilya Sutskever, se despede.

A OpenAI utilizou dois algoritmos, Dragnet e Newspaper, para construir o banco de dados WebText. O Dragnet foi projetado para separar o conteúdo principal do artigo de outras partes do site, como cabeçalho, rodapé, título, nome do autor e avisos de direitos autorais. Quando a OpenAI coletou dados do site da Mother Jones, removeu tudo o que estava no cabeçalho e no rodapé. Além disso, o criador do ChatGPT removeu o aviso de direitos autorais e as informações sobre os termos de uso, conforme a denúncia

Além disso, o autor da ação alega que a Microsoft sabia que os URLs extraídos continham conteúdo jornalístico sem nomes de autores, títulos e avisos de direitos autorais, facilitando a violação de direitos autorais pelo Bing AI e pelo ChatGPT.

O CIR busca ressarcimento dos lucros obtidos pela OpenAI e pela Microsoft, além de indenizações por danos reais ou estatutários. O valor estipulado é de, no mínimo, US$ 750 por obra infringida e US$ 2.500 por violação da DMCA.

A OpenAI enfrenta processos judiciais de outras publicações

Este não é o primeiro processo movido contra a OpenAI por violação de direitos autorais. Desde o lançamento do ChatGPT no final de 2022, a OpenAI e a Microsoft enfrentaram inúmeros processos judiciais movidos por grandes veículos de comunicação, como o New York Times, The Intercept, New York Daily News e Chicago Tribune.

Leia também: Funcionários alegam que OpenAI e Google DeepMind estão ocultando riscos de IA

Entretanto, algumas das principais editoras e gigantes da internet assinaram contratos de licenciamento com a OpenAI, dando-lhe acesso aos seus arquivos. Entre elas estão a revista TIME, a News Corp, o Financial Times, a Vox Media, a Associated Press, a The Atlantic, o Stack Overflow e o Reddit.


Reportagem Cryptopolitan por Randa Moses

As mentes mais brilhantes do mundo das criptomoedas já leem nossa newsletter. Quer participar? Junte-se a elas.

Compartilhe este artigo

Aviso Legal. As informações fornecidas não constituem aconselhamento de investimento. CryptopolitanO não se responsabiliza por quaisquer investimentos realizados com base nas informações fornecidas nesta página. Recomendamostrona realização de pesquisas independentesdent /ou a consulta a um profissional qualificado antes de tomar qualquer decisão de investimento.

Randa Moses

Randa Moses

Randa Moses é editora e repórter da Cryptopolitan onde cobre tecnologia, IA, robótica, criptomoedas, golpes e ataques cibernéticos. Ela trabalha no universo das criptomoedas desde 2017, tendo atuado na Forward Protocol, AmaZix e Cryptosomniac. Randa é formada em Engenharia Elétrica etronpela Universidade de Bradford.

MAIS… NOTÍCIAS
CURSO INTENSIVO DE CRIPTOMOEDAS AVANÇADAS