A OpenAI e a Microsoft enfrentam um novo processo judicial movido pelo CIR

- O CIR está processando a OpenAI e a Microsoft por descumprimento das leis de direitos autorais.
- A OpenAI utilizou 17.849 URLs do CIR para treinar seus LLMs sem pedir permissão ou oferecer qualquer compensação.
- O CIR está buscando indenização por violação de direitos autorais e da DMCA, que pode chegar a milhões de dólares.
A OpenAI e a Microsoft estão enfrentando um novo processo movido pelo Center for Investigative Reporting (CIR). O CIR alega que a OpenAI utilizou conteúdo publicado nos sites Mother Jones e Reveal para treinar versões anteriores do ChatGPT.
Leia também: OpenAI descarta a voz ChatGPT após controvérsia com Scarlett Johansson
A CIR, autora da ação, alega que a OpenAI utilizou seu conteúdo sem permissão ou promessa de compensação. A CIR, fundada em 1977, administra a revista americana sem fins lucrativos Mother Jones e o podcast Reveal.
A CIR processa a OpenAI e a Microsoft por violação de direitos autorais
O Centro de Jornalismo Investigativo (CIR, na sigla em inglês) entrou com uma ação judicial em um tribunal federal de Nova York na quinta-feira. A organização sem fins lucrativos acusa a OpenAI e a Microsoft de usar seu conteúdo sem permissão ou compensação. O CIR afirma que a OpenAI violou as leis de direitos autorais ao usar seu conteúdo para treinar o ChatGPT.
A CEO do CIR, Monika Bauerlein, afirmou: “Esse comportamento oportunista não é apenas injusto, é uma violação de direitos autorais. O trabalho dos jornalistas, tanto no CIR quanto em qualquer outro lugar, é valioso, e a OpenAI e a Microsoft sabem disso.”
🚨[Processo judicial sobre direitos autorais de IA] O Center for Investigative Reporting (responsável pelo @MotherJones e @reveal) processa a OpenAI e a Microsoft por violação de direitos autorais. Citações:
"Os réus copiaram, usaram, resumiram e exibiram o valioso conteúdo do CIR sem a permissão ou autorização do CIR, e… pic.twitter.com/SeZ0VtDOMY
— Luiza Jarovsky, PhD (@LuizaJarovsky) 29 de junho de 2024
Na queixa formal, o autor contratou um cientista de dados para analisar o OpenWebText . O OpenWebText é uma aproximação do WebText, que é um conjunto de páginas da web coletadas por meio de raspagem de dados, criado pela OpenAI. O cientista de dados descobriu que o conjunto de dados contém 17.434 URLs da Mother Jones e 415 da Reveal. O OpenWebText e o WebText apresentam números ligeiramente diferentes de artigos da Mother Jones porque o processo de raspagem ocorreu em dias diferentes.
O autor da ação afirmou na queixa formal:
“Ao incluírem obras jornalísticas em seus materiais de treinamento, os réus tiveram que escolher: respeitar ou não as obras jornalísticas. Os réus escolheram a segunda opção.”
Leia também: O cientista-chefe da OpenAI, Ilya Sutskever, se despede.
A OpenAI utilizou dois algoritmos, Dragnet e Newspaper, para construir o banco de dados WebText. O Dragnet foi projetado para separar o conteúdo principal do artigo de outras partes do site, como cabeçalho, rodapé, título, nome do autor e avisos de direitos autorais. Quando a OpenAI coletou dados do site da Mother Jones, removeu tudo o que estava no cabeçalho e no rodapé. Além disso, o criador do ChatGPT removeu o aviso de direitos autorais e as informações sobre os termos de uso, conforme a denúncia.
Além disso, o autor da ação alega que a Microsoft sabia que os URLs extraídos continham conteúdo jornalístico sem nomes de autores, títulos e avisos de direitos autorais, facilitando a violação de direitos autorais pelo Bing AI e pelo ChatGPT.
O CIR busca ressarcimento dos lucros obtidos pela OpenAI e pela Microsoft, além de indenizações por danos reais ou estatutários. O valor estipulado é de, no mínimo, US$ 750 por obra infringida e US$ 2.500 por violação da DMCA.
A OpenAI enfrenta processos judiciais de outras publicações
Este não é o primeiro processo movido contra a OpenAI por violação de direitos autorais. Desde o lançamento do ChatGPT no final de 2022, a OpenAI e a Microsoft enfrentaram inúmeros processos judiciais movidos por grandes veículos de comunicação, como o New York Times, The Intercept, New York Daily News e Chicago Tribune.
Leia também: Funcionários alegam que OpenAI e Google DeepMind estão ocultando riscos de IA
Entretanto, algumas das principais editoras e gigantes da internet assinaram contratos de licenciamento com a OpenAI, dando-lhe acesso aos seus arquivos. Entre elas estão a revista TIME, a News Corp, o Financial Times, a Vox Media, a Associated Press, a The Atlantic, o Stack Overflow e o Reddit.
Reportagem Cryptopolitan por Randa Moses
As mentes mais brilhantes do mundo das criptomoedas já leem nossa newsletter. Quer participar? Junte-se a elas.
Aviso Legal. As informações fornecidas não constituem aconselhamento de investimento. CryptopolitanO não se responsabiliza por quaisquer investimentos realizados com base nas informações fornecidas nesta página. Recomendamostrondentdentdentdentdentdentdentdent /ou a consulta a um profissional qualificado antes de tomar qualquer decisão de investimento.
CURSO
- Quais criptomoedas podem te fazer ganhar dinheiro?
- Como aumentar a segurança da sua carteira digital (e quais realmente valem a pena usar)
- Estratégias de investimento pouco conhecidas que os profissionais utilizam
- Como começar a investir em criptomoedas (quais corretoras usar, as melhores criptomoedas para comprar etc.)















