OpenAI e Microsoft affrontano una nuova causa da parte del CIR

- Il CIR ha intentato causa contro OpenAI e Microsoft per elusione delle leggi sul copyright.
- OpenAI ha utilizzato 17.849 URL del CIR per addestrare i suoi LLM senza chiedere autorizzazione né fornire alcun compenso.
- Il CIR chiede il risarcimento dei danni per violazione del diritto d'autore e del DMCA, che potrebbero ammontare a milioni di dollari.
OpenAI e Microsoft stanno affrontando una nuova causa da parte del Center for Investigative Reporting (CIR). Il CIR sostiene che OpenAI abbia utilizzato i contenuti pubblicati sui siti web di Mother Jones e Reveal per addestrare versioni precedenti di ChatGPT.
Leggi anche: OpenAI elimina la voce di ChatGPT dopo la controversia su Scarlett Johansson
Il CIR, l'attore, sostiene che OpenAI abbia utilizzato i suoi contenuti senza autorizzazione o promessa di compenso. Il CIR, fondato nel 1977, gestisce la rivista americana no-profit Mother Jones e il podcast Reveal.
CIR fa causa a OpenAI e Microsoft per violazione del copyright
Il Center for Investigative Reporting (CIR) ha depositato giovedì la causa presso il tribunale federale di New York. L'organizzazione no-profit ha accusato OpenAI e Microsoft di aver utilizzato i loro contenuti senza autorizzazione o compenso. Il CIR afferma che OpenAI ha violato le leggi sul copyright utilizzando i suoi contenuti per addestrare ChatGPT.
La CEO del CIR, Monika Bauerlein, ha dichiarato: "Questo comportamento opportunistico non è solo ingiusto, ma costituisce una violazione del diritto d'autore. Il lavoro dei giornalisti, al CIR e ovunque, è prezioso, e OpenAI e Microsoft lo sanno".
🚨[Causa per violazione del copyright sull'IA] Il Center for Investigative Reporting (che gestisce @MotherJones e @reveal) fa causa a OpenAI e Microsoft per violazione del copyright. Citazioni:
"Gli imputati hanno copiato, utilizzato, abbreviato e mostrato i preziosi contenuti di CIR senza il permesso o l'autorizzazione di CIR e... pic.twitter.com/SeZ0VtDOMY
— Luiza Jarovsky, PhD (@LuizaJarovsky) 29 giugno 2024
Nella denuncia ufficiale, il querelante ha incaricato un esperto di analisi dati di esaminare il OpenWebText . OpenWebText è una versione approssimata di WebText, un corpus di pagine web estratte da siti web creato da OpenAI. L'esperto ha rilevato che il dataset contiene 17.434 URL provenienti da Mother Jones e 415 da Reveal. OpenWebText e WebText presentano un numero leggermente diverso di articoli di Mother Jones perché il processo di estrazione dati è avvenuto in giorni diversi.
L'attore ha affermato nella denuncia ufficiale:
“Quando hanno inserito opere giornalistiche nei loro kit di formazione, gli imputati si sono trovati di fronte a una scelta: rispettare le opere giornalistiche oppure no. Gli imputati hanno scelto la seconda opzione.”
Leggi anche: Ilya Sutskever, responsabile scientifico di OpenAI, dà l'addio
OpenAI ha utilizzato due algoritmi, Dragnet e Newspaper, per costruire il database WebText. Dragnet è progettato per separare il contenuto principale dell'articolo da altre parti del sito web, come l'intestazione, il piè di pagina, il titolo, il nome dell'autore e le note sul copyright. Quando OpenAI ha effettuato lo scraping del sito web di Mother Jones, ha rimosso tutto ciò che si trovava nel piè di pagina e nell'intestazione. Inoltre, il creatore di ChatGPT ha rimosso le informazioni sul copyright e sui termini di utilizzo, come riportato nella denuncia.
Inoltre, il querelante sostiene che Microsoft sapeva che gli URL recuperati contenevano contenuti giornalistici privi di nomi degli autori, titoli e note di copyright, facilitando la violazione del copyright da parte di Bing AI e ChatGPT.
Il CIR chiede il risarcimento dei profitti di OpenAI e Microsoft e il risarcimento dei danni effettivi o previsti dalla legge. L'importo indicato è di almeno 750 dollari per opera violata e 2.500 dollari per violazione del DMCA.
OpenAI affronta cause legali da parte di altre pubblicazioni
Questa non è la prima causa intentata contro OpenAI per violazione del copyright. Dal lancio di ChatGPT alla fine del 2022, OpenAI e Microsoft hanno dovuto affrontare numerose cause legali da parte di grandi nomi come il New York Times, The Intercept, il New York Daily News e il Chicago Tribune.
Leggi anche: I dipendenti affermano che OpenAI e Google DeepMind nascondono i rischi dell'intelligenza artificiale
Nel frattempo, alcuni importanti editori e giganti di Internet hanno firmato accordi di licenza con OpenAI, concedendogli l'accesso ai propri archivi. Tra questi, TIME Magazine, News Corp, Financial Times, Vox Media, Associated Press, The Atlantic, Stack Overflow e Reddit.
Reportage di Randa Moses su Cryptopolitan
Se stai leggendo questo, sei già un passo avanti. Rimani al passo con i tempi iscrivendoti alla nostra newsletter.
Disclaimer. Le informazioni fornite non costituiscono consulenza finanziaria. Cryptopolitandi declina ogni responsabilità per gli investimenti effettuati sulla base delle informazioni contenute in questa pagina. Raccomandiamotrondentdentdentdentdentdentdentdent e/o di consultare un professionista qualificato prima di prendere qualsiasi decisione di investimento.
CORSO
- Quali criptovalute possono farti guadagnare
- Come rafforzare la sicurezza del tuo portafoglio digitale (e quali sono quelli davvero validi)
- Strategie di investimento poco conosciute utilizzate dai professionisti
- Come iniziare a investire in criptovalute (quali piattaforme di scambio utilizzare, le migliori criptovalute da acquistare, ecc.)















