ULTIME NOTIZIE
SELEZIONATO PER TE
SETTIMANALE
RIMANI AL TOP

Le migliori analisi sul mondo delle criptovalute, direttamente nella tua casella di posta.

Lo staff di Meta ha discusso l'utilizzo di contenuti protetti da copyright per la formazione sull'intelligenza artificiale, come mostrano i documenti del tribunale

DiOwotunse AdebayoOwotunse Adebayo
Tempo di lettura: 3 minuti.
Lo staff di Meta ha discusso l'utilizzo di contenuti protetti da copyright per la formazione sull'intelligenza artificiale, come mostrano i documenti del tribunale
  • Dai documenti del tribunale è emerso che il personale di Meta ha discusso l'utilizzo di contenuti protetti da copyright per addestrare i propri modelli di intelligenza artificiale (IA).
  • Le chat di lavoro interne hanno anche mostrato come l'azienda potrebbe aver utilizzato contenuti giuridicamente rischiosi per addestrare i suoi modelli di intelligenza artificiale.
  • Gli atti del tribunale hanno evidenziato altre violazioni e i querelanti hanno modificato la loro causa.

Documenti giudiziari hanno dimostrato che lo staff di Meta ha discusso dell'utilizzo di contenuti protetti da copyright per addestrare i propri modelli di intelligenza artificiale. Secondo recenti documenti giudiziari, la maggior parte delle discussioni riguardava contenuti ottenuti con mezzi legalmente discutibili.

I documenti sono stati resi disponibili dai ricorrenti nel caso Kadrey contro Meta, uno dei tanti casi di diritto d'autore sull'intelligenza artificiale passati attraverso i tribunali degli Stati Uniti. Secondo le affermazioni di Meta, l'uso di opere protette da copyright, in particolare libri, per addestrare i suoi modelli rientra nella politica del fair used. Tuttavia, i ricorrenti, guidati da Sarah Silverman e Ta–Nehisi Coates, hanno contestato le affermazioni dell'azienda.

Secondo documenti precedentemente presentati, il CEO di Meta, Mark Zuckerberg, ha autorizzato il team di intelligenza artificiale dell'azienda a utilizzare contenuti protetti da copyright per addestrare i propri modelli. I documenti hanno inoltre dimostrato che l'azienda ha anche interrotto i negoziati per la concessione di licenze sui dati con gli editori.

Meta presumibilmente utilizza contenuti protetti da copyright per addestrare i suoi modelli di intelligenza artificiale

Secondo i nuovi documenti depositati presso il tribunale, le chat di lavoro interne condivise tra i dipendenti di Meta hanno mostrato un quadro chiaro di come l'azienda potrebbe aver utilizzato dati protetti da copyright per addestrare i suoi modelli di intelligenza artificiale, tra cui la maggior parte dei modelli della famiglia Llama.

Una delle chat ha coinvolto un dirigente senior di Meta, Melanie Kambadur, Senior Manager del team di ricerca Llama. Nella sua chat, ha parlato dell'addestramento dei modelli di intelligenza artificiale su contenuti non legalmente giustificati.

"La mia opinione sarebbe (del tipo 'chiedere perdono, non il permesso'): cerchiamo di acquisire i libri contabili e di segnalarli ai dirigenti in modo che prendano una decisione", ha dichiarato l'ingegnere di ricerca Meta Xavier Martinet in una chat del febbraio 2023, secondo i documenti. "È per questo che hanno creato questa organizzazione di intelligenza artificiale generale per [sic]: così possiamo essere meno avversi al rischio", ha aggiunto.

Martinet ha affermato che l'azienda avrebbe potuto semplicemente acquistare e-book a prezzi al dettaglio per costruire il set di dati di addestramento, invece di stipulare accordi di licenza con diversi editori. Mentre un altro dipendente ha messo in guardia dall'uso di tali contenuti e dalle implicazioni legali, Martinet ha affermato che probabilmente anche altre aziende stavano utilizzando libri piratati per la formazione.

Nella stessa chat, Kambadur ha affermato che l'azienda era in trattativa con alcune piattaforme per ottenere le licenze, ma ha osservato che, sebbene l'utilizzo di dati disponibili al pubblico richiedesse approvazioni, gli avvocati dell'azienda erano meno prudenti rispetto al passato. "La differenza ora è che abbiamo più soldi, più avvocati, più supporto per lo sviluppo aziendale, la possibilità di trac/escalare le procedure per accelerare, e gli avvocati sono un po' meno prudenti sulle approvazioni", ha affermato Kambadur.

I dipendenti discutono dell'utilizzo di Libgen

Secondo quanto riportato nel documento, un'altra chat di lavoro mostra che Kambadur ha parlato dell'utilizzo di Libgen, un sito web aggregatore che fornisce link a contenuti protetti da copyright degli editori, come fonte di dati che Meta può concedere in licenza. Libgen è stata citata in giudizio in numerose occasioni, con la piattaforma costretta a chiudere i suoi servizi a causa di accuse di violazione del copyright.

Mentre un altro collega nella chat pubblicava una foto e la seguiva con la frase "No, Libgen non è legale", sembrava che alcuni dirigenti al vertice ritenessero che il mancato utilizzo di Libgen avrebbe potuto ostacolare la competitività dell'azienda nella corsa all'intelligenza artificiale. In un'e-mail inviata dal direttore della gestione prodotti di Meta, Sony Theakanath, al vicepresidente di Meta AI, Joelle Pineau, ha sottolineato che Libgen era importante per raggiungere i numeri SOTA (State-of-the-Art) in tutte le categorie.

Theakanath ha anche parlato di diversi modi in cui l'azienda potrebbe ridurre l'esposizione legale, tra cui la rimozione dei dati contrassegnati come rubati/piratati e il non citare pubblicamente altri utilizzi. "Non riveleremo l'uso dei set di dati Libgen utilizzati per l'addestramento", ha affermato. In pratica, questa mossa significa che l'azienda esaminerà prima i file Libgen per verificare la presenza di opere "rubate o piratate".

I documenti del tribunale rivelano altre violazioni

In una delle chat di lavoro, Kambadur ha anche suggerito che il team di Meta AI dovrebbe ottimizzare i modelli per "evitare richieste IP rischiose", il che configurerà i modelli in modo che si rifiutino di fornire risposte agli utenti che cercano di conoscere gli e-book su cui sono stati addestrati i modelli.

I documenti hanno rivelato anche altri dettagli, con una rivelazione che mostra come Meta potrebbe aver utilizzato di Reddit per addestrare il suo modello a imitare il comportamento di un'applicazione di terze parti chiamata Pushshift. Reddit ha affermato in una dichiarazione dell'aprile 2023 che inizierà a far pagare alle aziende di intelligenza artificiale l'accesso ai dati per addestrare i propri modelli.

Gli attori nel caso in esame hanno modificato la loro denuncia più volte dall'inizio della causa nel 2023. Il deposito è stato effettuato presso la Corte Distrettuale degli Stati Uniti per il Distretto Settentrionale della California, a San Francisco. Nell'ultimo emendamento, gli attori hanno sostenuto che Meta ha confrontato i libri piratati con quelli protetti da copyright per determinare se fosse opportuno concludere un di licenza . Meta, da parte sua, considera il caso una questione legale ad alto rischio e si è mossa per aggiungere due avvocati della Corte Suprema al suo team di difesa.

Se stai leggendo questo, sei già un passo avanti. Rimani al passo con i tempi iscrivendoti alla nostra newsletter.

Condividi questo articolo

Disclaimer. Le informazioni fornite non costituiscono consulenza finanziaria. Cryptopolitandi declina ogni responsabilità per gli investimenti effettuati sulla base delle informazioni contenute in questa pagina. Raccomandiamotrondentdentdentdentdentdentdentdent e/o di consultare un professionista qualificato prima di prendere qualsiasi decisione di investimento.

ALTRE NOTIZIE
INTENSIVO CRIPTOVALUTE
CORSO