ULTIME NOTIZIE
SELEZIONATO PER TE
SETTIMANALE
RIMANI AL TOP

Le migliori analisi sul mondo delle criptovalute, direttamente nella tua casella di posta.

I giganti della tecnologia usano i sottotitoli di YouTube per la formazione sull'intelligenza artificiale senza permesso

DiBrenda KananaBrenda Kanana
Tempo di lettura: 2 minuti.
I giganti della tecnologia usano i sottotitoli di YouTube per la formazione sull'intelligenza artificiale senza permesso
  • Apple e altri sviluppatori di intelligenza artificiale, come Anthropic e Nvidia, sono stati sorpresi a utilizzare sottotitoli di YouTube senza autorizzazione per addestrare i loro sistemi di intelligenza artificiale.
  • Il set di dati "Sottotitoli di YouTube" è stato sviluppato da EleutherAI e pubblicato nel 2020.
  • OpenAI ha utilizzato un milione di ore di video di YouTube per addestrare il suo modello GPT-4. 

Apple, Nvidia e Anthropic sono state scoperte mentre utilizzavano i sottotitoli di YouTube per addestrare modelli di intelligenza artificiale, il che viola le policy di YouTube. Un rapporto di Proof News e Wired ha dimostrato che tali aziende avevano utilizzato un set di dati contenente le trascrizioni di migliaia di video di YouTube senza aver acquisito la licenza necessaria. 

Leggi anche: L'autorità di controllo del Regno Unito avvia un'indagine sull'acquisizione di talenti nel campo dell'IA da parte di Microsoft.

Lo studio ha rivelato che Apple, Nvidia e Anthropic hanno utilizzato il dataset YouTube Subtitles. Questo dataset è composto dalle trascrizioni di 173.536 video di YouTube provenienti da 48.000 canali. I video includono canali educativi come Khan Academy e MIT, canali di notizie come il Wall Street Journal e creatori di contenuti di alto livello come MrBeast e Marques Brownlee. 

Gli YouTuber più popolari reagiscono allo sfruttamento dei dati

Marques Brownlee, un popolare YouTuber, ha commentato la questione su X. Ha affermato: "Apple ha raccolto dati per l'intelligenza artificiale da altre aziende. Una di queste ha raccolto molti dati/trascrizioni dai video di YouTube, compresi i miei". Sebbene Apple potrebbe non aver estratto i dati direttamente, Brownlee ha sottolineato che questo problema persisterà.

Il set di dati "YouTube Subtitles" è stato sviluppato da EleutherAI e pubblicato nel 2020. Contiene 5,7 GB di dati, che includono i sottotitoli dei video di YouTube che sono stati rimossi dalla piattaforma. 

Secondo i termini e le condizioni di YouTube, l'accesso ai video tramite "mezzi automatizzati" è vietato. La presenza di sottotitoli nei video rimossi non fa che aggravare la questione, sollevando interrogativi sulla privacy e sulla violazione del copyright.

Anche Salesforce, un'organizzazione coinvolta nell'indagine, ha ammesso di aver utilizzato tale set di dati. 

"Il dataset Pile a cui si fa riferimento nell'articolo di ricerca è stato addestrato nel 2021 per scopi accademici e di ricerca. Il dataset è stato reso pubblico e rilasciato con una licenza permissiva."

portavoce di Salesforce 

Tuttavia, l'uso di contenuti di YouTube senza autorizzazione è ancora oggi controverso. Ad aprile, il CEO di YouTube, Neal Mohan, ha dichiarato che l'utilizzo di video, trascrizioni o clip di YouTube per l'addestramento dell'IA è una "chiara violazione" delle policy. Tuttavia, secondo il New York Times, OpenAI ha utilizzato un milione di ore di video di YouTube per addestrare il suo modello GPT-4. 

Scoppiano battaglie legali sull'uso dei contenuti Internet da parte delle aziende di intelligenza artificiale

Il problema delle aziende di intelligenza artificiale che utilizzano contenuti da Internet senza autorizzazione è aumentato dopo il lancio di ChatGPT. Inoltre, i creatori di contenuti hanno fatto causa a Stability AI e Midjourney per presunta estrazione di opere protette da copyright senza autorizzazione. Il proprietario di YouTube, Google, ha dovuto affrontare azioni legali collettive per rivendicazioni simili, affermando che azioni legali di questo tipo minacciano le basi dell'intelligenza artificiale generativa. 

In un'intervista al Wall Street Journal, la CTO di OpenAI, Mira Murati, non ha fornito dettagli sull'eventuale utilizzo di video provenienti da piattaforme di social media per addestrare questo nuovo modello. Il CEO di Microsoft AI, Mustafa Suleyman, ha affermato socialetrac". 

Esiste una via di mezzo tra lasciare i soldi in banca e tentare la fortuna con le criptovalute. Inizia con questo video gratuito sulla finanza decentralizzata.

Condividi questo articolo

Disclaimer. Le informazioni fornite non costituiscono consulenza finanziaria. Cryptopolitandi declina ogni responsabilità per gli investimenti effettuati sulla base delle informazioni contenute in questa pagina. Raccomandiamotrondentdentdentdentdentdentdentdent e/o di consultare un professionista qualificato prima di prendere qualsiasi decisione di investimento.

ALTRE NOTIZIE
INTENSIVO CRIPTOVALUTE
CORSO