ULTIME NOTIZIE
SELEZIONATO PER TE
SETTIMANALE
RIMANI AL TOP

Le migliori analisi sul mondo delle criptovalute, direttamente nella tua casella di posta.

L’intelligenza artificiale non può prosperare senza la conoscenza umana: il risarcimento per i creatori originali è un must

DiAamir SheikhAamir Sheikh
Tempo di lettura: 3 minuti. Data di pubblicazione
Conoscenza umana
  • L'addestramento dei modelli di intelligenza artificiale richiede grandi set di dati ed è meglio se si basano sulla conoscenza umana.
  • Giornali e organizzazioni di ricerca, insieme ai portali web, impiegano le loro risorse per raccogliere e pubblicare informazioni.
  • Il compenso per i creatori originali dei contenuti è un requisito imprescindibile, poiché ora le aziende di intelligenza artificiale stanno concedendo in licenza i contenuti alle aziende.

L'addestramento dei modelli di intelligenza artificiale richiede enormi quantità di dati e la loro capacità di produrre buoni risultati dipende direttamente dai dati forniti al sistema. Le informazioni non sono gratuite e stiamo parlando di molti diritti di proprietà intellettuale. 

Ma le aziende di intelligenza artificiale non la pensano in questo modo; danno per scontata tutta la conoscenza prodotta da generazioni di scrittori; anche il loro concetto di uso corretto è diverso da come veniva percepito in origine; e non amano pagare i creatori di contenuti che hanno reso i loro modelli ciò di cui sono capaci oggi.

Furto della conoscenza umana

Ci vogliono molto duro lavoro e sudore per produrre i contenuti che vediamo su giornali, riviste, libri, archivi online e articoli di ricerca, ma ciò non sarebbe possibile senza scrittori, redattori, ricercatori ed editori che li rendano pubblici in diverse forme.

Un riconoscimento e una conoscenza così duramente guadagnati non dovrebbero essere sfruttati liberamente da un'azienda, come è successo in questo caso.

“Informazioni pubblicamente disponibili su Internet.”

Fonte: OpenAI.

Sì, questo è ciò che OpenAI ha da dire se le viene chiesto dei contenuti utilizzati per addestrare i suoi sistemi di intelligenza artificiale, insieme alle informazioni ottenute in licenza da terze parti e alle informazioni fornite dai suoi utenti e formatori umani. 

A proposito di contenuti concessi in licenza, le aziende li stanno cercando ora, ma non abbiamo informazioni sul fatto che OpenAI abbia concesso in licenza informazioni da un fornitore prima di lanciare il suo modello GPT iniziale. Il modello deve essere stato addestrato su materiali protetti da copyright che non erano liberamente utilizzabili per scopi commerciali.

Fonte: Statista.

Compensazione per i creatori originali

Fino a un anno fa, la maggior parte dei testi scritti online o offline era frutto del lavoro umano. Nonostante il clickbait, venivano mescolati anche contenuti di bassa qualità, ma almeno erano creati da esseri umani che comprendevano la psiche e il processo di pensiero umano, e le applicazioni di intelligenza artificiale generativa venivano sviluppate sulla base di tali informazioni. 

Ma oggi le aziende si trovano ad affrontare un nuovo problema nell'addestramento dei loro modelli di intelligenza artificiale: i contenuti generati dalle macchine, che prevalgono su Internet e non sono considerati di qualità. Tali contenuti stanno intaccando le risorse disponibili per l'addestramento dei modelli di intelligenza artificiale, poiché non riescono a produrre output di qualità se addestrati su contenuti inutili e prolissi, che è il modo in cui questi modelli solitamente producono contenuti. Il processo di estrazione di intelligenza artificiale da parte dell'intelligenza artificiale è spesso chiamato cannibalismo o clonazione dell'intelligenza artificiale.

Per evitare che ciò accada, le aziende di intelligenza artificiale devono limitare il materiale di partenza a fonti attendibili, che non sono altro che giornali, riviste e forum pubblici che ospitano una vasta gamma di conoscenze prodotte dall'uomo. Se ne possono contare anche altre, come accennato in precedenza, ma questa necessità e le cause legali dei giornali le hanno costrette a concedere in licenza i contenuti e a pagare per lo sfruttamento che ne facevano.

aziende come Reddit, un grande forum pubblico ospitato sul web, stanno valutando la possibilità di concedere in licenza i propri contenuti ad aziende di intelligenza artificiale. In una dichiarazione, hanno affermato di preferire il business alle cause legali, ma non hanno escluso azioni legali in caso di fallimento delle trattative commerciali. Se non è consentito inserire unatracin un video di YouTube, perché un'azienda di intelligenza artificiale dovrebbe essere autorizzata a utilizzarla per addestrare i propri modelli destinati a uso commerciale?

In questo caso, la titolarità del copyright rappresenta un problema, poiché le aziende di intelligenza artificiale continuano a violarlo. D'altro canto, l'intelligenza artificiale non è in grado di raccogliere autonomamente nuove notizie: è necessario l'impegno umano per raccogliere notizie e confermarle da diverse fonti prima di pubblicarle; solo allora un modello di intelligenza artificiale può utilizzare tali informazioni, e non compensare le risorse umane in questo caso è uno sfruttamento. 

Le menti più brillanti del mondo delle criptovalute leggono già la nostra newsletter. Vuoi partecipare? Unisciti a loro.

Condividi questo articolo

Disclaimer: Le informazioni fornite non costituiscono consulenza finanziaria. Cryptopolitandeclina ogni responsabilità per gli investimenti effettuati sulla base delle informazioni contenute in questa pagina. Raccomandiamotronindipendentident e/o di consultare un professionista qualificato prima di prendere qualsiasi decisione di investimento.

Aamir Sheikh

Aamir Sheikh

Aamir è un giornalista tecnologico con quasi sei anni di esperienza nel settore delle criptovalute e della tecnologia. Si è laureato alla MAJ University con un MBA in Finanza e Marketing. Attualmente lavora per Cryptopolitan, dove si occupa di reportage sugli ultimi sviluppi dei mercati delle criptovalute e di previsioni sui prezzi.

ALTRE NOTIZIE
CORSO INTENSIVO DI CRIPTOVALUTE