Le aziende di intelligenza artificiale affrontano le aree grigie legali per i dati di addestramento

Brian Koome

Tempo di lettura: 4 minuti. 6 aprile 2024.

OpenAI e Google sono sotto accusa per aver raccolto dati di addestramento. OpenAI trascrive i video di YouTube e Google utilizza i contenuti con autorizzazione.
Meta sta valutando l'acquisto di un importante editore per raccogliere dati per l'intelligenza artificiale, nel contesto di preoccupazioni sulla privacy.
Il settore dell'intelligenza artificiale si trova ad affrontare la scarsità di dati e sta valutando soluzioni come i dati sintetici, ma permangono preoccupazioni di carattere legale ed etico.

Analizzando il recente dibattito su come Open e Google adattino i loro dati al modello, si noterà che due termini dominano maggiormente il dibattito: Open e Google. Gli articoli pubblicati di recente sul Wall Street Journal e sul New York Times dimostrano che il modo in cui le aziende legate all'intelligenza artificiale raccolgono i dati non è stato all'altezza, creando un problema su quali dati siano veritieri e quale prospettiva etica sia stata utilizzata nella creazione del sistema correlato all'intelligenza artificiale.

Le tattiche discutibili di OpenAI

Tuttavia, al suo apice, il New York Times ha sottolineato i risultati più significativi di Open AI, come dimostrato da Whisper. Questo modello di trascrizione audio-testo è stato sviluppato come complemento alla tecnologia LP-4 del Language Processor di Open AI. In effetti, l'auto a guida autonoma di OpenAI non si basa sulla raccolta di informazioni, che è una questione complessa con cui l'azienda si confronta; piuttosto, è quest'ultima a entrare in gioco in tali condizioni.

Sebbene la popolarità iniziale dei Data Collection Act fosse legata a considerazioni sul fair use, quest'ultimo divenne anche la base giuridica per questi atti. Come ha affermato Brockman, uno dei membri fondatori e CEO di OpenAI ha fornito alcune informazioni necessarie per la trascrizione. Tuttavia, prosegue affermando che anche lo storico ha contribuito alla trascrizione.

Tuttavia, Google Corporation sta assumendo un ruolo centrale anche per questi piccoli problemi rispetto a iniziative più grandi come questa, ovvero una funzione di raccolta dati come OpenAI è un'organizzazione più piccola e impegnata in progetti orientati al gigante del settore, e l'utente è stato solo avvisato e non gli è stato detto chi doveva essere incolpato da YouTube.

Oltre a questo approccio, Facebook ha anche garantito la conformità ai Termini di Servizio e ha vietato azioni non autorizzate, in particolare il cosiddetto data scraping. Nel caso di John Conly (portavoce di YouTube), ha risposto alla domanda se i modelli fossero utilizzati per l'addestramento dell'intelligenza artificiale basato sui contenuti dopo aver raccolto dati dai creatori di contenuti.

Al contrario. Oltre a dover addestrare le macchine, da che parte stare Meta è un problema attuale che ne rende impossibile l'implementazione. Il di intelligenza artificiale dell'azienda, che ha avuto successo nella rivalità con OpenAI, ha ritenuto che entrambi i team abbiano utilizzato tutti i mezzi disponibili per lavorare a un risultato migliore per le rispettive aziende, incluso il pensiero originale, senza prestare attenzione a questioni a favore della parte respinta.

Meta sembra aver preparato una serie di domande a cui mirava a rispondere su quale lavoro delegato sarebbe stato svolto, chi sarebbe stato responsabile dell'acquisto di libri e da quali editori specializzati in specifici settori. Sebbene l'esperienza utente della rete sia estremamente sorprendente, le politiche governative consolidate hanno acquisito l'iniziativa di interferire con la privacy individuale, come evidenziato nel 2018 dal caso Cambridge Analytica.

Il più ampio panorama dell'addestramento dell'IA si trova ad affrontare un dilemma urgente: da un lato, la questione della carenza di dati si è fatta più acuta negli ultimi due anni, dall'altro. Sebbene il collegamento tra i due aspetti permanga, i ricercatori insistono sempre sulla necessità di disporre di dati adeguati per una maggiore accuratezza e un aumento delle prestazioni.

Anche la previsione del Wall Street Journal suscita entusiasmo, proiettando rialzi superiori a tutti gli obiettivi per l'anno 2020 e tagliando la fine dell'anno con il punto più alto del mercato. Questo metodo si basa su due fattori: l'affidamento ai modelli, che possono essere sintetici per indicare una matrice esterna, e un curriculum di processo decisionale, in cui i modelli apprendono dalle proprie decisioni. Non aspettatevi che producano risultati, ma rendeteli osservabili.

Implicazioni legali ed etiche

L'assenza di una norma sulla pirateria potrebbe causare problemi, poiché nulla può consentire agli utenti di accedere a contenuti protetti da copyright, e potrebbero sorgere dubbi sulla comprensione della missione aziendale in materia di legge, etica, ecc. I dati diventano una proprietà immateriale e la base per sapere e dichiarare cosa è tuo e cosa non lo è, in cui i dati e l'utente sono notoriamente la fonte dell'attività quando l'uso di tali dati è ingiustificato? Questo rischio comporterebbe che i responsabili del programma del team di ricerca e sviluppo si concentrino sulla loro revisione e sull'elaborazione di soluzioni.

La relazione tra le finalità delle campagne di class action implicherebbe che la privacy e l'utilizzo dei dati siano risposte che l'organizzazione non conosce a sufficienza per legittimare le proprie operazioni. In effetti, le sfide (come le questioni etiche relative al processo di data mining utilizzato per la ricerca e lo sviluppo dell'intelligenza artificiale) diventano complesse perché dobbiamo considerare le restrizioni normative e la riservatezza dei dati (poiché la natura dei dati è legata al contesto in cui vengono elaborati e utilizzati).

La sfida più dura per l'IA del futuro consistedenti dati migliori per l'addestramento dei sistemi di IA e, ancora di più, nel valutare se tali dati saranno sottoposti a quadri normativi etici o legali comuni. Tutto ciò che ruota attorno all'IA, per sua stessa natura, enfatizza e amplia concetti come l'innovazione e l'implementazione attraverso filtri di set di dati per le aziende.

Essendo un'intelligenza artificiale tecnologica non è mai statica, quindi il problema principale sarà sempre l'utilizzo dei dati e continuerà a essere una delle priorità dei membri della comunità che prendono forma attraverso l'utilizzo dell'intelligenza artificiale, i migliori.

Articolo originale tratto da: https://www.nytimes.com/2024/04/06/technology/tech-giants-harvest-data-artificial-intelligence.html?smid=nytcore-ios-share&sgrp=c-cb

Se stai leggendo questo, sei già un passo avanti. Rimani al passo con i tempi iscrivendoti alla nostra newsletter.

Condividi questo articolo

Disclaimer. Le informazioni fornite non costituiscono consulenza di trading. Cryptopolitan/ non si assume alcuna responsabilità per gli investimenti effettuati sulla base delle informazioni fornite in questa pagina. Consigliamotronvivamente di effettuare ricerche indipendentident di consultare un professionista qualificato prima di prendere qualsiasi decisione di investimento.

Brian Koome

Brian Koome vanta oltre sette anni di esperienza nel giornalismo blockchain e sulle criptovalute, essendo attivo nel settore dal 2017. Ha collaborato con importanti pubblicazioni, tra cui BlockToday.com. Inoltre, ha sviluppato il corso Ethereum 101 per BitDegree.org prima di entrare a far parte Cryptopolitan come redattore a tempo pieno. Brian si occupa di guide sempre aggiornate (Evergreen Guides - EG), approfondimenti, interviste e analisi dei prezzi. La sua attenzione alla DeFi, all'innovazione blockchain e ai progetti crypto emergenti è molto apprezzata dai lettori.

INDICE

1. Le tattiche discutibili di OpenAI

2. Implicazioni legali ed etiche

Condividi questo articolo