I set di dati di addestramento dell'intelligenza artificiale contengono livelli inquietanti di materiale di abusi sessuali su minori

By Derrick Clinton
Aggiornato: 20 dicembre 2023 13:34 UTC

2 minuti di lettura

Aggiungici come fonte preferita su Google

426964

Abuso sessuale sui minori

Contenuto

1. Scoprire fonti di dati di formazione inquietanti

2. Azioni rapide per affrontare il problema

3. Sfide nella pulizia dei set di dati aperti

4. Raccomandazioni di sicurezza per la futura gestione dei set di dati

Condividi link:

In questo post:

Uno studio di Stanford ha scoperto che i modelli di intelligenza artificiale, come Stable Diffusion, sono stati addestrati su set di dati contenenti materiale pedopornografico, sollevando preoccupazioni di carattere etico.
I ricercatori agiscono rapidamente, segnalando gli URL delle immagini abusive al NCMEC e al C3P, sottolineando la necessità di una gestione responsabile dei dati dell'IA.
L'indagine del SIO evidenzia le sfide nella pulizia dei set di dati aperti, sollecitando future precauzioni e la collaborazione con le organizzazioni per la sicurezza dei minori.

In una recente indagine condotta dallo Stanford Internet Observatory (SIO), centinaia di immagini note di materiale pedopornografico (CSAM) sono statedentin un dataset aperto utilizzato per l'addestramento di modelli di intelligenza artificiale (IA) popolari per la generazione di testo in immagini, tra cui Stable Diffusion. I risultati hanno fatto luce sull'inquietante utilizzo di dataset accessibili al pubblico nello sviluppo di modelli avanzati di intelligenza artificiale (IA).

Scoprire fonti di dati di formazione inquietanti

L'indagine del SIO ha rivelato che questi modelli di intelligenza artificiale sono stati addestrati direttamente sui contenuti pedopornografici presenti nel dataset LAION-5B, che comprende miliardi di immagini provenienti da diverse piattaforme, tra cui i principali social media e i popolari siti di video per adulti. La rivelazione solleva preoccupazioni circa la perpetuazione involontaria dello sfruttamento minorile attraverso l'uso di dataset contaminati da contenuti illegali e dannosi.

Azioni rapide per affrontare il problema

Dopo averdentil materiale sorgente, i ricercatori hanno avviato il processo di rimozione segnalando gli URL delle immagini al National Center for Missing and Exploited Children (NCMEC) negli Stati Uniti e al Canadian Centre for Child Protection (C3P). L'uso di strumenti di hashing, come PhotoDNA, ha svolto un ruolo cruciale nell'abbinamento delle impronte digitali delle immagini con i database gestiti da organizzazioni non profit dedicate alla lotta allo sfruttamento e all'abuso sessuale dei minori online.

Sfide nella pulizia dei set di dati aperti

Sebbene esistano metodi per ridurre al minimo la presenza di materiale pedopornografico (CSAM) nei set di dati di addestramento, il rapporto sottolinea le sfide legate alla pulizia o all'interruzione della distribuzione di set di dati aperti privi di un'autorità centrale. L'assenza di un'entità di hosting per questi set di dati complica gli sforzi per garantirne l'integrità e la sicurezza. Lo studio sottolinea la necessità di misure proattive per prevenire l'inclusione involontaria di contenuti illegali nei dati di addestramento dell'IA.

Vedi anche Battlefield 6 lancia finalmente la Stagione 1 con nuove mappe, modalità e armi

Raccomandazioni di sicurezza per la futura gestione dei set di dati

Alla luce di questi risultati, il rapporto delinea raccomandazioni di sicurezza per la raccolta di set di dati, l'addestramento di modelli e l'hosting di modelli addestrati su set di dati estratti. Si raccomanda di effettuare controlli approfonditi delle immagini rispetto agli elenchi noti di materiale pedopornografico (CSAM) utilizzando strumenti di rilevamento come PhotoDNA di Microsoft. Si raccomanda inoltre la collaborazione con organizzazioni per la sicurezza dei minori, come NCMEC e C3P, per garantire l'uso etico e legale della tecnologia di intelligenza artificiale.

Con il continuo progresso dell'intelligenza artificiale, la gestione responsabile dei set di dati di addestramento diventa fondamentale per prevenire contributi involontari ad attività illecite. L'indagine del SIO funge da campanello d'allarme per la comunità dell'intelligenza artificiale, esortando le parti interessate ad adottare misure rigorose nella cura dei set di dati, nell'addestramento dei modelli e nella collaborazione con le agenzie competenti per la protezione dei minori.

In risposta a queste rivelazioni, la comunità dell'IA è spinta a rivalutare i propri standard etici e ad adottare misure decisive per contrastare l'uso involontario di dati CSAM nei set di dati di addestramento. Implementando le misure di sicurezza raccomandate, il settore può contribuire allo sviluppo della tecnologia dell'IA in modo responsabile ed etico, tutelandosi dalle conseguenze indesiderate derivanti da fonti di dati non controllate.

I risultati dell'indagine SIO sottolineano l'importanza della vigilanza in un'epoca in cui i progressi tecnologici devono essere accompagnati da un impegno altrettantotronper lo sviluppo etico dell'IA. La collaborazione tra ricercatori, leader del settore e organizzazioni per la protezione dei minori è essenziale per garantire che la tecnologia dell'IA progredisca in modo allineato ai valori sociali e dia priorità al benessere degli individui vulnerabili.

Vedi anche: I democratici spingono per una tassa sui robot mentre l'intelligenza artificiale minaccia i posti di lavoro

Le menti più brillanti del mondo delle criptovalute leggono già la nostra newsletter. Vuoi partecipare? Unisciti a loro .

Condividi link:

Leggi l'informativa sulla privacy

Disclaimer. Le informazioni fornite non costituiscono consulenza di trading. Cryptopolitan non si assume alcuna responsabilità per gli investimenti effettuati sulla base delle informazioni fornite in questa pagina. Consigliamo vivamente di effettuare ricerche indipendenti tron / dent di consultare un professionista qualificato prima di prendere qualsiasi decisione di investimento.

I più letti

Rimani aggiornato sulle novità in ambito criptovalute, ricevi aggiornamenti giornalieri nella tua casella di posta

Scelta dell'editore

Caricamento degli articoli scelti dall'editore...

I set di dati di addestramento dell'intelligenza artificiale contengono livelli inquietanti di materiale di abusi sessuali su minori

Contenuto

In questo post:

Scoprire fonti di dati di formazione inquietanti

Azioni rapide per affrontare il problema

Sfide nella pulizia dei set di dati aperti

Raccomandazioni di sicurezza per la futura gestione dei set di dati

Condividi link:

I più letti

Rimani aggiornato sulle novità in ambito criptovalute, ricevi aggiornamenti giornalieri nella tua casella di posta

Scelta dell'editore

Iscriviti e rimani in cima

I mercati si muovono velocemente.

Ci muoviamo più velocemente.

Entra. Scopri i fatti.
Vai avanti.

I set di dati di addestramento dell'intelligenza artificiale contengono livelli inquietanti di materiale di abusi sessuali su minori

Contenuto

In questo post:

Scoprire fonti di dati di formazione inquietanti

Azioni rapide per affrontare il problema

Sfide nella pulizia dei set di dati aperti

Raccomandazioni di sicurezza per la futura gestione dei set di dati

Condividi link:

I più letti

Rimani aggiornato sulle novità in ambito criptovalute, ricevi aggiornamenti giornalieri nella tua casella di posta

Scelta dell'editore

Iscriviti e rimani in cima

Seguici

- La newsletter Crypto che ti tiene al passo -

I mercati si muovono velocemente.

Ci muoviamo più velocemente.

Entra. Scopri i fatti. Vai avanti.

Entra. Scopri i fatti.
Vai avanti.