ULTIME NOTIZIE

vivere IN DIRETTA: Trump sigla un accordo con Apple per la produzione di chip per Intel, le azioni salgono insieme alla partecipazione governativa

dell'8 maggio 2026 Aggiornamenti in diretta
La Corea del Sud sviluppa un sistema tracbasato sull'intelligenza artificiale a fronte della stagnazione della crescita degli investitori in criptovalute

52 minuti fa Notizie
STRC risale a 100 dollari al valore nominale mentre il panico quantistico divide i giganti delle criptovalute

4 ore fa Notizie
La svolta di Coinbase verso operazioni guidate dall'intelligenza artificiale non sta andando molto bene

8 ore fa Attività commerciale

SELEZIONATO PER TE

SETTIMANALE

RIMANI AL TOP

Le migliori analisi sul mondo delle criptovalute, direttamente nella tua casella di posta.

I ricercatori rivelano vulnerabilità nei modelli di intelligenza artificiale, sollevando preoccupazioni

Derrick Clinton

Tempo di lettura: 3 minuti. 17 novembre 2023.

Modelli di intelligenza artificiale che creano immagini esplicite, rivelando difetti in sistemi come Stable Diffusion di Stability AI e filtri di sicurezza DALL-E 2 di OpenAI.
SneakyPrompt, utilizzando l'apprendimento per rinforzo, mette in luce le debolezze delle policy degli sviluppatori, consentendo la generazione di contenuti proibiti tramite la manipolazione dei modelli di intelligenza artificiale.
Il successo di SneakyPrompt solleva preoccupazioni circa l'efficacia delle misure di sicurezza, spingendo la comunità dell'intelligenza artificiale a migliorare la sicurezza per prevenirne l'uso improprio.

I ricercatori della Johns Hopkins e della Duke University hanno scoperto una preoccupante falla nei principali modelli di intelligenza artificiale, tra cui Stable Diffusion di Stability AI e DALL-E 2 di OpenAI. La falla, denominata "SneakyPrompt", consente la manipolazione di questi modelli per generare contenuti espliciti e violenti, aggirando i filtri di sicurezza e le policy impostate dagli sviluppatori.

La ricerca, che sarà presentata al Simposio IEEE su Sicurezza e Privacy, evidenzia la facilità con cui i modelli di intelligenza artificiale generativa possono essere forzati a creare immagini esplicite e dannose. SneakyPrompt sfrutta l'apprendimento per rinforzo per creare prompt apparentemente insensati che, una volta inseriti nei modelli, portano alla generazione di contenuti proibiti. Questo metodo sostanzialmente "elude" l'intelligenza artificiale, aggirando le misure di sicurezza stabilite.

Smascherare le vulnerabilità

Stability AI e OpenAI, entrambi attori chiave nel panorama dell'intelligenza artificiale, dispongono di solidi filtri di sicurezza per impedire la creazione di contenuti inappropriati. Tuttavia, SneakyPrompt ha dimostrato che queste misure di sicurezza non sono infallibili. Modificando in modo sottile i prompt, i ricercatori sono riusciti a eludere con successo le reti di sicurezza, costringendo i modelli a produrre immagini esplicite.

La tecnica di SneakyPrompt prevede la sostituzione di parole bloccate con termini apparentemente non correlati e privi di senso, che i modelli di intelligenza artificiale interpretano in modo coerente con il contenuto proibito. Ad esempio, la sostituzione di "nudo" con un termine come "grponypui" ha generato immagini esplicite. Questa sovversione semantica evidenzia una significativa debolezza nella capacità dei modelli di intelligenza artificiale di individuare contenuti dannosi.

Sfida alle politiche degli sviluppatori

Il lavoro di questi ricercatori sottolinea i potenziali rischi associati alla diffusione di modelli di intelligenza artificiale nel pubblico dominio. Mentre Stability AI e OpenAI vietano esplicitamente l'uso della loro tecnologia per contenuti espliciti o violenti, SneakyPrompt mette in luce l'insufficienza delle misure di sicurezza esistenti. Ciò solleva preoccupazioni circa l'adeguatezza delle misure di sicurezza e il potenziale uso improprio della tecnologia di intelligenza artificiale.

Risposta degli sviluppatori

Stability AI e OpenAI sono state tempestivamente informate dei risultati dei ricercatori. Al momento della stesura di questo articolo, DALL-E 2 di OpenAI non generava più immagini NSFW in risposta ai promptdent. Tuttavia, Stable Diffusion 1.4 di Stability AI, la versione testata, rimane vulnerabile agli attacchi SneakyPrompt.

OpenAI si è astenuta dal commentare i risultati specifici, ma ha richiamato l'attenzione sulle risorse presenti sul suo sito web per migliorare la sicurezza. Stability AI, d'altra parte, si è impegnata a collaborare con i ricercatori per migliorare i meccanismi di difesa dei modelli futuri e prevenirne l'uso improprio.

Affrontare le minacce future

I ricercatori riconoscono la natura in continua evoluzione delle minacce alla sicurezza dei modelli di intelligenza artificiale. Propongono potenziali soluzioni, come l'implementazione di nuovi filtri che valutano singoli token anziché intere frasi. Un'altra strategia di difesa prevede il blocco dei prompt contenenti parole non presenti nei dizionari, sebbene lo studio riveli i limiti di questo approccio.

La capacità dei modelli di intelligenza artificiale di aggirare le misure di sicurezza ha implicazioni più ampie, in particolare nel contesto della guerra dell'informazione. Il potenziale di generare contenuti falsi relativi a eventi sensibili, come dimostrato nel recente conflitto tra Israele e Hamas, solleva preoccupazioni circa le conseguenze catastrofiche della disinformazione generata dall'intelligenza artificiale.

Un campanello d'allarme per la comunità dell'intelligenza artificiale

I risultati della ricerca rappresentano un campanello d'allarme per la comunità dell'IA, che deve rivalutare e rafforzare le misure di sicurezza. Le vulnerabilità esposte da SneakyPrompt sottolineano la necessità di un miglioramento continuo dei filtri di sicurezza per mitigare i rischi associati all'uso improprio della tecnologia di IA generativa.

In un settore in rapida evoluzione, la ricerca di solide misure di sicurezza diventa fondamentale per impedire che i modelli di intelligenza artificiale vengano manipolati per scopi dannosi. Poiché l'intelligenza artificiale continua a svolgere un ruolo sempre più importante in diversi ambiti, spetta agli sviluppatori la responsabilità di anticipare le potenziali minacce e garantire l'implementazione etica e sicura delle loro tecnologie.

Non limitarti a leggere le notizie sulle criptovalute. Cerca di capirle. Iscriviti alla nostra newsletter. È gratis.

Condividi questo articolo

Disclaimer. Le informazioni fornite non costituiscono consulenza finanziaria. Cryptopolitandi declina ogni responsabilità per gli investimenti effettuati sulla base delle informazioni contenute in questa pagina. Raccomandiamotrondentdentdentdentdentdentdentdent e/o di consultare un professionista qualificato prima di prendere qualsiasi decisione di investimento.

Derrick Clinton

Derrick è uno scrittore freelance con un interesse per la blockchain e le criptovalute. Si occupa principalmente di problematiche e soluzioni relative ai progetti crypto, offrendo una prospettiva di mercato per gli investimenti. Applica le sue capacità analitiche alle sue tesi.

INDICE

1. Smascherare le vulnerabilità

2. Sfida alle politiche degli sviluppatori

3. Risposta degli sviluppatori

4. Affrontare le minacce future

5. Un campanello d'allarme per la comunità dell'intelligenza artificiale

Condividi questo articolo

ALTRE NOTIZIE

MOSTRA TUTTO

5 ingegnose applicazioni di ChatGPT e cosa dovresti fare al riguardo

3 anni fa Tech John Palmer

Il 93% dei leader aziendali preferisce soluzioni basate sull'intelligenza artificiale per la gestione della sostenibilità del marchio, Reuters

3 anni fa Tech John Palmer

L'ecosistema dell'intelligenza artificiale in Francia

Ecco come Macron sostiene l'ecosistema di intelligenza artificiale francese, dinamico e produttivo

3 anni fa Tech Glory Kaburu

Bloomberg stima che il mercato dell'intelligenza artificiale generativa raggiungerà 1,3 trilioni di dollari entro il 2032

3 anni fa Tech Aamir Sheikh

Cos'è Base? La rete Ethereum Layer-2 lanciata da Coinbase

21 ottobre 2025 Impara le criptovalute: guide per principianti
Dogecoin vs. Bitcoin: differenze tecniche chiave

20 ottobre 2025 Impara le criptovalute: guide per principianti
Cos'è il TVL (valore totale bloccato) nelle criptovalute?

14 ottobre 2025 Impara le criptovalute: guide per principianti
Come leggere un whitepaper sulle criptovalute?

13 ottobre 2025 Impara le criptovalute: guide per principianti
Ripple vs. XRP vs. XRP Ledger: qual è la differenza?

13 ottobre 2025 Impara le criptovalute: guide per principianti
Cos'è un portafoglio multisig in criptovaluta?

10 ottobre 2025 Impara le criptovalute: guide per principianti

INTENSIVO CRIPTOVALUTE
CORSO

Quali criptovalute possono farti guadagnare
Come rafforzare la sicurezza del tuo portafoglio digitale (e quali sono quelli davvero validi)
Strategie di investimento poco conosciute utilizzate dai professionisti
Come iniziare a investire in criptovalute (quali piattaforme di scambio utilizzare, le migliori criptovalute da acquistare, ecc.)