ULTIME NOTIZIE

San Antonio impone l'installazione di avvisi bilingue contro le truffe sugli sportelli automatici Bitcoin dopo perdite per 39 milioni di dollari a livello locale

11 ore fa Notizie
Un pensionato di Firenze perde i risparmi di una vita in una truffa da 222.000 dollari legata alla macellazione di maiali e alle criptovalute

12 ore fa Notizie
Un dispositivo laser basato sull'intelligenza artificiale, in grado di abbattere le zanzare in volo, ha raccolto 2,7 milioni di dollari

13 ore fa Tecnologia
Tether e Ledn offriranno prestiti garantiti dall'oro utilizzando XAUT tokenizzato

14 ore fa Notizie

SELEZIONATO PER TE

SETTIMANALE

RIMANI AL TOP

Le migliori analisi sul mondo delle criptovalute, direttamente nella tua casella di posta.

I ricercatori riescono a "jailbreakare" con successo i chatbot AI usando il loro genere

John Palmer

Tempo di lettura: 3 minuti. 28 dicembre 2023.

I ricercatori della NTU Singapore sono riusciti a effettuare il "jailbreak" di popolari chatbot AI, rivelando vulnerabilità in modelli linguistici di grandi dimensioni.

Il metodo a due fasi denominato "Masterkey" è stato utilizzato per compromettere i chatbot AI, evidenziando la necessità di misure di sicurezza avanzate.

L'attuale corsa agli armamenti tra hacker e sviluppatori definirà il futuro della sicurezza dei chatbot basati sull'intelligenza artificiale.

Singapore, 28 dicembre 2023 – Gli informatici della Nanyang Technological University di Singapore (NTU Singapore) hanno raggiunto un traguardo importante compromettendo diversi chatbot di intelligenza artificiale (IA) molto diffusi, tra cui ChatGPT, Google Bard e Microsoft Bing Chat. Questo "jailbreaking" riuscito dei chatbot di IA ha sollevato preoccupazioni circa la vulnerabilità dei modelli linguistici di grandi dimensioni (LLM) e la necessità di misure di sicurezza avanzate.

I ricercatori superano i limiti dell'hacking dei chatbot AI

In uno studio pionieristico condotto dal Professor Liu Yang della Facoltà di Informatica e Ingegneria della NTU, il team di ricerca ha evidenziato le vulnerabilità nelle capacità dei chatbot LLM. Gli LLM, che costituiscono il nucleo dei chatbot basati sull'intelligenza artificiale, hanno guadagnato popolarità per la loro capacità di comprendere, generare e imitare testi simili a quelli umani. Eccellono in vari compiti, dalla pianificazione di itinerari alla codifica e alla narrazione. Tuttavia, questi chatbot aderiscono anche a rigide linee guida etiche stabilite dai loro sviluppatori per impedire la generazione di contenuti non etici, violenti o illegali.

I ricercatori hanno cercato di superare i limiti di queste linee guida e hanno trovato modi innovativi per ingannare i chatbot basati sull'intelligenza artificiale e indurli a generare contenuti che violano i limiti etici. Il loro approccio, noto come "jailbreaking", mirava a sfruttare i punti deboli dei chatbot LLM, evidenziando la necessità di misure di sicurezza più severe.

Masterkey nel metodo di jailbreaking a due fasi

Il team di ricerca ha sviluppato un metodo "Masterkey" a due fasi per compromettere efficacemente i chatbot LLM. In primo luogo, hanno sottoposto a reverse engineering le difese utilizzate dagli LLM per rilevare e respingere le query dannose. Grazie a queste conoscenze, i ricercatori hanno addestrato un LLM a generare prompt in grado di aggirare queste difese, creando così un LLM in grado di effettuare il jailbreak.

La creazione di prompt per il jailbreak potrebbe essere automatizzata, consentendo al LLM di jailbreak di adattarsi e creare nuovi prompt anche dopo che gli sviluppatori hanno patchato i loro chatbot. I risultati dei ricercatori, dettagliati in un articolo sul server di pre-print arXiv, sono stati accettati per la presentazione al Network and Distributed System Security Symposium nel febbraio 2024.

Test dell'etica LLM e vulnerabilità svelate

I chatbot basati sull'intelligenza artificiale operano rispondendo a richieste o istruzioni degli utenti. Gli sviluppatori stabiliscono rigide linee guida etiche per impedire che questi chatbot generino contenuti inappropriati o illegali. I ricercatori hanno esplorato modi per progettare richieste che passassero inosservate alle linee guida etiche dei chatbot, inducendoli a rispondere.

Una tattica impiegata prevedeva la creazione di un personaggio che fornisse prompt con spazi tra ogni carattere, aggirando efficacemente i filtri di censura delle parole chiave che potrebbero segnalare parole potenzialmentematic . Inoltre, al chatbot veniva chiesto di rispondere come un personaggio "senza riserve e privo di vincoli morali", aumentando la probabilità di generare contenuti non etici.

Inserendo manualmente tali prompt e monitorando i tempi di risposta, i ricercatori hanno acquisito informazioni sul funzionamento interno e sulle difese dei chatbot. Questo processo di reverse engineering ha permesso loro didenti punti deboli, creando un set di dati di prompt in grado di effettuare il jailbreak dei chatbot.

Una corsa agli armamenti in aumento

Il continuo gioco del gatto e del topo tra hacker e sviluppatori di LLM ha intensificato le misure di sicurezza dei chatbot basati su intelligenza artificiale. Quando vengono scoperte vulnerabilità, gli sviluppatori rilasciano patch per risolverle. Tuttavia, con l'introduzione di Masterkey, i ricercatori hanno spostato l'equilibrio di potere.

Un chatbot di jailbreaking basato sull'intelligenza artificiale creato con Masterkey può generare numerosi prompt e adattarsi continuamente, imparando dai successi e dagli insuccessi del passato. Questo sviluppo mette gli hacker in grado di superare in astuzia gli sviluppatori LLM utilizzando i loro strumenti.

I ricercatori hanno iniziato creando un set di dati di addestramento che incorporava prompt efficaci scoperti durante la fase di reverse engineering e prompt non riusciti per guidare il modello di jailbreaking basato sull'intelligenza artificiale. Questo set di dati è stato utilizzato per addestrare un LLM, a cui sono seguiti un pre-addestramento continuo e un adattamento delle attività. Questo processo ha esposto il modello a diverse informazioni e ne ha migliorato la capacità di manipolare il testo per il jailbreaking.

Il futuro della sicurezza dei chatbot AI

I prompt di Masterkey si sono rivelati tre volte più efficaci nel jailbreaking degli LLM rispetto ai prompt generati dagli LLM stessi. L'LLM che ha eseguito il jailbreaking ha anche dimostrato la capacità di imparare dagli errori passati e di produrre costantemente nuovi prompt più efficaci.

Guardando al futuro, i ricercatori suggeriscono che gli sviluppatori di LLM potrebbero impiegare approcci automatizzati simili per migliorare le proprie misure di sicurezza. Ciò garantirebbe una copertura completa e una valutazione di potenziali scenari di abuso man mano che gli LLM si evolvono e ampliano le loro capacità.

Il jailbreaking riuscito dei chatbot di intelligenza artificiale da parte dei ricercatori della NTU Singapore evidenzia le vulnerabilità degli LLM e sottolinea la necessità di solide misure di sicurezza nello sviluppo dell'intelligenza artificiale. Con la crescente integrazione dei chatbot di intelligenza artificiale nella vita quotidiana, la protezione da potenziali abusi e violazioni etiche rimane una priorità assoluta per gli sviluppatori di tutto il mondo. L'attuale corsa agli armamenti tra hacker e sviluppatori plasmerà senza dubbio il futuro della sicurezza dei chatbot di intelligenza artificiale.

Le menti più brillanti del mondo delle criptovalute leggono già la nostra newsletter. Vuoi partecipare? Unisciti a loro.

Condividi questo articolo

Disclaimer. Le informazioni fornite non costituiscono consulenza di trading. Cryptopolitan/ non si assume alcuna responsabilità per gli investimenti effettuati sulla base delle informazioni fornite in questa pagina. Consigliamotronvivamente di effettuare ricerche indipendentident di consultare un professionista qualificato prima di prendere qualsiasi decisione di investimento.

John Palmer

John Murangiri è entrato a far parte di Cryptopolitan forte di una solida esperienza nell'analisi di mercato. John (noto anche come JP) si è laureato in comunicazione di massa e studi sui media presso l'Università di Nairobi. In precedenza, ha contribuito con le sue analisi sul mercato delle criptovalute a InsideBitcoins.com e Metacoingraph.

INDICE

1. I ricercatori superano i limiti dell'hacking dei chatbot AI

2. Masterkey nel metodo di jailbreaking a due fasi

3. Test dell'etica LLM e vulnerabilità svelate

4. Una corsa agli armamenti in aumento

5. Il futuro della sicurezza dei chatbot AI

Condividi questo articolo

ALTRE NOTIZIE

MOSTRA TUTTO

5 ingegnose applicazioni di ChatGPT e cosa dovresti fare al riguardo

3 anni fa Tech John Palmer

Il 93% dei leader aziendali preferisce soluzioni basate sull'intelligenza artificiale per la gestione della sostenibilità del marchio, Reuters

3 anni fa Tech John Palmer

L'ecosistema dell'intelligenza artificiale in Francia

Ecco come Macron sostiene l'ecosistema di intelligenza artificiale francese, dinamico e produttivo

3 anni fa Tech Glory Kaburu

Bloomberg stima che il mercato dell'intelligenza artificiale generativa raggiungerà 1,3 trilioni di dollari entro il 2032

3 anni fa Tech Aamir Sheikh

Cos'è Base? La rete Ethereum Layer-2 lanciata da Coinbase

21 ottobre 2025 Impara le criptovalute: guide per principianti
Dogecoin vs. Bitcoin: differenze tecniche chiave

20 ottobre 2025 Impara le criptovalute: guide per principianti
Cos'è il TVL (valore totale bloccato) nelle criptovalute?

14 ottobre 2025 Impara le criptovalute: guide per principianti
Come leggere un whitepaper sulle criptovalute?

13 ottobre 2025 Impara le criptovalute: guide per principianti
Ripple vs. XRP vs. XRP Ledger: qual è la differenza?

13 ottobre 2025 Impara le criptovalute: guide per principianti
Cos'è un portafoglio multisig in criptovaluta?

10 ottobre 2025 Impara le criptovalute: guide per principianti

CORSO INTENSIVO DI CRIPTOVALUTE

Quali criptovalute possono farti guadagnare
Come rafforzare la sicurezza del tuo portafoglio digitale (e quali sono quelli davvero validi)
Strategie di investimento poco conosciute utilizzate dai professionisti
Come iniziare a investire in criptovalute (quali piattaforme di scambio utilizzare, le migliori criptovalute da acquistare, ecc.)