ULTIME NOTIZIE
SELEZIONATO PER TE
SETTIMANALE
RIMANI AL TOP

Le migliori analisi sul mondo delle criptovalute, direttamente nella tua casella di posta.

I ricercatori riescono a "jailbreakare" con successo i chatbot AI usando il loro genere

DiJohn PalmerJohn Palmer
Tempo di lettura: 3 minuti.

  • I ricercatori della NTU Singapore sono riusciti a effettuare il "jailbreak" di popolari chatbot AI, rivelando vulnerabilità in modelli linguistici di grandi dimensioni.
  • Il metodo a due fasi denominato "Masterkey" è stato utilizzato per compromettere i chatbot AI, evidenziando la necessità di misure di sicurezza avanzate.
  • L'attuale corsa agli armamenti tra hacker e sviluppatori definirà il futuro della sicurezza dei chatbot basati sull'intelligenza artificiale.

Singapore, 28 dicembre 2023 – Gli informatici della Nanyang Technological University di Singapore (NTU Singapore) hanno raggiunto un traguardo importante compromettendo diversi chatbot di intelligenza artificiale (IA) molto diffusi, tra cui ChatGPT, Google Bard e Microsoft Bing Chat. Questo "jailbreaking" riuscito dei chatbot di IA ha sollevato preoccupazioni circa la vulnerabilità dei modelli linguistici di grandi dimensioni (LLM) e la necessità di misure di sicurezza avanzate.

I ricercatori superano i limiti dell'hacking dei chatbot AI

In uno studio pionieristico condotto dal Professor Liu Yang della Facoltà di Informatica e Ingegneria della NTU, il team di ricerca ha evidenziato le vulnerabilità nelle capacità dei chatbot LLM. Gli LLM, che costituiscono il nucleo dei chatbot basati sull'intelligenza artificiale, hanno guadagnato popolarità per la loro capacità di comprendere, generare e imitare testi simili a quelli umani. Eccellono in vari compiti, dalla pianificazione di itinerari alla codifica e alla narrazione. Tuttavia, questi chatbot aderiscono anche a rigide linee guida etiche stabilite dai loro sviluppatori per impedire la generazione di contenuti non etici, violenti o illegali.

I ricercatori hanno cercato di superare i limiti di queste linee guida e hanno trovato modi innovativi per ingannare i chatbot basati sull'intelligenza artificiale e indurli a generare contenuti che violano i limiti etici. Il loro approccio, noto come "jailbreaking", mirava a sfruttare i punti deboli dei chatbot LLM, evidenziando la necessità di misure di sicurezza più severe.

Masterkey nel metodo di jailbreaking a due fasi

Il team di ricerca ha sviluppato un metodo "Masterkey" a due fasi per compromettere efficacemente i chatbot LLM. In primo luogo, hanno sottoposto a reverse engineering le difese utilizzate dagli LLM per rilevare e respingere le query dannose. Grazie a queste conoscenze, i ricercatori hanno addestrato un LLM a generare prompt in grado di aggirare queste difese, creando così un LLM in grado di effettuare il jailbreak.

La creazione di prompt per il jailbreak potrebbe essere automatizzata, consentendo al LLM di jailbreak di adattarsi e creare nuovi prompt anche dopo che gli sviluppatori hanno patchato i loro chatbot. I risultati dei ricercatori, dettagliati in un articolo sul server di pre-print arXiv, sono stati accettati per la presentazione al Network and Distributed System Security Symposium nel febbraio 2024.

Test dell'etica LLM e vulnerabilità svelate

I chatbot basati sull'intelligenza artificiale operano rispondendo a richieste o istruzioni degli utenti. Gli sviluppatori stabiliscono rigide linee guida etiche per impedire che questi chatbot generino contenuti inappropriati o illegali. I ricercatori hanno esplorato modi per progettare richieste che passassero inosservate alle linee guida etiche dei chatbot, inducendoli a rispondere.

Una tattica impiegata prevedeva la creazione di un personaggio che fornisse prompt con spazi tra ogni carattere, aggirando efficacemente i filtri di censura delle parole chiave che potrebbero segnalare parole potenzialmentematic . Inoltre, al chatbot veniva chiesto di rispondere come un personaggio "senza riserve e privo di vincoli morali", aumentando la probabilità di generare contenuti non etici.

Inserendo manualmente tali prompt e monitorando i tempi di risposta, i ricercatori hanno acquisito informazioni sul funzionamento interno e sulle difese dei chatbot. Questo processo di reverse engineering ha permesso loro didenti punti deboli, creando un set di dati di prompt in grado di effettuare il jailbreak dei chatbot.

Una corsa agli armamenti in aumento

Il continuo gioco del gatto e del topo tra hacker e sviluppatori di LLM ha intensificato le misure di sicurezza dei chatbot basati su intelligenza artificiale. Quando vengono scoperte vulnerabilità, gli sviluppatori rilasciano patch per risolverle. Tuttavia, con l'introduzione di Masterkey, i ricercatori hanno spostato l'equilibrio di potere.

Un chatbot di jailbreaking basato sull'intelligenza artificiale creato con Masterkey può generare numerosi prompt e adattarsi continuamente, imparando dai successi e dagli insuccessi del passato. Questo sviluppo mette gli hacker in grado di superare in astuzia gli sviluppatori LLM utilizzando i loro strumenti.

I ricercatori hanno iniziato creando un set di dati di addestramento che incorporava prompt efficaci scoperti durante la fase di reverse engineering e prompt non riusciti per guidare il modello di jailbreaking basato sull'intelligenza artificiale. Questo set di dati è stato utilizzato per addestrare un LLM, a cui sono seguiti un pre-addestramento continuo e un adattamento delle attività. Questo processo ha esposto il modello a diverse informazioni e ne ha migliorato la capacità di manipolare il testo per il jailbreaking.

Il futuro della sicurezza dei chatbot AI

I prompt di Masterkey si sono rivelati tre volte più efficaci nel jailbreaking degli LLM rispetto ai prompt generati dagli LLM stessi. L'LLM che ha eseguito il jailbreaking ha anche dimostrato la capacità di imparare dagli errori passati e di produrre costantemente nuovi prompt più efficaci.

Guardando al futuro, i ricercatori suggeriscono che gli sviluppatori di LLM potrebbero impiegare approcci automatizzati simili per migliorare le proprie misure di sicurezza. Ciò garantirebbe una copertura completa e una valutazione di potenziali scenari di abuso man mano che gli LLM si evolvono e ampliano le loro capacità.

Il jailbreaking riuscito dei chatbot di intelligenza artificiale da parte dei ricercatori della NTU Singapore evidenzia le vulnerabilità degli LLM e sottolinea la necessità di solide misure di sicurezza nello sviluppo dell'intelligenza artificiale. Con la crescente integrazione dei chatbot di intelligenza artificiale nella vita quotidiana, la protezione da potenziali abusi e violazioni etiche rimane una priorità assoluta per gli sviluppatori di tutto il mondo. L'attuale corsa agli armamenti tra hacker e sviluppatori plasmerà senza dubbio il futuro della sicurezza dei chatbot di intelligenza artificiale.

Le menti più brillanti del mondo delle criptovalute leggono già la nostra newsletter. Vuoi partecipare? Unisciti a loro.

Condividi questo articolo

Disclaimer. Le informazioni fornite non costituiscono consulenza di trading. Cryptopolitan/ non si assume alcuna responsabilità per gli investimenti effettuati sulla base delle informazioni fornite in questa pagina. Consigliamotronvivamente di effettuare ricerche indipendentident di consultare un professionista qualificato prima di prendere qualsiasi decisione di investimento.

John Palmer

John Palmer

John Murangiri è entrato a far parte di Cryptopolitan forte di una solida esperienza nell'analisi di mercato. John (noto anche come JP) si è laureato in comunicazione di massa e studi sui media presso l'Università di Nairobi. In precedenza, ha contribuito con le sue analisi sul mercato delle criptovalute a InsideBitcoins.com e Metacoingraph.

ALTRE NOTIZIE
CORSO INTENSIVO DI CRIPTOVALUTE