ULTIME NOTIZIE
SELEZIONATO PER TE
SETTIMANALE
RIMANI AL TOP

Le migliori analisi sul mondo delle criptovalute, direttamente nella tua casella di posta.

OpenAI promuoverà i modelli di intelligenza artificiale o1 e o3 con un nuovo paradigma di formazione sulla sicurezza

DiFirenze MuchaiFirenze Muchai
Tempo di lettura: 3 minuti.
Foto di Sam Altman e del logo di OpenAI
  • OpenAI introduce modelli o3 con una nuova formazione sulla sicurezza tramite "allineamento deliberativo", migliorando l'allineamento del ragionamento dell'IA con i valori degli sviluppatori.
  • L'allineamento deliberativo riduce le risposte considerate non sicure, poiché i modelli si autoregolano e richiamano le politiche di sicurezza durante il processo di pensiero.
  • I modelli o1 e o3 superano GPT-4o, Gemini 1.5 Flash e Claude 3.5 Sonnet nella resistenza ai jailbreak più comuni e agli output non sicuri nei test di benchmark.

Venerdì, OpenAI ha annunciato il rilascio di una nuova famiglia di modelli di intelligenza artificiale, denominata o3. L'azienda afferma che i nuovi prodotti sono più avanzati rispetto ai modelli precedenti, incluso o1. I progressi, secondo la startup, derivano da miglioramenti nella scalabilità del calcolo in fase di test, un argomento esplorato negli ultimi mesi, e dall'introduzione di un nuovo paradigma di sicurezza utilizzato per addestrare questi modelli.

Nell'ambito del suo costante impegno per il miglioramento della sicurezza dell'IA, OpenAI ha condiviso una nuova ricerca che illustra l'implementazione dell'"allineamento deliberativo". Il nuovo metodo di sicurezza mira a garantire che i modelli di ragionamento dell'IA siano allineati ai valori stabiliti dai loro sviluppatori. 

Questo approccio, sostiene OpenAI, è stato utilizzato per migliorare l'allineamento dei modelli o1 e o3, guidandoli a riflettere sulle policy di sicurezza di OpenAI durante la fase di inferenza. La fase di inferenza è il periodo successivo all'invio di un prompt da parte dell'utente al modello e precedente alla generazione di una risposta da parte del modello. 

Nella sua ricerca, OpenAI osserva che l'allineamento deliberativo ha portato a una riduzione della frequenza con cui i modelli producevano risposte "non sicure" o risposte che l'azienda considera una violazione delle sue politiche di sicurezza, migliorando al contempo la capacità dei modelli di rispondere in modo più efficace a domande benigne.

Come funziona l'allineamento deliberativo 

In sostanza, il processo funziona facendo in modo che i modelli si riattivino durante la fase di elaborazione del pensiero. Ad esempio, dopo che un utente invia una domanda a ChatGPT, i modelli di ragionamento dell'IA impiegano da pochi secondi a diversi minuti per scomporre il problema in passaggi più piccoli. 

I modelli generano quindi una risposta basata sul loro processo di pensiero. Nel caso dell'allineamento deliberativo, i modelli incorporano la politica di sicurezza di OpenAI come parte di questa "deliberazione" interna

OpenAI ha addestrato i suoi modelli, inclusi o1 e o3, a richiamare sezioni della policy di sicurezza aziendale come parte di questo processo di pensiero concatenato. Questo è stato fatto per garantire che, di fronte a query sensibili o non sicure, i modelli si autoregolassero e si rifiutassero di fornire risposte che avrebbero potuto causare danni. 

Tuttavia, l'implementazione di questa funzionalità di sicurezza si è rivelata impegnativa, poiché i ricercatori di OpenAI hanno dovuto garantire che i controlli di sicurezza aggiuntivi non avessero un impatto negativo sulla velocità e sull'efficienza dei modelli.

Un esempio fornito nella ricerca di OpenAI, citato da TechCrunch, ha dimostrato come i modelli utilizzino l'allineamento deliberativo per rispondere in modo sicuro a richieste potenzialmente dannose. Nell'esempio, un utente chiede come creare un contrassegno di parcheggio realistico per persone con disabilità. 

Durante la catena di pensiero interna del modello, quest'ultimo richiama la politica di sicurezza di OpenAI, riconosce che la richiesta implica un'attività illegale (la falsificazione di un contrassegno di parcheggio) e rifiuta di fornire assistenza, scusandosi per il rifiuto.

Questo tipo di deliberazione interna è un elemento chiave del modo in cui OpenAI lavora per allineare i propri modelli ai protocolli di sicurezza. Invece di bloccare semplicemente qualsiasi richiesta relativa a un argomento delicato come "bomba", ad esempio, il che limiterebbe eccessivamente le risposte del modello, l'allineamento deliberativo consente all'IA di valutare il contesto specifico della richiesta e prendere una decisione più articolata sull'opportunità o meno di rispondere.

Oltre ai progressi in termini di sicurezza, OpenAI ha anche condiviso i risultati di test di benchmarking che hanno dimostrato l'efficacia dell'allineamento deliberativo nel migliorare le prestazioni del modello. Un benchmark, noto come Pareto, misura la resistenza di un modello ai comuni jailbreak e ai tentativi di aggirare le misure di sicurezza dell'IA. 

In questi test, il modello o1-preview di OpenAI ha superato altri modelli popolari come GPT-4o, Gemini 1.5 Flash e Claude 3.5 Sonnet in termini di prevenzione di output non sicuri.

Il Garante per la protezione dei dati personali multa OpenAI per violazioni della privacy 

In un evento separato ma correlato, OpenAI è stata multata di 15 milioni di euro (15,58 milioni di dollari) dall'agenzia italiana per la protezione dei dati, il Garante, a seguito di un'indagine sulla gestione dei dati personali da parte dell'azienda. 

La sanzione deriva dalla constatazione dell'agenzia secondo cui OpenAI ha elaborato i dati personali degli utenti senza una base giuridica, violando gli obblighi di trasparenza e di informazione degli utenti previsti dalle leggi sulla privacy dell'UE.

Secondo Reuters, l'indagine, iniziata nel 2023, ha anche rivelato che OpenAI non disponeva di un adeguato sistema di verifica dell'età, esponendo potenzialmente i bambini di età inferiore ai 13 anni a contenuti inappropriati generati dall'intelligenza artificiale. 

Garante, uno degli organismi di regolamentazione dell'IA più severi dell'Unione Europea, ha ordinato a OpenAI di avviare una campagna pubblica di sei mesi in Italia per sensibilizzare l'opinione pubblica sulle pratiche di raccolta dati, in particolare sull'utilizzo di dati personali per addestrare gli algoritmi.

In risposta, OpenAI ha definito la sanzione "sproporzionata" e ha manifestato l'intenzione di presentare ricorso contro la decisione. L'azienda ha inoltre criticato la sanzione, definendola eccessivamente elevata rispetto al fatturato realizzato in Italia nel periodo in questione. 

Il Garante ha inoltre osservato che la sanzione è stata calcolata tenendo conto della "posizione collaborativa" di OpenAI, il che significa che avrebbe potuto essere più elevata se l'azienda non fosse stata ritenuta collaborativa durante l'indagine.

Quest'ultima sanzione non è la prima volta che OpenAI si trova sotto esame in Italia. L'anno scorso, Garante ha temporaneamente vietato l'utilizzo di ChatGPT in Italia a causa di presunte violazioni delle norme UE sulla privacy. Il servizio è stato ripristinato dopo che OpenAI ha affrontato le problematiche sollevate, tra cui la possibilità per gli utenti di negare il consenso all'utilizzo dei propri dati personali per l'addestramento degli algoritmi.

Le menti più brillanti del mondo delle criptovalute leggono già la nostra newsletter. Vuoi partecipare? Unisciti a loro.

Condividi questo articolo

Disclaimer. Le informazioni fornite non costituiscono consulenza di trading. Cryptopolitan/ non si assume alcuna responsabilità per gli investimenti effettuati sulla base delle informazioni fornite in questa pagina. Consigliamotronvivamente di effettuare ricerche indipendentident di consultare un professionista qualificato prima di prendere qualsiasi decisione di investimento.

Firenze Muchai

Firenze Muchai

Florence si occupa da sei anni di notizie relative a criptovalute, videogiochi, tecnologia e intelligenza artificiale. I suoi studi in Informatica presso la Meru University of Science and Technology e in Gestione delle Catastrofi e Diplomazia Internazionale presso la MMUST le hanno fornito solide competenze linguistiche, di osservazione e tecniche. Florence ha lavorato presso VAP Group e come redattrice per diverse testate giornalistiche specializzate in criptovalute.

ALTRE NOTIZIE
CORSO INTENSIVO DI CRIPTOVALUTE