I ricercatori Microsoft svelano una tecnica innovativa per cancellare conoscenze specifiche da modelli linguistici di grandi dimensioni

Brenda Kanana

Tempo di lettura: 3 minuti. 7 ottobre 2023.

I ricercatori Microsoft svelano un nuovo modo per far sì che i modelli di intelligenza artificiale dimentichino informazioni specifiche, come Harry Potter, senza dover ricorrere a una massiccia riqualificazione.
La loro tecnica in tre fasi cancella in modo efficiente le conoscenze in una sola ora GPU, mantenendo intatte le prestazioni complessive dell'IA.
Questa svolta offre la speranza di modelli di intelligenza artificiale più adattabili ed etici in futuro.

In un notevole progresso nell'ambito dell'intelligenza artificiale, un team di ricercatori di Microsoft ha svelato un approccio pionieristico per modificare selettivamente conoscenze specifiche all'interno di modelli linguistici di grandi dimensioni (LLM). Questa metodologia innovativa, descritta in dettaglio in un recente articolo sulla nota piattaforma arXiv.org, affronta una questione pertinente relativa all'utilizzo di materiali protetti da copyright durante la formazione degli LLM. Inoltre, offre una soluzione promettente per valutare se questi modelli possano adattarsi senza una riqualificazione approfondita.

Un salto significativo nell'adattabilità

Modelli linguistici di grandi dimensioni, tra cui ChatGPT di OpenAI, Llama 2 di Meta e Claude 2 di Anthropic, hannotracnotevole attenzione e attenzione grazie alla loro eccezionale capacità di generare contenuti testuali basati sugli ampi set di dati su cui vengono addestrati, che possono includere materiali protetti da copyright. La sfida di personalizzare questi modelli per dimenticare o disimparare informazioni specifiche è da tempo una preoccupazione.

Cancellazione efficiente in un'ora GPU

Iricercatori di Microsoft, Ronen Eldan e Mark Russinovich, hanno proposto un'elegante soluzione a questa sfida. Il loro articolo introduce una tecnica triplice progettata per approssimare il processo di disapprendimento di informazioni specifiche all'interno dei corsi di laurea specialistica. L'aspetto più degno di nota del loro approccio è la sua efficienza. In particolare, dimostrano la capacità di cancellare tutta la conoscenza relativa ai libri di Harry Potter, compresi personaggi e dettagli della trama, con una sola ora di GPU di messa a punto. Questo livello di elevata efficienza promette di sviluppare modelli linguistici più adattabili e reattivi.

Decostruire la tecnica in tre parti

La tecnica di Eldan e Russinovich segna un netto distacco dall'approccio tradizionale al machine learning, che si concentra principalmente sull'accumulo di conoscenza senza fornire meccanismi diretti per il disapprendimento. Il loro approccio innovativo comprende tre passaggi fondamentali:

1.dentdei token rilevanti: nella fase iniziale, il modello viene addestrato utilizzando i dati target, in questo caso i libri di Harry Potter. Il modellodenti token più strettamente associati ai dati target confrontando le sue previsioni con quelle generate da un modello di base. Questo passaggio iniziale è la base per individuare la conoscenza da cancellare.

2. Sostituzione di espressioni univoche: il secondo passaggio prevede la sostituzione di espressioni univoche specifiche della serie di Harry Potter con controparti generiche. In questo modo, i ricercatori generano previsioni alternative che rispecchiano efficacemente l'output di un modello privo di dati di training specifici. Questa sostituzione è un elemento fondamentale nel processo di cancellazione della conoscenza.

3. Ottimizzazione e cancellazione: la fase finale ruota attorno all'ottimizzazione del modello di base utilizzando le previsioni alternative. Questo processo di ottimizzazione cancella il testo originale dalla memoria del modello quando viene fornito un contesto correlato alla serie di Harry Potter. Questo passaggio fondamentale consente al modello di "dimenticare" le intricate narrazioni dei libri di Harry Potter.

Valutare il successo

Eldan e Russinovich hanno condotto una serie completa di test per valutare l'efficacia della loro metodologia. Hanno esaminato la capacità del modello di generare o discutere contenuti relativi alla serie di Harry Potter utilizzando 300 prompt generatimatice analizzando meticolosamente le probabilità dei token. Di fondamentale importanza, i loro risultati indicano che dopo una sola ora di messa a punto, il modello poteva sostanzialmente "dimenticare" le narrazioni dettagliate della serie di Harry Potter. Sorprendentemente, questa cancellazione ha avuto ripercussioni minime sulle prestazioni del modello in valutazioni di benchmark standard come ARC, BoolQ e Winogrande.

Implicazioni e ricerche future

Sebbene questa tecnica innovativa si dimostri promettente, è fondamentale sottolineare che sono indispensabili ulteriori ricerche per perfezionare e ampliare la metodologia, in particolare per quanto riguarda compiti di disapprendimento più ampi all'interno di modelli linguistici di grandi dimensioni. Vale la pena notare che questo approccio può essere particolarmente efficace per testi di fantasia, come la serie di Harry Potter, grazie alla presenza di riferimenti univoci.

Poiché i sistemi di intelligenza artificiale continuano a svolgere un ruolo sempre più cruciale in diversi ambiti, la capacità di dimenticare o disimparare selettivamente informazioni specifiche assume un'importanza fondamentale. Questa metodologia rappresenta un passo fondamentale verso lo sviluppo di LLM più responsabili, adattabili e conformi alle normative. Ha il potenziale per rispondere alle linee guida etiche, ai valori sociali e alle esigenze specifiche degli utenti, con la continua evoluzione del campo dell'IA.

Se stai leggendo questo, sei già un passo avanti. Rimani al passo con i tempi iscrivendoti alla nostra newsletter.

Condividi questo articolo

Disclaimer. Le informazioni fornite non costituiscono consulenza di trading. Cryptopolitan/ non si assume alcuna responsabilità per gli investimenti effettuati sulla base delle informazioni fornite in questa pagina. Consigliamotronvivamente di effettuare ricerche indipendentident di consultare un professionista qualificato prima di prendere qualsiasi decisione di investimento.

Brenda Kanana

Brenda vanta oltre 4 anni di esperienza specializzata in criptovalute, intelligenza artificiale e tecnologie emergenti. Ha lavorato presso Zycrypto, Blockchain Reporter, The Coin Republic e ora collabora con Cryptopolitan . La sua laurea in Sociologia conseguita presso la Mombasa Technical University le permette di rimanere in sintonia con le esigenze dei suoi lettori.

INDICE

1. Un salto significativo nell'adattabilità

2. Cancellazione efficiente in un'ora GPU

3. Decostruire la tecnica in tre parti

4. Valutare il successo

5. Implicazioni e ricerche future

Condividi questo articolo