ULTIME NOTIZIE
SELEZIONATO PER TE
SETTIMANALE
RIMANI AL TOP

Le migliori analisi sul mondo delle criptovalute, direttamente nella tua casella di posta.

Il modello di ragionamento di OpenAI spesso "pensa" in cinese: nessuno sa spiegare perché

DiFirenze MuchaiFirenze Muchai
Tempo di lettura: 3 minuti.
Il modello di ragionamento di OpenAI spesso "pensa" in cinese. Nessuno sa spiegare perché
  • Il modello di intelligenza artificiale iniziale di "ragionamento" OpenAI o1 ha difficoltà a essere coerente con un linguaggio quando risponde alle domande.
  • Gli esperti affermano che OpenAI o1 è influenzato dalla linguistica cinese nel ragionamento.
  • OpenAI non è riuscita a riconoscere la debolezza del linguaggio o1.

Gli utenti di OpenAI hannodentuna vulnerabilità. Poco dopo che OpenAI ha pubblicato o1, il suo modello iniziale di intelligenza artificiale "ragionante", è stato osservato un comportamento peculiare. Apparentemente, quando una richiesta viene posta in inglese, il modello inizia occasionalmente a "pensare" in una lingua diversa dall'inglese, come il cinese o il persiano. 

Un utente ha detto: "[O1] ha iniziato a pensare in cinese a caso a metà strada". Inoltre, un utente completamente diverso su X ha detto anche: "Perché [o1] ha iniziato a pensare in cinese a caso?"

Secondo le osservazioni, quando gli viene presentato un problema da risolvere, o1 inizia il suo processo di "pensiero", che prevede una sequenza di passaggi di ragionamento che portano a una risposta. La risposta finale di o1 sarebbe in inglese se la query fosse scritta in quella lingua.

Tuttavia, il modello eseguirebbe determinate procedure in una lingua diversa prima di formulare la sua conclusione.

In particolare, OpenAI non ha fornito una spiegazione per la peculiare condotta di o1, né l'ha nemmeno riconosciuta. Quale potrebbe essere la causa?

Ecco le teorie di alcuni professionisti dell'intelligenza artificiale.

Il CEO di Hugging Face, Clément Delangue, ha dichiarato su X che i modelli di ragionamento come o1 vengono addestrati su set di dati con un gran numero di caratteri cinesi. 

Inoltre, secondo Ted Xiao, ricercatore presso Google DeepMind, organizzazioni come OpenAI utilizzano servizi di etichettatura dei dati cinesi di terze parti e il passaggio al cinese è un esempio di "influenza linguistica cinese sul ragionamento"

In un post su X, : "I laboratori di AGI come OpenAI e Anthropic utilizzano servizi di etichettatura dati di terze parti per i dati di ragionamento a livello di dottorato in ambito scientifico, matematico e di programmazione; per ragioni di disponibilità di manodopera specializzata e di costi, molti di questi fornitori di dati hanno sede in Cina."

Apparentemente, durante il processo di addestramento, le etichette, chiamate anchedento annotazioni, aiutano i modelli a comprendere e interpretare i dati.

 Ad esempio, le etichette utilizzate per addestrare un modello di riconoscimento delle immagini possono essere costituite da didascalie che fanno riferimento a ciascuna persona, luogo o oggetto raffigurato in un'immagine, oppure da segni che circondano gli oggetti.

Inoltre, la ricerca ha dimostrato che classificazioni distorte possono dare origine a modelli distorti. Ad esempio, l'annotatore medio è più propenso a etichettare frasi in inglese vernacolare afroamericano (AAVE). 

Questa è nota come grammatica informale usata da alcuni afroamericani per indicare sostanze tossiche. Di conseguenza, i rilevatori di tossicità dell'IA addestrati sulle etichette percepiscono AAVE come eccessivamente tossico.

Tuttavia, la teoria dell'etichettatura dei dati in cinese o1 non è accettata da altri esperti. Essi sottolineano che è altrettanto probabile che o1 passi all'hindi, al tailandese o a una lingua diversa dal cinese nel tentativo di formulare una soluzione.

Questi esperti sostengono piuttosto che o1 e altri modelli di ragionamento potrebbero utilizzare i linguaggi più efficienti per raggiungere un obiettivo.

A tal proposito, Matthew Guzdial, ricercatore nel campo dell'intelligenza artificiale, ha affermato: "Il modello non sa cosa sia una lingua o che le lingue siano diverse". Questo perché i token, analogamente alle etichette, possono introdurre dei pregiudizi. 

In particolare, diversi traduttori che usano la traduzione "parola-token" presumono che uno spazio in una frase indichi una nuova parola. Questo nonostante non tutte le lingue utilizzino gli spazi per separare le parole.

Tuttavia, Luca Soldaini, ricercatore presso l'Allen Institute for AI, un'organizzazione senza scopo di lucro, ha sottolineato che è impossibile determinarlo con certezza. Ha affermato: "Questo tipo di osservazione su un sistema di intelligenza artificiale in funzione è impossibile da confermare a causa della natura opaca di questi modelli [...] È uno dei numerosi casi in cui viene evidenziata l'importanza della trasparenza nella costruzione dei sistemi di intelligenza artificiale".

Problemi con OpenAI

Il 2024 è stato un anno a dir poco turbolento per OpenAI. L'azienda e il suo CEO, Sam Altman, hanno iniziato l'anno con una causa intentata da Elon Musk. Musk ha sostenuto che l'azienda aveva abbandonato il suo obiettivo iniziale di non-profit per privilegiare i profitti rispetto al bene pubblico.

Nell'ultimo anno, otto quotidiani negli Stati Uniti, tra cui il New York Daily News, il Chicago Tribune e il Denver Post, hanno fatto causa a OpenAI e Microsoft. Hanno accusato l'azienda di aver utilizzato milioni di pubblicazioni protette da copyright per addestrare chatbot di intelligenza artificiale senza autorizzazione o pagamento. Hanno affermato che la tecnica violava i loro diritti di proprietà intellettuale.

Anche Mira Murati, Chief Technology Officer di OpenAI, ha annunciato le sue dimissioni. Si è trattato di un momento chiave, poiché le sue competenze tecnologiche erano essenziali per lo sviluppo dell'azienda.

Inoltre, OpenAI ha riscontrato diverse difficoltà con ChatGPT, come interruzioni occasionali, problemi tecnici che hanno portato a risposte imprecise o insensate da parte del chatbot e preoccupazioni relative alla privacy degli utenti. Ci sono stati anche casi in cui l'IA ha generato contenuti parziali o offensivi.

Non limitarti a leggere le notizie sulle criptovalute. Cerca di capirle. Iscriviti alla nostra newsletter. È gratis.

Condividi questo articolo

Disclaimer. Le informazioni fornite non costituiscono consulenza di trading. Cryptopolitan/ non si assume alcuna responsabilità per gli investimenti effettuati sulla base delle informazioni fornite in questa pagina. Consigliamotronvivamente di effettuare ricerche indipendentident di consultare un professionista qualificato prima di prendere qualsiasi decisione di investimento.

Firenze Muchai

Firenze Muchai

Florence si occupa da sei anni di notizie relative a criptovalute, videogiochi, tecnologia e intelligenza artificiale. I suoi studi in Informatica presso la Meru University of Science and Technology e in Gestione delle Catastrofi e Diplomazia Internazionale presso la MMUST le hanno fornito solide competenze linguistiche, di osservazione e tecniche. Florence ha lavorato presso VAP Group e come redattrice per diverse testate giornalistiche specializzate in criptovalute.

ALTRE NOTIZIE
CORSO INTENSIVO DI CRIPTOVALUTE