Un approccio di formazione rivoluzionario consente all'intelligenza artificiale di generalizzare come la mente umana

Brian Koome

Tempo di lettura: 3 minuti. 26 ottobre 2023.

intelligenza artificiale

Un nuovo addestramento migliora il ragionamento umano dell'IA.
L'istruzione mirata sull'intelligenza artificiale favorisce la generalizzazione.
Piccoli modelli, grandi passi avanti per l'intelligenza artificiale.

In uno sviluppo rivoluzionario nel campo dell'intelligenza artificiale (IA), i ricercatori hanno svelato un nuovo protocollo di addestramento in grado di migliorare significativamente la capacità di un modello di IA di generalizzare e comprendere le informazioni, avvicinandolo al modo in cui gli esseri umani apprendono e ragionano. Questo approccio innovativo sfida la convinzione convenzionale che una maggiore quantità di dati sia la chiave per migliorare l'apprendimento automatico, offrendo nuove intuizioni sui segreti sia dell'IA che della cognizione umana.

Gli esseri umani eccellono nel comprendere e combinare diverse componenti per dare un senso al mondo, un'abilità cognitiva nota come "composizionalità" o "generalizzazionematic ". Ci permette di decodificare frasi non familiari, creare risposte originali e comprendere il significato profondo delle parole e delle regole grammaticali. Raggiungere la composizionalità è da tempo una sfida per gli sviluppatori di intelligenza artificiale, poiché le reti neurali tradizionali faticano a emulare questo aspetto fondamentale della cognizione umana.

Sebbene gli attuali modelli di intelligenza artificiale generativa, come GPT-3 e GPT-4 di OpenAI, possano in una certa misura imitare la composizionalità, spesso non riescono a raggiungere determinati obiettivi di benchmark, non riuscendo a cogliere appieno il significato e l'intenzione delle frasi che generano. Tuttavia, un recente studio pubblicato su Nature suggerisce che un protocollo di addestramento unico, incentrato sulle modalità di apprendimento delle reti neurali, potrebbe essere la chiave per affrontare questa sfida.

Rimodellare il processo di apprendimento

Gli autori dello studio hanno adottato un approccio diverso all'addestramento dell'IA, evitando la necessità di creare architetture di IA completamente nuove. Sono invece partiti da un modello transformer standard, la stessa architettura di base utilizzata in ChatGPT e Bard di Google, ma senza alcun addestramento preliminare sul testo. L'innovazione cruciale risiedeva nel regime di addestramento stesso.

I ricercatori hanno progettato una serie di compiti che prevedevano l'uso di un linguaggio fittizio composto da parole senza senso come "dax", "lug", "kiki", "fep" e "blicket". Queste parole erano associate a gruppi di punti colorati, con alcune parole che rappresentavano direttamente specifici colori dei punti e altre che indicavano funzioni che alteravano gli output dei punti. Ad esempio, "dax" rappresentava un punto rosso, mentre "fep" era una funzione che, combinata con "dax" o altre parole simboliche, moltiplicava per tre l'output del punto corrispondente. Fondamentalmente, l'IA non ha ricevuto alcuna informazione su queste associazioni; i ricercatori hanno semplicemente fornito esempi di frasi senza senso insieme alle corrispondenti configurazioni di punti.

L'intelligenza artificiale raggiunge una comprensione simile a quella umana

Durante l'addestramento, il modello di IA ha gradualmente imparato a rispondere in modo coerente, aderendo alle regole implicite del linguaggio insensato. Anche quando le venivano presentate nuove combinazioni di parole, l'IA ha dimostrato la sua capacità di "comprendere" le regole inventate del linguaggio e di applicarle a frasi mai viste prima. Questa straordinaria impresa ha suggerito il potenziale dell'IA di generalizzare, un passo fondamentale verso un ragionamento simile a quello umano.

Per valutare le prestazioni dell'IA, i ricercatori l'hanno confrontata con quelle di partecipanti umani. In alcuni casi, l'IA addestrata ha risposto con una precisione del 100%, superando gli esseri umani, che hanno raggiunto un tasso di precisione di circa l'81%. Anche quando l'IA ha commesso errori, questi hanno rispecchiato gli errori comunemente commessi dagli esseri umani, evidenziando la sua capacità di ragionamento simile a quello umano.

Ciò che è particolarmente degno di nota è che queste prestazioni impressionanti sono state ottenute con un modello di trasformatore relativamente piccolo, non con un'IA di grandi dimensioni addestrata su vasti set di dati. Questa scoperta suggerisce che, anziché inondare i modelli di apprendimento automatico con dati infiniti, un approccio più mirato, simile a un corso specializzato di linguistica o algebra, potrebbe produrre miglioramenti sostanziali nelle capacità dell'IA.

Implicazioni e direzioni future

Sebbene questo nuovo protocollo di addestramento offra risultati promettenti, è essenziale riconoscerne i limiti. Il modello di IA ha eccelso in compiti specifici legati al riconoscimento di pattern all'interno di un linguaggio artificiale, ma ha incontrato difficoltà di fronte a sfide completamente nuove o a forme di generalizzazione inedite. Di conseguenza, è fondamentale riconoscere che raggiungere una generalizzazione limitata nell'IA è un passo significativo, ma non raggiunge l'obiettivo finale dell'intelligenza artificiale generale.

Armando Solar-Lezama, informatico del Massachusetts Institute of Technology, osserva che questa ricerca potrebbe aprire nuove strade per migliorare l'intelligenza artificiale. Concentrandosi sull'insegnamento ai modelli di ragionamento efficace, anche in compiti sintetici, potremmo trovare modi per migliorare le capacità dell'intelligenza artificiale oltre i limiti attuali. Tuttavia, l'estensione su larga scala di questo nuovo protocollo di addestramento potrebbe presentare sfide che devono essere affrontate.

Oltre alle implicazioni pratiche per l'intelligenza artificiale, questa ricerca potrebbe anche far luce sul funzionamento interno delle reti neurali e sulle loro capacità emergenti. La comprensione di questi processi potrebbe contribuire a ridurre al minimo gli errori nei sistemi di intelligenza artificiale e ad aumentare la nostra comprensione della cognizione umana.

Non limitarti a leggere le notizie sulle criptovalute. Cerca di capirle. Iscriviti alla nostra newsletter. È gratis.

Condividi questo articolo

Disclaimer. Le informazioni fornite non costituiscono consulenza di trading. Cryptopolitan/ non si assume alcuna responsabilità per gli investimenti effettuati sulla base delle informazioni fornite in questa pagina. Consigliamotronvivamente di effettuare ricerche indipendentident di consultare un professionista qualificato prima di prendere qualsiasi decisione di investimento.

Brian Koome

Brian Koome vanta oltre sette anni di esperienza nel giornalismo blockchain e sulle criptovalute, essendo attivo nel settore dal 2017. Ha collaborato con importanti pubblicazioni, tra cui BlockToday.com. Inoltre, ha sviluppato il corso Ethereum 101 per BitDegree.org prima di entrare a far parte Cryptopolitan come redattore a tempo pieno. Brian si occupa di guide sempre aggiornate (Evergreen Guides - EG), approfondimenti, interviste e analisi dei prezzi. La sua attenzione alla DeFi, all'innovazione blockchain e ai progetti crypto emergenti è molto apprezzata dai lettori.

INDICE

1. Rimodellare il processo di apprendimento

2. L'intelligenza artificiale raggiunge una comprensione simile a quella umana

3. Implicazioni e direzioni future

Condividi questo articolo