Nel mondo della tecnologia in rapida evoluzione, i chatbot basati sull'Intelligenza Artificiale (IA) si sono affermati come una svolta significativa. Tra questi, ChatGPT di OpenAI si è distinto e ha affascinato il pubblico fin dalla sua presentazione pubblica lo scorso anno. La sua capacità di coinvolgere in conversazioni fluide gli è valsa riconoscimenti e ha innescato una feroce corsa globale per sviluppare modelli di IA ancora più avanzati. Tuttavia, tra gli applausi e le preoccupazioni sul potenziale predominio dell'IA, recenti scoperte hanno svelato uno sviluppo inaspettato: la diminuzione delle competenze di ChatGPT nella matematica di base.
Comprendere il fenomeno della "deriva" dell'IA
Il termine "deriva" nell'intelligenza artificiale non è solo un termine di moda. È un fenomeno reale e osservato che ha catturato l'attenzione della comunità accademica. Una ricerca collaborativa tra la Stanford University e l'Università della California, Berkeley, ha fatto luce su questo aspetto intrigante del comportamento dell'intelligenza artificiale.
L'essenza del "drift" risiede nelle conseguenze indesiderate dell'ottimizzazione del modello. Mentre ricercatori e sviluppatori si impegnano a migliorare alcune funzionalità di questi complessi modelli di intelligenza artificiale, altre aree potrebbero inavvertitamente risentirne. Questo è esattamente ciò che sta accadendo con ChatGPT.
James Zou, rinomato professore di Stanford e uno dei principali contributori della ricerca, ha spiegato: "Quando si modifica il modello per migliorarlo in una direzione specifica, si corre il rischio concreto che regredisca in altre aree". Questa sfida intrinseca sottolinea la complessità del raggiungimento di progressi costanti nei modelli di intelligenza artificiale.
Approfondimento sul declino
La ricerca non è stata una rapida occhiata alle capacità di ChatGPT. È stata un'analisi meticolosa guidata da Lingjiao Chen, un diligentedent in informatica di Stanford, e Matei Zaharia, una figura di spicco di Berkeley. Il loro obiettivo era chiaro: valutare il comportamento di due distinte versioni di ChatGPT nel corso di un periodo di tempo.
Le loro scoperte furono sorprendenti. Si potrebbe supporre chedenti numeri primi, un compito relativamente semplice per i computer, sarebbe un gioco da ragazzi per un'intelligenza artificiale così avanzata. Tuttavia, i risultati raccontavano una storia diversa.
In un test condotto a marzo, a GPT-4, la versione premium di ChatGPT, sono stati presentati 1.000 numeri diversi. È riuscito a determinare correttamente la primalità dell'84% di essi. A giugno, la sua accuratezza è crollata a un misero 51%. Non si è trattato di undentisolato. Su otto compiti diversi, le prestazioni di GPT-4 sono peggiorate in sei. Sebbene GPT-3.5 sia migliorato in sei aree, è rimasto sostanzialmente indietro rispetto al suo successore.
Le implicazioni della deriva rapida
Sebbene il "drift" sia un concetto riconosciuto tra gli appassionati di intelligenza artificiale, la velocità con cui si è manifestato in ChatGPT è stata inaspettata. Le osservazioni del team di ricerca si sono estese oltre i compitimatic. Hanno notato un netto calo nella reattività di GPT-4 alle query incentrate sulle opinioni. Da un lodevole tasso di risposta del 98% a marzo, è sceso al 23% a giugno.
Questa regressione potrebbe essere intrecciata con la crescente tendenza al "prompt engineering", che prevede che gli utenti creino prompt specifici pertracrisposte di intelligenza artificiale particolari e talvolta controverse. Il degrado delle capacitàmaticdi ChatGPT potrebbe essere una conseguenza involontaria delle misure adottate per contrastare tali prompt manipolativi.
Navigare nel futuro dell'intelligenza artificiale
Nonostante gli ostacoli, il consenso, soprattutto all'interno della comunità scientifica, è di non abbandonare la tecnologia. L'enfasi è invece sulla vigilanza. Zou sostiene con passione un approccio di monitoraggio più rigoroso. Facendo eco ai suoi sentimenti, il team congiunto di Stanford e Berkeley si sta preparando a sottoporre i modelli di intelligenza artificiale, incluso ChatGPT, a una serie di test. Il loro obiettivo? Valutare empiricamente la loro evoluzione nel tempo.
Il percorso di evoluzione dell'IA non è lineare. È un viaggio dinamico segnato da passi avanti, occasionali inciampi e deviazioni inaspettate. Mentre la comunità globale continua a navigare nell'intricato labirinto dell'IA, una cosa èdent: il percorso di comprensione e perfezionamento di questi sistemi è tutt'altro che concluso.
foto 2023 08 06 23 22 19