In uno studio pubblicato su JAMA Network Open, due versioni dei modelli linguistici di grandi dimensioni (LLM) ChatGPT hanno dimostrato una notevole capacità di superare gli studenti di neurologia umanadentesami di ammissione. Questo sviluppo segna una pietra miliare significativa nell'applicazione dell'intelligenza artificiale (IA) in campo medico, in particolare in neurologia.
I progressi dell'intelligenza artificiale negli esami neurologici
I ricercatori hanno utilizzato LLM 1 (ChatGPT versione 3.5) e LLM 2 (ChatGPT versione 4) per affrontare domande tratte dalla banca dati di quesiti dell'American Board of Psychiatry and Neurology (ABPN). Il risultato principale dello studio è stato che LLM 2 ha raggiunto un impressionante tasso di successo dell'85%, superando la media umana del 73,8%. In particolare, questa prestazione è stata ottenuta senza che i modelli avessero accesso a Internet o fossero stati sottoposti a una messa a punto specifica per la neurologia.
Lo studio ha aderito a rigorosi protocolli scientifici, tra cui le linee guida STROBE (Strengthening the Reporting of Observational Studies in Epidemiology). Il confronto con glidentdi neurologia umana ha coinvolto una serie di domande, classificate come di ordine inferiore, incentrate sulla comprensione di base e sulla memoria, o di ordine superiore, che richiedevano applicazione, analisi e pensiero valutativo.
Le implicazioni dell'intelligenza artificiale in campo medico
Le prestazioni superiori del LLM 2, soprattutto nelle domande di ordine superiore, sottolineano i rapidi progressi dell'IA e le sue potenziali applicazioni in ambito clinico. Ciò è particolarmente rilevante poiché l'IA continua a sconfinare in ambiti tradizionalmente riservati alle competenze umane, come la medicina, l'esercito, l'istruzione e la ricerca.
L'uso dell'intelligenza artificiale in neurologia clinica è in continua espansione, con compiti che spaziano dalla diagnosi alla pianificazione del trattamento e alla prognosi. Lo studio evidenzia come l'intelligenza artificiale, in particolare le architetture basate su trasformatori come ChatGPT, possa supportare e talvolta sostituire i ruoli umani in questi campi.
Bilanciare l'intelligenza artificiale e le competenze umane
Sebbene i risultati siano promettenti, aprono anche discussioni sull'equilibrio tra intelligenza artificiale e competenze umane in campi delicati come la medicina. Gli autori dello studio sottolineano che i punti di forza dell'intelligenza artificiale nei compiti basati sulla memoria, rispetto a quelli che richiedono una cognizione più profonda, indicano un ruolo complementare piuttosto che sostitutivo degli esperti medici umani.
I risultati dello studio testimoniano il potenziale dell'intelligenza artificiale nel migliorare le pratiche mediche e gli strumenti educativi. Tuttavia, sottolineano anche la necessità di una valutazione e di un perfezionamento continui di questi sistemi di intelligenza artificiale per garantire che possano integrare efficacemente le competenze umane.
Lo studio di JAMA Network Open rivela un significativo balzo in avanti nelle capacità dell'IA, in particolare nel campo medico della neurologia. I risultati dimostrano la capacità dell'IA di svolgere compiti analitici complessi e aprono le porte a nuove possibilità nella formazione e nella pratica medica. Il futuro dell'IA in medicina appare roseo, con queste tecnologie destinate a svolgere un ruolo sempre più di supporto ai professionisti umani.

