Une étude publiée dans JAMA Network Open a démontré que deux versions des modèles de langage ChatGPT Large Language Models (LLM) surpassent les étudiants en neurologiedentd'examens de type certificat. Cette avancée représente une étape importante dans l'application de l' intelligence artificielle (IA) au domaine médical, et plus particulièrement en neurologie.
Les progrès de l'IA dans les examens de neurologie
Des chercheurs ont utilisé LLM 1 (ChatGPT version 3.5) et LLM 2 (ChatGPT version 4) pour répondre aux questions de la banque de questions de l'American Board of Psychiatry and Neurology (ABPN). Le principal résultat de l'étude est que LLM 2 a atteint un taux de réussite impressionnant de 85 %, dépassant la moyenne humaine de 73,8 %. Il est à noter que cette performance a été obtenue sans que les modèles aient accès à Internet ni subi de paramétrage spécifique à la neurologie.
L'étude a respecté des protocoles scientifiques rigoureux, notamment les recommandations STROBE (Strengthening the Reporting of Observational Studies in Epidemiology). La comparaison avec desdenten neurologie humaine portait sur une série de questions, classées en deux catégories : les questions de niveau inférieur, axées sur la compréhension et la mémorisation de base, et les questions de niveau supérieur, nécessitant application, analyse et esprit critique.
Les implications de l'IA dans le domaine médical
Les performances exceptionnelles de LLM 2, notamment pour les questions complexes, soulignent les progrès rapides de l'IA et ses applications potentielles en milieu clinique. Ceci est d'autant plus pertinent que l'IA continue de s'immiscer dans des domaines traditionnellement réservés à l'expertise humaine, tels que la médecine, le secteur militaire, l'éducation et la recherche.
L'utilisation de l'IA en neurologie clinique est en pleine expansion, couvrant des tâches allant du diagnostic à la planification du traitement et au pronostic. Cette étude souligne comment l'IA, notamment les architectures basées sur les transformeurs comme ChatGPT, peut assister, voire remplacer, l'humain dans ces domaines.
Équilibrer l'IA et l'expertise humaine
Bien que les résultats soient prometteurs, ils soulèvent également la question de l'équilibre entre l'IA et l'expertise humaine dans des domaines sensibles comme la médecine. Les auteurs de l'étude soulignent que les atouts de l'IA dans les tâches de mémorisation, comparés à ceux qu'elle requiert pour les tâches nécessitant une cognition profonde, indiquent un rôle complémentaire plutôt qu'un remplacement des experts médicaux humains.
Les résultats de cette étude témoignent du potentiel de l'IA pour améliorer les pratiques médicales et les outils pédagogiques. Toutefois, ils soulignent également la nécessité d'une évaluation et d'un perfectionnement continus de ces systèmes d'IA afin de garantir qu'ils complètent efficacement l'expertise humaine.
L'étude publiée dans JAMA Network Open révèle un bond en avant significatif des capacités de l'IA, notamment en neurologie. Les résultats démontrent l'efficacité de l'IA dans les tâches analytiques complexes et ouvrent la voie à de nouvelles perspectives pour la formation et la pratique médicales. L'avenir de l'IA en médecine s'annonce prometteur, ces technologies étant appelées à jouer un rôle de plus en plus important aux côtés des professionnels de santé.

