En un estudio publicado en JAMA Network Open, dos versiones de los Modelos de Lenguaje Grande (LLM) de ChatGPT demostraron una notable capacidad para superar a los estudiantes de neurologíadentexámenes de nivel superior. Este avance marca un hito significativo en la aplicación de la inteligencia artificial (IA) en el campo de la medicina, en particular en neurología.
El avance de la IA en los exámenes neurológicos
Los investigadores emplearon LLM 1 (ChatGPT versión 3.5) y LLM 2 (ChatGPT versión 4) para abordar preguntas del banco de preguntas de la Junta Estadounidense de Psiquiatría y Neurología (ABPN). El hallazgo principal del estudio fue que LLM 2 logró una impresionante tasa de éxito del 85 %, superando el promedio humano del 73,8 %. Cabe destacar que este rendimiento se logró sin que los modelos tuvieran acceso a internet ni se les realizara ningún ajuste específico para neurología.
El estudio se adhirió a rigurosos protocolos científicos, incluyendo las directrices STROBE (Fortalecimiento de la Comunicación de Estudios Observacionales en Epidemiología). La comparación condentde neurología humana implicó una serie de preguntas, clasificadas como de orden inferior, centradas en la comprensión y la memoria básicas, o de orden superior, que requieren aplicación, análisis y pensamiento evaluativo.
Las implicaciones de la IA en los campos médicos
El rendimiento superior del LLM 2, especialmente en preguntas de alto nivel, subraya los rápidos avances en IA y sus posibles aplicaciones en entornos clínicos. Esto es especialmente relevante a medida que la IA continúa incursionando en ámbitos tradicionalmente reservados a la experiencia humana, como la medicina, el ámbito militar, la educación y la investigación.
El uso de la IA en neurología clínica se ha expandido, con tareas que abarcan desde el diagnóstico hasta la planificación del tratamiento y el pronóstico. El estudio destaca cómo la IA, especialmente las arquitecturas basadas en transformadores como ChatGPT, puede complementar y, en ocasiones, sustituir las funciones humanas en estos campos.
Equilibrar la IA y la experiencia humana
Si bien los resultados son prometedores, también abren debates sobre el equilibrio entre la IA y la experiencia humana en campos tan sensibles como la medicina. Los autores del estudio enfatizan que las fortalezas de la IA en tareas basadas en la memoria, en comparación con aquellas que requieren cognición profunda, indican un papel complementario, en lugar de un sustituto, de los expertos médicos humanos.
Los hallazgos del estudio demuestran el potencial de la IA para mejorar las prácticas médicas y las herramientas educativas. Sin embargo, también subrayan la necesidad de una evaluación y un perfeccionamiento continuos de estos sistemas de IA para garantizar que complementen eficazmente la experiencia humana.
El estudio de JAMA Network Open revela un avance significativo en las capacidades de la IA, especialmente en el campo de la neurología. Los resultados demuestran la capacidad de la IA para realizar tareas analíticas complejas y abren la puerta a nuevas posibilidades en la educación y la práctica médica. El futuro de la IA en la medicina se presenta prometedor, con estas tecnologías preparadas para desempeñar un papel cada vez más complementario a los profesionales humanos.

