一项 研究表明 ,ChatGPT 的两个大型语言模型 (LLM) 版本在模拟考试中表现出色,甚至超越了人类神经病学学生dent的应用取得了重大突破 人工智能 (AI) 在医学领域, 尤其是在神经病学领域
人工智能在神经病学考试中取得长足进步
研究人员使用LLM 1(ChatGPT 3.5版)和LLM 2(ChatGPT 4版)来解答美国精神病学和神经病学委员会(ABPN)题库中的题目。该研究的主要发现是,LLM 2取得了令人瞩目的85%的成功率,远超人类73.8%的平均水平。值得注意的是,这一优异表现是在模型 无需访问互联网 或进行神经学专项调整的情况下实现的。
该研究遵循严格的科学规范,包括加强流行病学观察性研究报告(STROBE)指南。与人类神经病学dent的比较涉及一系列问题,这些问题分为低阶问题和高阶问题。低阶问题侧重于基本理解和记忆,而高阶问题则需要应用、分析和评估性思维。
人工智能在医学领域的影响
LLM 2 的卓越性能,尤其是在高阶问题上的出色表现,凸显了人工智能的快速发展及其在临床领域的潜在应用。随着人工智能不断渗透到传统上由人类专业知识主导的领域,例如医学、军事、教育和研究,这一点尤为重要。
人工智能在临床神经病学领域的应用日益广泛,其任务涵盖诊断、治疗方案制定和预后评估等各个方面。这项研究重点阐述了人工智能,尤其是像ChatGPT这样基于Transformer架构的人工智能,如何能够辅助甚至在某些情况下取代人类在这些领域中的作用。
平衡人工智能和人类专业知识
尽管研究结果令人鼓舞,但也引发了关于人工智能与人类专业知识在医学等敏感领域平衡问题的讨论。研究作者强调,与需要深度认知的任务相比,人工智能在基于记忆的任务方面的优势表明,它扮演的是辅助角色,而非取代人类医学专家。
这项研究的发现证明了人工智能在提升医疗实践和教育工具方面的巨大潜力。然而,它也强调了持续评估和改进这些人工智能系统的必要性,以确保它们能够有效地增强人类的专业知识。
JAMA Network Open 发表的这项研究揭示了人工智能能力的显著提升,尤其是在神经病学领域。研究结果表明,人工智能在复杂的分析任务中展现出强大的实力,并为医学教育和实践开辟了新的可能性。人工智能在医学领域的未来前景光明,这些技术有望在人类专业人员的辅助下发挥越来越重要的作用。

