한 연구 ChatGPT 대규모 언어 모델(LLM) 두 버전이 신경과 전문의 시험과 유사한 시험에서 인간 신경과 학생들을 능가하는 놀라운 성능을 보여주었습니다dent적용에 있어 중요한 이정표가 될 것입니다 의료 분야, 특히 신경과 분야에서 인공지능(AI) .
신경학 검사에서 인공지능의 발전
연구진은 LLM 1(ChatGPT 버전 3.5)과 LLM 2(ChatGPT 버전 4)를 사용하여 미국 정신의학 및 신경학 위원회(ABPN) 문제 은행의 질문들을 풀었습니다. 이 연구의 핵심 결과는 LLM 2가 85%라는 놀라운 적중률을 달성하여 인간 평균 적중률인 73.8%를 뛰어넘었다는 것입니다. 특히, 이러한 성능은 모델이 인터넷에 접속 하거나 신경학 분야에 특화된 튜닝을 거치지 않고 달성된 것입니다.
본 연구는 역학 분야 관찰 연구 보고 강화 지침(STROBE)을 포함한 엄격한 과학적 프로토콜을 준수했습니다. 인간 신경학 전공dent과의 비교는 기본적인 이해와 기억에 초점을 맞춘 하위 수준 질문과 적용, 분석 및 평가적 사고를 요구하는 상위 수준 질문으로 분류되는 다양한 질문을 포함했습니다.
인공지능이 의료 분야에 미치는 영향
특히 고차원적 질문에서 LLM 2의 우수한 성능은 인공지능의 빠른 발전과 임상 환경에서의 잠재적 응용 가능성을 보여줍니다. 이는 인공지능이 의학, 군사, 교육, 연구 등 전통적으로 인간의 전문 지식이 요구되는 영역으로 점차 진출하고 있는 상황에서 특히 중요합니다.
임상 신경학 분야에서 인공지능(AI)의 활용은 진단부터 치료 계획 및 예후 예측에 이르기까지 점차 확대되고 있습니다. 본 연구는 AI, 특히 ChatGPT와 같은 트랜스포머 기반 아키텍처가 이러한 분야에서 인간의 역할을 어떻게 지원하고 때로는 대체할 수 있는지를 보여줍니다.
인공지능과 인간 전문가의 균형 유지
이번 연구 결과는 고무적이지만, 의학처럼 민감한 분야에서 인공지능과 인간 전문가의 균형에 대한 논의를 촉발하기도 합니다. 연구 저자들은 인공지능이 심층적인 인지 능력을 요구하는 작업보다는 기억 기반 작업에서 강점을 보인다는 점을 강조하며, 이는 인공지능이 의료 전문가를 대체하기보다는 보완하는 역할을 해야 함을 시사합니다.
이번 연구 결과는 인공지능이 의료 행위와 교육 도구를 향상시키는 데 잠재력이 크다는 것을 입증하는 동시에, 인간의 전문성을 효과적으로 보완할 수 있도록 인공지능 시스템에 대한 지속적인 평가와 개선이 필요하다는 점도 강조합니다.
JAMA Network Open에 발표된 연구는 인공지능(AI) 역량, 특히 신경학 분야에서 상당한 도약을 보여줍니다. 연구 결과는 AI가 복잡한 분석 작업에서 뛰어난 능력을 발휘함을 입증하며, 의학 교육 및 진료에 새로운 가능성을 열어줍니다. 의학 분야에서 AI의 미래는 밝아 보이며, 이러한 기술은 인간 전문가와 함께 점점 더 중요한 역할을 수행할 것으로 예상됩니다.

