워싱턴 주립대학교 엘슨 S. 플로이드 의과대학의 최근 연구는 응급 의료 상황에서 AI 에 발표된 연구에서 저자들은 OpenAI의 ChatGPT 프로그램을 이용하여 흉통을 호소하는 모의 환자의 심장 질환 위험도를 판단하는 능력을 탐구했습니다.
결론이 일관되지 않음
연구 결과는 동일한 환자 데이터를 입력하더라도 ChatGPT의 결론에matic 수준의 변동성이 있음을 보여줍니다. 수석 연구원인 토마스 헤스턴 박사에 따르면, ChatGPT는 일관성 있게 작동하지 않습니다. 동일한 데이터를 제시했을 때, ChatGPT는 처음에는 낮은 위험도를, 다음번에는 중간 위험도를, 심지어는 높은 위험도를 나타내는 경우도 있었습니다.
이러한 격차는 생명을 위협하는 위급한 상황에서 매우 심각한데, 이러한 경우 의료진이 정확하고 적절한 조치를 취하기 위해서는 필수적이고 객관적인 평가가 매우 중요하기 때문입니다. 환자는 다양한 질환으로 인해 흉통을 경험할 수 있습니다. 따라서 의사는 환자를 신속하게 진찰하고 적절한 치료를 제공하기 위해 시의적절한 조치를 취해야 합니다.
이 연구는 또한 ChatGPT의 성능이 의사들이 환자의 심장 질환 위험을 평가하는 데 사용하는 기존 방법과 비교했을 때 미흡하다는 것을 밝혀냈습니다. 현재 의사들은 TIMI 및 HEART 프로토콜이라는 심장 질환 정도를 나타내는 지표를 사용하여 환자를 평가하는데, 이때 양면 체크리스트 방식을 사용합니다.
그러나 TIMI 및 HEART 척도에 표시된 변수와 같은 변수를 입력으로 제공했을 때 ChatGPT의 점수와 불일치가 더 크게 나타났으며, 일치율은 각각 45%와 48%에 불과했습니다. 이러한 다양성이 고위험 의료 사례에서 AI의 의사 결정에도 나타난다고 가정해 봅시다. 그렇다면 이러한 위험도가 높은 상황에서는 일관되고 정확한 결정이 필수적이므로 AI의 신뢰성에 의문이 제기될 수밖에 없습니다.
의료 분야에서 인공지능의 한계와 잠재력에 대하여
헤스턴 박사는 AI가 의료 지원을 강화할 수 있는 잠재력을 지적하면서도, AI에 내재된 defi을 배제하기 위한 철저한 연구의 필요성을 강조했습니다. AI는 필수적인 도구일 수 있지만, 우리가 이해하는 속도보다 훨씬 빠르게 변화하고 있습니다. 따라서 특히 흔히 접하는 임상 상황에서 많은 연구가 필요합니다.
연구 결과는 인공지능 기술이 여러 장점을 보여주었음에도 불구하고 이러한 상황에서 인간 간호사의 중요성이 여전히 입증되었음을 분명히 보여줍니다. 예를dent응급 상황에서 디지털 의료 전문가가 환자의 전체 의료 기록을 검토하여 시스템의 기능을 활용해 가장 효율적인 관련 정보만을 제공할 수 있습니다. 또한 인공지능은 감별 진단을 내리고 의사와 함께 어려운 사례에 대해 고민하는 데 참여할 수 있습니다. 이는 의사가 진단 과정을 더욱 효율적으로 진행하는 데 도움이 될 것입니다.
하지만 헤스턴 박사에 따르면 여전히 몇 가지 문제점이 남아 있습니다.
"잘 모르는 질환의 감별 진단을 내리는 데 정말 큰 도움이 될 수 있고, 아마도 그것이 이 도구의 가장 큰 장점 중 하나일 겁니다. 예를 들어, 가장 흔한 다섯 가지 진단과 각각의 근거를 물어볼 수 있죠. 문제를 해결하는 데 도움을 주는 데는 아주 유용하지만, 명확한 답을 제시해 줄 수는 없습니다."
인공지능이 끊임없이 발전하는 시대에, 특히 의료와 같은 고위험 상황에서 환자의 안전을 확보하고 의료 의사결정을 최적화하기 위해서는 인공지능의 성능을 심층적으로 평가하는 것이 매우 중요합니다.

