서울아산병원 소화기내과 변정식·융합의학과 김남국 교수팀은 대장내시경 영상을 분석해 용종의 병리진단을 예측하는 인공지능을 개발한 뒤 실제 영상 판독을 맡긴 결과, 평균 진단정확도가 81.8%로 내시경 전문의의 84.8%와 거의 비슷했다고 최근 밝혔다.
대장용종이 양성인지, 악성인지 등을 판별하는 방법은 우선 내시경 전문의가 용종 표면과 혈관을 눈으로 관찰하는 것이다. 내시경영상에서 판단이 어려우면 조직검사를 시행하게 되는데, 이때 용종을 잘라내야 해 출혈이나 불필요한 절제가 있을 수밖에 없다.
서울아산병원측 테스트 영상에 포함된 대장용종의 병리진단은 거치상 용종, 선종성 용종, 점막하층까지 깊게 침범한 암 등으로 다양했다. 그러나 첫 테스트 결과 인공지능은 전체 용종의 81.3%에서 병리진단을 정확히 분류해냈다. 거치상 용종은 82.1%, 선종성 용종은 84.1%의 확률로 판별했고 점막하층까지 깊게 침범한 암도 58.8%의 확률로 진단했다.
선종성 용종은 5~10년 후 대장암으로 진행하기 때문에 내시경으로 절제하는 게 원칙이지만, 작은 거치상 용종 일부는 내시경 절제술 없이 그냥 두어도 된다. 인공지능이 거치상 용종을 정확하게 진단해냈다는 것은 불필요하게 용종절제술을 하게 될 가능성을 낮췄다는 점을 의미한다.
두 번째 테스트에서도 진단정확도는 82.4%로 첫 테스트와 비슷한 결과를 보였다. 두 차례의 테스트 결과를 종합해볼 때 인공지능의 평균 진단정확도는 81.8%로 내시경전문의(84.8%)와 큰 차이를 보이지 않는 것으로 밝혀졌다.
아울러 내시경 시행경험이 6개월 이하인 수련의가 인공지능을 영상판독에 활용한 경우 평균 진단정확도가 83.4%(1차 테스트 82.7%, 2차 테스트 84.2%)로 나타났다. 이는 수련의가 단독으로 대장용종 병리진단을 추정할 때의 평균 진단정확도가 67.8%(1차 테스트 63.8%, 2차 테스트 71.8%)였던 것과 비교하면 상당히 향상된 수치다.
대장용종의 병리진단을 정확히 예측해야 용종을 내시경으로 절제할지, 수술로 제거할지, 아니면 내시경 절제 없이 그냥 둘지 등의 치료법을 결정할 수 있는데, 인공지능은 경험이 충분치 않은 내시경 수련의에게 이러한 판단을 보조하는 효과가 큰 것으로 나타났다.
변정식 서울아산병원 소화기내과 교수는 “이번 연구는 인공지능을 대장내시경 결과분석에 활용할 수 있다는 가능성을 제시한 것”이라며, “인공지능을 대장내시경 판독에 적용해 진단정확성을 높이면, 불필요한 조직검사를 줄이고 환자에게 용종의 병리진단에 맞춘 최적치료를 제공할 수 있을 것으로 기대한다”고 말했다.
김남국 서울아산병원 융합의학과 교수는 “소화기내시경분야에서 인공지능 알고리즘을 개발해 적용한 것을 시작으로, 앞으로 인공지능을 다양한 내시경분야에 확대적용하고 기술을 고도화해 임상의사를 실질적으로 도울 수 있도록 하겠다”고 밝혔다.
이번 연구결과는 세계적인 자연과학전문지 네이처(Nature)의 자매지인 ‘사이언티픽 리포트(Scientific Reports)’ 최근호에 게재됐다.