technology_ 국내의 유망 스타트업 기업인 루닛은 엑스레이 영상으로 결핵을 진단하는 프로그램을 개발했다. 딥러닝이라는 인공지능 기술은 97% 이상의 높은 정확도로 결핵을 진단할 수 있게 도와준다. 지치지도, 감정에 휘둘리지도 않는 컴퓨터는 인간 의사를 대체하게 될 것인가. 의료 진단 분야에서 컴퓨터의 가능성에 대해 분석해봤다.
지난 2일 오전 서울 강남구 역삼동 명우빌딩 7층에 있는 루닛의 사무실을 김양중 <한겨레> 의료전문기자와 함께 찾았다. 루닛은 의료영상을 판독하는 컴퓨터 인공지능 기술을 개발 중인 스타트업 기업이다. 최근 루닛은 엑스레이 영상을 바탕으로 결핵 여부를 판독하는 ‘딥러닝’ 기술을 개발해 소프트뱅크벤처스라는 투자업체로부터 20억원의 투자를 받는 등 가능성을 인정 받으며 관련 업계의 주목을 받고 있다.
의사인 김 기자와 함께 이곳을 찾은 이유는, 루닛의 영상판독 기술 수준을 직접 눈으로 확인해보고 싶었기 때문이다. 루닛 쪽에서는 가정의학과 전문의인 서범석 의료 담당 이사가 백승욱 대표와 함께 나와 시연을 벌였다.
루닛 인공지능의 정확도를 평가하기 위해 썼던 데이터인 미국 국립보건원(NIH)의 결핵 관련 영상 478장 중 무작위로 골라 컴퓨터에 입력해 결핵을 진단해보고, <한겨레>와 루닛의 의사가 평가하는 식으로 진행했다. 검증결과를 내놓기 위해 이미 한 차례 분석해본 영상이긴 하지만, 이날 새로 진행하는 분석작업에는 영향을 주지 않기 때문에 시연의 객관성은 확보할 수 있을 것이라 봤다.
미국 국립보건원의 영상에는 파일 이름을 통해 결핵 여부만 알 수 있을 뿐, 병변의 위치는 나타나 있지 않아 결핵 전문의가 표시한 병변의 위치를 참고했다. 컴퓨터는 영상을 본 뒤 결핵 가능성을 퍼센트로 알려주는 동시에 병변의 위치와 ‘히트맵’ 형태로 영상 위에 표시해준다. 히트맵은 심각할수록 빨간색, 심각하지 않으면 파란색으로 표시된다.
미국 국립보건원(NIH)가 공개한 결핵 영상(500번)에 인간 의사(왼쪽)와 인공지능이 병변의 위치를 표시했다. 인공지능은 딥러닝으로 병변의 위치를 파악해 히트맵 이미지로 표시했다. 출처 : NIH, 루닛
정확도 92.7%의 인공지능
일단 500번이란 번호가 붙은 영상을 컴퓨터에 입력해봤다. 루닛 프로그램의 프로세싱 바가 움직였다. 1~2초 정도 걸렸다. 컴퓨터는 ‘비정상 점수’(abnormality score)로 결핵 가능성을 표시한다. 이 영상의 비정상 점수는 100%였다. 영상 위에 병변의 위치도 표시됐다. 서 이사와 김 기자 두 의사 역시 병변의 위치를 쉽게 찾아냈다. 결핵 전문의가 표시한 병변 위치와도 일치했다. 서 이사가 설명했다. “영상에 이 정도까지 나타날 정도면 증상이 확실히 나타나고 있을 것 같아요. 열이 펄펄 나고 치료도 오래 받아야 하는 상태예요.”
이런 식으로 수차례 진행해보니 컴퓨터의 진단 결과는 500번 영상에서처럼 결핵 전문의의 진단 결과와 대부분 일치했다. 이런 일이 가능한 것은 이세돌을 꺾은 알파고에서 봤듯 인공신경망 기술의 진화한 한 형태인 ‘딥러닝’ 기술 덕이다. 컴퓨터는 입력된 이미지를 사람 눈에 보이지 않는 내부의 함수(은닉층)에 통과시켜 특징을 찾아내고, 그 과정을 반복해 일반화하는 작업을 벌이게 된다. 이 은닉층이 많으면 많을수록 ‘깊다’(딥·deep)고 표현한다. 루닛의 기술은 은닉층을 20~30층 쌓았다는 점에서 ‘딥러닝’이라 부른다. 루닛은 또 ‘약지도(weakly supervised) 학습’ 방식을 썼다. 학습할 때 영상마다 결핵인지 아닌지만 알려줬다는 점에서 ‘지도(supervised) 학습’의 측면이 있지만, 병변의 위치는 알려주지 않은 채 이상한 부분이 있으면 스스로 특징을 찾아 분류하는 ‘비지도(unsupervised) 학습’이 가미돼 ‘약지도’란 표현을 쓴다.
루닛은 이런 방식으로, 결핵협회가 제공한 1만장의 영상을 바탕으로 컴퓨터를 학습시켰고, 결핵 여부를 파악할 수 있는 미국 국립보건원 데이터로 검증했다. 검증 결과는 놀라웠다. 결핵 여부를 확인하는 능력을 산술적으로 따져보니 정확도가 92.7%에 달했다. 정확도를 평가하는 또 다른 중요한 통계인 곡선화면적(AUC)은 97.6% 수준으로 평가됐다.
백 대표는 “이 결과는 결핵 환자의 영상만으로 학습시킨 것이지만, 폐암과 폐렴 등 모든 폐 관련 질환에 대해서도 진단할 수 있도록 별도 연구도 진행 중이다. 또 유방암 선별 검사에 쓰는 유방 촬영술 영상에 대한 연구도 좋은 성과가 나오고 있다”고 말했다. 이와 관련해 루닛은 서울의 7개 대형병원과 공동연구를 진행 중이다.
컴퓨터는 영상판독과 같은 ‘숨은그림찾기’ 같은 분야에서는 인간보다 뛰어난 능력을 발휘할 가능성이 높다. 그런 점에서 김 기자는 “대략 30살 정도면 몸이 더 이상 성장하지 않을 텐데, 그러면 5년마다 같은 위치에서 사진을 찍고 컴퓨터에 입력하면, 달라진 부분을 찾는 일은 정말 잘할 것 같다”고 전망했다. 이에 대해 서 이사는 “그런 쪽으로도 개발을 진행하려고 한다. 특히 암 환자의 경우 병원에서 항암제 투여 이후의 반응을 영상으로 확인해 수치화해서 알 수 있다면 큰 도움이 될 수 있다”고 설명했다.
이날 <한겨레>가 지켜보는 가운데 이뤄진 시연에서 루닛의 컴퓨터는 수많은 영상들에 대해 전문의와 비슷한 결론을 내렸다.
환자 생명 살린 ‘왓슨’
하지만 328번 영상에 대해서는 달랐다. 결핵 전문의는 이 영상에 병변의 위치를 표시하지 않았다. 결핵이 아니라고 판정한 것이다. 서 이사 역시 병변을 찾아내지 못했다. 진단 실패다. 이 영상은 미국 국립보건원이 결핵 환자의 것이라고 제시한 것이다.
반면, 루닛의 컴퓨터는 이 영상을 본 뒤 결핵 가능성을 33.66%로 제시했다. 컴퓨터가 내놓은 영상에는 왼쪽(바라보는 사람 기준) 쇄골 위쪽에 약한 수준의 병변 표시가 나타나 있었다. 서 이사는 컴퓨터가 표시한 병변의 위치를 참고한 뒤 다시 영상을 꼼꼼히 살펴봤다.
“다시 보니 뼈(쇄골)가 이렇게 쭉 이어져 오는데, 다른 음영이 나타나는 걸 찾을 수 있네요. 뭔가 결절이 있는 것 같습니다. 구조상 뼈에 가려져 있어서 쉽게 놓칠 수 있는 병변이네요.”
인간은 실수를 한다. 2013년 발표된 논문 <외래환자 치료에서 나타나는 진단 에러 빈도>를 보면, 인간 의사의 진단 오류는 5.08%에 달했다. 이는 미국에서 매년 1200만명의 성인이 잘못된 진단을 받을 수 있다는 의미다.
인공지능 의사의 장점은 많다. 컴퓨터는 인간 의사들보다 훨씬 더 많은 정보를 받아들일 수 있다. 또 모든 결정에 근거가 있고, 인지편향과 같은 오류를 일으키지 않는다. 무엇보다 일관성이 있다. 술 먹고 뻗지도 않으며, 화가 나 있거나, 이혼을 한 것과 같은 최악의 상황에 직면할 일도 없다. 결코 감정에 휘둘리지 않는다. 인공지능 의사를 처음 만들 때 비용은 크겠지만, 일단 만들어 두고 진단을 하기 시작하면 복제를 위한 한계비용은 0에 가깝다. 세계 어디에서나 어느 시간이든 기꺼이 전화를 받을 수 있다는 점도 큰 장점이다. 컴퓨터 진단 의사는 곧 만나게 될 가능성이 높다. 2011년 미국의 티브이 퀴즈쇼 ‘제퍼디’(Jeopardy)에서 우승하며 화제를 일으켰던 아이비엠의 ‘왓슨’은 이미 미국의 유명한 암 치료기관인 엠디앤더슨 병원에서 암 진단과 치료법을 제시하고 있다. 왓슨의 진단 정확도는 96% 수준에 이르는 것으로 알려져 있다.
퀴즈쇼를 통해 인간의 말(자연어)을 그대로 이해하는 능력을 갖춘 왓슨은 이제 가설을 세워 검증하고 배우는 단계에 와 있다. 내과의가 증상과 이외의 연관 인자들을 입력하면 왓슨은 이 정보들 가운데 핵심 요소를 찾아내고 가족력에 관련 요인이 있는지 데이터를 찾아본다. 왓슨은 이렇게 모인 모든 정보와 병원에서 테스트한 결과를 조합해 가설을 확인하고, 진단을 내리게 된다.
이 방식으로 왓슨은 일본에서 한 환자의 생명을 구해내기도 했다고 <엔에이치케이>(NHK)가 지난 4일 보도하기도 했다. 일본 도쿄대 의과학연구소는 왓슨에게 논문을 학습하도록 한 뒤, 급성골수성백혈병으로 진단받은 60대 환자의 유전자 데이터를 분석하도록 했다. 엔에이치케이에 따르면, 10여분 동안의 분석을 마친 왓슨은 이 여성의 병이 ‘2차성 백혈병’이라는 또 다른 질환에 가깝다며 기존에 투여하던 항암제를 변경할 것을 제시했고, 목숨을 구할 수 있었다. 일본 인공지능학회장 야마다 세이지 국립정보학연구소 교수는 “인공지능이 사람의 목숨을 구한 것은 국내 첫 사례”라고 말했다.
인공지능이 인간을 뛰어넘지 못하더라도, 의사를 돕는 중요한 도구로 활용될 수 있을 것이란 점은 의심할 여지가 없는 것 같다. 마치 영화 <아이언맨>에서 주인공 과학자를 돕는 인공지능 컴퓨터 ‘자비스’처럼 말이다. 서 이사는 “영상 판독은 의사 혼자서 할 경우 실수가 생길 수 있어 ‘세컨드 리더’라 부르는 또 다른 의사와 함께 판독할 때 최고의 성과를 낼 수 있다. 루닛의 기술이 그런 일을 하길 기대하고 있다”고 말했다.
이날 루닛의 기술을 지켜본 김 기자는 “영상의학과 전문의가 위협을 받을 것 같다”고 말했다. 그는 “사실 동네의원에는 영상의학과 의사가 거의 없으니까, 이 기술을 활용하면 동네의원에서도 결핵에 대한 일차적인 체크는 가능할 것으로 보인다”고 설명했다.
인공지능 영상판독 기술이 발전할수록 1차 진단의 영역에서 영상의학 전문의의 역할은 축소될 수밖에 없다. 정확도를 높이기 위해 두 명의 영상의학 전문의가 해야 할 일을 컴퓨터와 함께 혼자서 하기만 해도 그만큼 인간 의사에 대한 수요는 줄어들게 된다. 의사 중에서도 가장 인기가 높은 영상의학 분야는 컴퓨터가 등장하면서 아이러니하게도 가장 손쉽게 대체될 가능성이 높은 직업군이 되었다.
<제2의 기계시대>의 공동 저자인 앤드루 맥아피 엠아이티 교수는 2014년 3월 미국의 아이티 전문매체인 <지디넷>과의 인터뷰에서 “아직은 아니지만, 인공지능이 곧 세계 최고의 진단의가 될 것이라 확신한다”고 밝혔다.
인공지능의 발전과 직업의 종말에 관한 책 <로봇의 부상>의 저자 마틴 포드도 2011년 미국의 신문사인 <워싱턴 포스트>에 기고한 칼럼에서 비슷한 취지의 의견을 내놨다. 그는 “의학전문대학원(메디컬스쿨)을 가지 않은 저임금 의료 전문직이 생겨서 일차적으로 환자에게 증상을 듣고, 컴퓨터 시스템에 입력하는 일을 하게 될 것”이라고 전망했다.
의사는 사라질 것인가
다만 ‘직업의 종말’에 이르기까지는 많은 시간이 흐르지 않고서는 불가능할 것으로 보인다. 일단 기술적 장벽을 넘어서야 하고, 그 이후에도 각종 법적·제도적·윤리적 문제를 모두 극복해야 한다. 사람들은 인간 의사의 실수보다도 컴퓨터의 실수에 대해 극히 민감하게 반응한다. 최근 테슬라의 자율주행차가 사망사고를 낸 데 대한 반응이 대표적인 사례다. 김 기자는 “만약 인공지능이 진단에 실패할 경우 우리 사회가 어느 수준으로 용인할 수 있을지가 중요한 고비가 될 것”이라고 말했다.
인공지능은 아직 완전하지 않다. 이날 루닛의 인공지능은 결핵협회 전문의가 ‘양성’으로 판정한 472번 영상에 대해 사실상 ‘음성’ 판정을 내렸다. 인공지능은 결핵 가능성을 3.1%로 표시했다. 물론 전체적인 정확도를 고려하면 이런 일은 확률상 나타나기 어려운 일이다. 하지만 이런 일은 분명 벌어질 수 있고, 사회적 압박에 직면할 수 있다.
앞서 인간 전문의가 실수한 328번 영상 역시, 거꾸로 보면 컴퓨터의 본질적인 한계를 보여주는 사례이기도 하다. 30%대 초반의 확률로 진단을 내린 이 결과를 어떻게 해석할 것인가. 전문지식을 가진 의사가 해석을 내리고, 다음 단계에 무엇을 해야 할지에 대한 가이드를 제시하지 않으면 안 된다.
오히려 가까운 미래에는 직업의 종말보다는 격차 문제가 더 중요한 쟁점으로 떠오를 수도 있다. 유신 카이스트 교수(전산학)는 “(루닛과 같은 영상판독 컴퓨터) 기술을 쓸 수 있는 병원(의사)과 그렇지 못한 병원 간의 격차 문제가 생길 수도 있을 것”이라고 말했다.
2일 오전 서울시 강남구 역삼로 명우빌딩 7층에서 김양중 <한겨레> 의료전문기자(왼쪽부터)와 서범석 루닛 의료담당 이사, 백승욱 루닛 대표가 루닛의 인공지능 프로그램이 엑스레이 영상을 바탕으로 결핵 여부를 제대로 진단하는지 시연을 벌였다. 김봉규 선임기자 bong9@hani.co.kr
당장은 컴퓨터를 어떻게 활용하느냐에 따라 순기능이 더 커 보이는 측면도 있다. 김희진 결핵협회 결핵연구원 원장은 루닛 프로그램의 긍정적 측면에 대해 이렇게 설명했다.
“결핵 검진사업을 한다고 할 때 검진버스 안에서 엑스레이를 찍는 순간 의심 환자가 분류되고, 곧바로 객담(가래)을 받는 시스템을 만든다고 생각해 보세요. 지금은 검진버스에서 엑스레이를 찍고, 시간을 기다려 판독 결과가 나오면 의심환자를 불러 객담을 수집하게 되는데 그런 불편함이 사라지게 되겠지요.”
아울러 컴퓨터는 의료진이 거의 없는 저개발국에서도 손쉽게 진단을 내리는 중요한 도구로 활용될 수 있다.
음성원 기자
esw@hani.co.kr, 인포그래픽 박향미 기자
phm8302@hani.co.kr