“앞으로 인공지능(AI) 의사가 등장할 것이다. 인간 의사들이 직업을 잃을지도 모른다.”
전문직의 상징처럼 불리던 의료인들조차 ‘구조조정’ 걱정을 하게 만든 기술이 있다. 검사 결과를 보고 의사처럼 진단을 내릴 수 있는 컴퓨터 프로그램, 이른바 ‘AI 의사’의 등장하면서부터다.
AI 의료 서비스를 바라보는 사람들의 시각은 크게 두 부류다. 첫째는 “결국 의사들은 직업을 잃을 것”이라고 걱정하는 부류. 둘째는 “첨단 기술을 도입해 의료의 질을 높일 수 있다면 모두에게 좋은 일”이라며 미래를 희망차게 바라보는 경우다. AI 의료는 과연 얼마나 큰 의미가 있을까.
대표적 AI 의사 ‘닥터 왓슨’이 갖는 의미
국내에 AI 의료 서비스로 가장 잘 알려진 건 미국 IBM이 개발한 ‘닥터 왓슨’이다. IBM은 자체 개발한 AI 기술을 이용해 대용량의 지식 정보를 자동으로 구조화하고 사람과 자연어로 소통하는 ‘인지 컴퓨팅’ 영역에 특화된 추론형 AI를 개발하고 ‘왓슨’이라고 이름 지었다. 2010년엔 왓슨을 이용해 유명 퀴즈게임 ‘제퍼디 쇼’에 도전, 인간 챔피언을 누르고 우승해 화제가 된 바 있다. 이후 IBM은 이 프로그램을 의료용으로 개발해 선보인 것이 ‘닥터 왓슨’이다. 주로 암 진단 등에 사용된다. 이 밖에 IBM은 왓슨이라는 이름으로 의료뿐 아니라 회계, 엔지니어 등 다양한 산업 분야에서 전문가를 보조하는 여러 종류의 AI를 잇달아 내놓고 있다.

왓슨은 국내는 물론 세계적으로 ‘의료에 AI를 쓸 수 있다’는 가능성을 열었다는 점에서 큰 의미가 있다. 실제로 왓슨은 도입 후 국내에선 큰 인기를 끌었다. 2016년 12월 가천의대 길병원이 최초로 도입한 이후, 2017년 부산대병원이 두 번째로 도입했다. 이후 건양대병원, 대구가톨릭대병원, 계명대동산병원, 조선대병원, 화순전남대병원 등이 차례로 왓슨 서비스를 시작했다.
AI 의사라고 하나 컴퓨터에게 진단을 받는다고 생각할 것 같지만 사실 사용법은 전혀 다른데, 주치의가 1차로 환자를 살펴보고, 필요하다고 생각하는 검사를 진행한다. 그리고 검사 결과를 입력하면 왓슨이 ‘어떤 병인 것 같고, 치료법은 이러한 것들이 있다’고 알려주는 식이다. 왓슨을 사용하려면 IBM으로부터 왓슨 소프트웨어를 빌려 자체 서버에 설치해야 한다. 그리고 보유하고 있는 의료 정보를 분석하는 식으로 운영한다.
신뢰성 생각보다 낮아… 의료계서 다양한 반응
공교롭게도 이런 왓슨의 인기가 최근 시들하다. 국내에서 왓슨을 마지막으로 도입한 건 2018년 중앙보훈병원. 그 이후 2년이 지나도록 왓슨을 새로 도입한 병원은 없다. 심지어 왓슨을 만든 IBM에서도 왓슨 서비스에 회의적이라는 지적이 나왔다. 국내 환자 실정에 잘 맞지 않는다는 지적도 많았다.
초창기 IBM은 미국의 암 전문 병원 ’메모리얼 슬로언 케터링 암센터‘에서 왓슨과 의료진의 의견 일치율이 대장암 98%, 직장암 96%, 방광암 91%, 난소암 95%, 자궁경부암 100%를 기록했다고 소개했다. 하지만 국내에서도 이런 실적을 보였던 건 아니다. 길병원은 2017년 왓슨 도입 후 의견 일치율을 발표한 바 있는데, ‘강력 추천’ 분야 의견 일치율은 55.9%. 이를 여러 개의 치료방침을 보여주는 ‘추천’으로 확대하면 대장암(결장암) 환자의 의료진과 왓슨의 의견 일치율은 78.8%였다. 이런 결과에 일정 부분 만족한다는 의견이 있었지만 IBM이 강조한 98%와는 큰 차이다. 더구나 4기 위암의 경우는 의견 일치율은 40%에 그쳤다.
상황이 이렇다 보니 왓슨 서비스를 포기하는 병원도 나왔다. 부산대병원은 2년 만에 왓슨 사용을 중단했으며 1년만 시범적으로 사용키로 했던 계명대 동산병원도 왓슨 재계약을 포기했다.
다만 아직도 왓슨은 종합적인 판단 면에서 도움이 된다고 보는 경우가 많다. 환자의 질병을 여러 전공 분야 의사들이 모여 판단하고, 치료방침을 결정할 필요가 있는데, 이 과정에서 다양한 분야 지식을 한꺼번에 검색해 주기 때문에 상당히 유용하다는 것이다. 건양대병원이나 대구가톨릭병원 등이 이러한 형태로 왓슨을 사용하고 있다.

가천의과학대 길병원은 왓슨을 ‘한국화’ 하는 연구에 나서고 있다. 가능성이 큰 만큼 적극적으로 데이터를 확보해 왓슨의 성능을 더 높이기 위해 노력할 계획이다. 길병원은 2019년 8월 IBM 왓슨 헬스와 협력을 강화하기로 하고 국내 현실에 맞도록 기능을 추가하고 확장하는 작업을 꾸준히 추진할 계획이다.
주목해야 할 부분은 새로운 의료용 AI 서비스들이 급속도로 퍼지고 있다는 점. AI 기술을 자사의 의료 서비스에 포함하고 있는 업체들이 급속도로 늘고 있다. 이에 따라 ‘성능을 한층 더 높이고 국내 실정에 맞는 차세대 왓슨’을 개발하려는 시도도 늘고 있다.
현재 해외 대기업 중 의료용 AI를 개발하는 곳은 마이크로소프트, 올림푸스, 지멘스 등이 유명하다. 국내에서는 과학기술정보통신부가 주도하고 국내 대형병원 25곳이 참여해 한국형 의료 AI '닥터 앤서(Dr. Answer)’를 개발 중이다. 이중 어떤 서비스가 왓슨을 넘어서는 차세대 의료 AI로 자리매김할지, 아니면 왓슨 서비스가 약점을 극복하고 다음 세대 서비스로 다시금 부상할지는 시간이 흘러야 할 수 있다.
“AI 의료 ‘춘추전국 시대’ 도래할 것”
이 밖에 비교적 규모가 작은 ‘스타트업’ 업체들은 왓슨처럼 대량의 논문을 학습해 대부분의 의료현장에 대응하기보다 ‘꼭 필요한 부분’만 AI를 활용해 도리어 신뢰성을 높이는 경우도 눈에 들어온다.
국내 한 의료분야 스타트업은 최근 안과 검진 전용 AI 소프트웨어를 개발했는데, 안과의 경우 눈동자의 사진을 찍어 의사가 눈으로 상태를 보며 검진하는 경우가 많은데, 이 과정만 AI로 대체한 ‘AI 안구 검진기’를 개발했다. 다양한 망막질환을 사진 몇 장으로 알 수 있다.
혈액검사 결과를 빠르게 분석해 주는 AI 서비스를 개발하고 있는 업체도 있다. 혈액검사는 의료진이 각종 수치를 살펴보고 암 발생 여부 등 다양한 질병을 예측할 수 있는데, 이 분석 과정을 AI로 대체하겠다는 것. 이 회사는 5년간 총 32억 원의 정부 연구비도 지원받는다.
병리 의사들의 영역이던 ‘조직 검사’를 대체하는 기술도 등장하고 있다. 서울대병원 연구진은 건강검진을 시행한 대장 내시경에서 발견된 폴립 2150개의 이미지를 토대로 AI와 접목한 연구 결과를 15일 발표하기도 했다. 대장에서 폴립이 발견된 경우 암의 유무 등을 확인하기 위해 병리 검사가 필요할 수가 있는데, 이를 AI 시스템으로 대체할 수 있는 기술이다. 정확도는 86.7% 정도로 아직 의료진을 대체하긴 어렵지만, 관련 기술을 높여나가면 충분한 가능성이 생긴다.
AI의 화상 분석 기술을 이용해 영상의학과 진단 기술을 확보하려는 노력도 자주 볼 수 있다. 미국 스탠퍼드대 연구진은 2019년 9월 두뇌의 컴퓨터단층촬영(CT) 영상과 자기공명영상(MRI)을 분석, 뇌혈관 벽에 미세한 균열이 생기고 비정상적으로 부풀어 오르는 ‘뇌동맥류’를 조기에 검진할 수 있는 기술을 개발한 바 있다. 스탠퍼드대 연구진은 2018년 11월 흉부 X선 촬영 영상을 판독해 십수 개의 질환을 알아낼 수 있는 인공지능 알고리즘 ‘CheXNeXt’을 개발해 공개한 적도 있다.
국내에서도 비슷한 연구를 시행 중이다. 15일 삼성서울병원 연구진은 MRI 영상을 분석해 어지럼증을 일으키는 대표적인 질환 중 하나인 ‘메니에르병’을 인공지능(AI)으로 진단할 수 있는 AI 모델을 만들었다고 밝히기도 했다. 국내 대기업 중에는 SK C&C가 자체 개발한 ‘뇌출혈 영상 판독 AI 모델’의 의료기기 제조와 품질 관리 기준(GMP) 적합 인증을 획득했다고 18일 밝히기도 했다.
당장은 의사 반드시 필요, 진단 돕는 ‘도구’로서 가치
다가올 미래의 ‘AI 명의’는 수없이 많은 인간 의사들의 노력과 치료 경험에 의해서만 태어날 수 있다. AI는 데이터의 양과 특성에 따라 정확도가 결정된다. 더 정확하고 효과적인 결과를 얻어내기 위해서는 자료를 수집하는 과정에서 인간의 손을 거쳐야 하고, 데이터를 분석하는 과정에서는 인간의 눈이 필요하기 때문이다.
치료 과정에서 결국 환자는 의사와 간호사의 도움을 받아야만 치료를 받을 수 있다. 의사는 AI에게 추천받은 정보를 바탕으로 치료방침을 최종적으로 결정한다. AI 때문에 의사가 직업을 잃을 가능성은 아직 그리 크지 않은 셈이다. AI는 기계학습을 통해 스스로 논리를 구성하고 거기에 따라 답을 내는데, 이 중간 과정을 인간이 전혀 알지 못하기 때문에 오류가 일어날 가능성은 언제든 있기 때문이다.
국내 한 의료인은 “왓슨의 경우를 보아도 몇 가지 정도 치료방침을 추천해 주고, 그중 적합한 것을 선택해 사용하는 식”이라며 “엉뚱한 답을 하는 경우가 종종 있으므로 AI 권고만을 믿고 치료를 해선 안 된다”고 설명했다.
- 전승민 과학기술전문저술가
- enhanced75@gmail.com
- 저작권자 2020-06-19 ⓒ ScienceTimes
관련기사