딥러닝으로 질병 돌연변이 예측

인체 단백질의 금속 결합 부위 공간 특성 활용

2019.12.31 10:47 김병희 객원기자

최근 수년 동안 인간 행동을 모방한 기계의 인공지능(artificial intelligence, AI)은 약물 개발 프로젝트와 같은 첨단 기술의 핵심 요소로 등장했다.

인공지능 도구는 과학자들이 최적화된 계산 알고리즘을 사용해 생물학 빅데이터의 비밀을 밝히는 데 도움을 주고 있다.

심층 신경망(deep neural network)과 같은 인공지능 방법을 통해 생물학 및 화학적 응용분야에서의 의사 결정을 향상시킬 수 있게 된 것이다.

예를 들면 질병 관련 단백질을 예측하거나, 새로운 생체표지자(biomarkers)의 발견 및 소분자 약물 개발을 위한 새로운 디자인 등이 그것이다. 이런 최첨단 접근법은 가능성 있는 약물을 더욱 효율적이고 경제적으로 개발하는 데 도움을 준다.

홍콩대(HKU) 화학과 홍체 순(Hongzhe Sun) 교수팀은 미국 애리조나 소재 메이요 클리닉의 준웬 왕(Junwen Wang) 교수와 협력해, 인체 내 단백질의 금속 결합 부위에서의 질병 관련 돌연변이를 예측할 수 있는 강력한 딥러닝(deep learning) 접근법을 구현하는데 성공했다.

이는 인체 금속 함유 단백질(metalloproteins)에서 질병과 연계된 금속 관련 부위 돌연변이를 예측할 수 있는 최초의 딥 러닝 접근법이다. 따라서 이를 활용하면 인체 질병을 치료할 수 있는 새로운 플랫폼을 확보할 수 있을 것으로 보고 있다.

이 연구는 ‘네이처 머신 인텔리전스’(Nature Machine Intelligence) 9일 자에 발표됐다. 논문명은 ‘Predicting disease-associated mutation of metal-binding sites in proteins using a deep learning approach’ 이다.

인공지능과 딥러닝을 인체 질병 진단과 치료에 활용하는 시대가 다가오고 있다. 이번 연구팀은 인체 단백질의 금속 결합 부위를 분석해 돌연변이를 예측하는 방법을 개발했다.  Credit: Pixabay / Tayeb MEZAHDIA

딥러닝을 인체 질병 진단과 치료에 활용하는 시대가 다가오고 있다. 이번 연구에서는 인체 단백질의 금속 결합 부위를 분석해 돌연변이를 예측하는 방법이 개발됐다. ⓒ Pixabay / Tayeb MEZAHDIA

금속 이온, 인체 생리에서 중요 역할

금속 이온은 인체 생물학 시스템의 (병리)생리 현상에서 구조적으로나 기능적으로 중추적인 역할을 담당한다.

아연이나 철, 구리와 같은 금속은 모든 생명체에 필수적이며, 세포 내 농도는 엄격하게 조절된다. 생리학적 금속 이온이 부족하거나 과잉되면 인체에 치명적인 질병을 일으킬 수 있기 때문이다.

인간 유전체에서의 돌연변이는 여러 상이한 질병들과 강력하게 연계돼 있음이 밝혀졌다. 만약 돌연변이가 DNA의 코딩 영역에서 발생하면, 단백질의 금속-결합 부위에 문제를 일으켜 결과적으로 인체에 심각한 질병을 촉발시킬 수 있다.

이런 맥락에서 단백질 금속-결합 부위에서의 질병 관련 돌연변이에 대한 이해는 새로운 약물 발견을 한층 용이하게 할 것으로 보고 있다.

딥러닝 모델을 훈련시키기 위한 데이터 수집과 특성 추출 작업 흐름도.  @The University of Hong Kong

딥러닝 모델을 훈련시키기 위한 데이터 수집과 특성 추출 작업 흐름도.ⓒ The University of Hong Kong

금속마다 다른 질병과 연계돼

연구팀은 먼저 다른 데이터베이스들로부터 오믹스(omics) 자료를 통합해 종합적인 교육 데이터세트를 구축했다. 오믹스란 유전체학, 단백질체학, 대사체학 등과 같이 총괄 개념의 데이터세트를 바탕으로 하는 생물학 분야를 말한다.

연구팀은 수집된 데이터의 통계치를 살펴보고 금속마다 다른 질병 연관성이 있다는 사실을 발견했다.

아연 결합 부위의 돌연변이는 유방과 간, 신장, 면역계 및 전립선 질환에서 주요한 역할을 하는 것으로 나타났다. 이와 대조적으로 칼슘과 마그네슘 결합 부위의 돌연변이는 각각 근육과 면역계의 질환과 관련이 있었다.

철 결합 부위의 돌연변이는 대사 질환과 더 많은 관련이 있고, 망간과 구리 결합 부위의 돌연변이는 각각 심혈관 질환 및 신경계 질환과 관련돼 있었다.

연구팀은 에너지 기반의 친화성 격자 지도를 사용해 금속 결합 부위로부터 공간적 특성을 추출할 수 있는 새로운 접근법을 시도했다. 이런 공간적 특성은 물리화학적 순차 특성과 병합돼 모델을 훈련시켰다.

모델에 대한 딥러닝을 실시한 뒤 최종 분석 결과, 공간 특성 활용으로 예측력이 ‘곡선 아래 면적(AUC)’ 0.9에 정확도(accuracy) 0.82로 높게 나타난 것으로 확인됐다.

딥러닝에서 추상화한 다중 계층에 대한 이미지 표현. Credit: Wikimedia / Sven Behnke

딥러닝에서 추상화한 다중 계층에 대한 이미지 표현. ⓒ Wikimedia / Sven Behnke

“딥러닝 인공지능 접근법으로 질병 퇴치에 기여할 것”

금속체학(metallomics)과 금속 함유 단백질 분야에서의 고급 기술과 플랫폼이 제한된 상황에서, 이번에 연구팀이 제안한 딥러닝 접근법은 실험 자료와 생물학정보 분석을 통합하는 방법을 새롭게 제시했다.

이 접근법은 암과 심혈관질환 및 유전질환 같은 질병 관련 돌연변이를 예측하는 데 도움이 될 것으로 보고 있다.

순 교수는 “머신 러닝과 인공지능은 오늘날 생물학과 화학에서도 중요한 역할을 하고 있다”고 말하고, “우리는 금속체학과 금속 단백질을 포함한 통합 오믹스 접근법을 사용해 생물학과 의학에서의 금속에 대해 연구해 왔으며, 생체 안팎의 실험을 통해 이미 막대한 양의 귀중한 데이터를 생성했다”고 밝혔다.

그는 “이제 이런 데이터들을 가치 있는 지식으로 전환하기 위해 딥 러닝을 기반으로 한 인공지능 접근법을 개발해 질병의 비밀을 밝혀내고 이를 퇴치하기 위해 노력하겠다”고 덧붙였다.

순 교수는 이번의 새로운 딥 러닝 접근법을 실험실에서 진행하고 있는 다른 프로젝트에도 적용할 계획이다.

(21884)

뉴스레터 구독신청
태그(Tag)

전체 댓글 (0)

과학백과사전