AI로 암과 치매의 비밀을 푼다

머신러닝 이용해 질병의 생물학적 언어 예측

넷플릭스, 아마존, 페이스북 등이 사용하는 인공지능(AI) 기술로 암이나 알츠하이머병과 같은 신경퇴행성 질환의 생물학적 언어를 예측할 수 있다는 연구 결과가 발표됐다.

영국 케임브리지대학 세인트존스칼리지의 연구진이 발표한 이 획기적인 연구 결과는 앞으로 병을 일으키는 세포 내부의 문법적 오류를 바로잡는데 사용될 수 있다는 점에서 주목을 끌고 있다.

넷플릭스나 페이스북은 강력한 머신러닝 알고리즘을 사용해 다음에 시청할 드라마를 추천하거나 누군가에게 친구가 될 것을 제안한다. 또한 아마존의 알렉사 같은 AI 기반 음성서비스는 개별적인 사람을 인식해 대화할 수 있다.

인공지능(AI) 기술로 암이나 알츠하이머병과 같은 신경퇴행성 질환의 생물학적 언어를 예측할 수 있다는 연구 결과가 발표됐다. 사진은 살아있는 세포 안에서 단백질이 응축되는 모습이다. ©Weitz lab, Harvard University

세인트존스칼리지의 카디 리이스 사어(Kadi Liis Saar) 박사는 체내의 단백질에 이상이 생겨 질병이 발생할 때 어떤 일이 일어나는지 살펴보기 위해 알렉사 등과 비슷한 머신러닝 기술을 사용해 대규모 언어 모델을 훈련시켰다. 즉, 수십 년간 연구하면서 생산된 빅데이터를 컴퓨터 언어 모델에 주입한 것이다.

인체에는 정상적인 신진대사를 유지하기 위해 중요한 역할을 하는 수천 가지 종류의 단백질들이 있다. 하지만 그들의 활동도 때로는 끔찍한 잘못을 저지를 수 있다. 예를 들면 알츠하이머병의 경우 단백질이 항로를 이탈해 건강한 신경세포를 죽이기 시작하면서 응집체로 알려진 고체 덩어리로 뭉쳐져 뇌에 심각한 손상을 입힌다.

단백질이 응축물 형성하는 방법 학습해

최근에 과학자들은 단백질이 응집체 외에도 응축물이라고 알려진 거의 액체 상태의 단백질 액적을 형성할 수 있다는 사실을 발견했다. 이 단백질 액적은 강한 막을 가지고 있지 않아 다른 웅축물들과 자유롭게 합쳐질 수 있다.

이에 따라 연구진은 세포에서 발견되는 이러한 형태의 변환 응축물에 대해 컴퓨터 프로그램이 배우도록 요청했다. 즉, 수많은 종류의 단백질에 대해 이용할 수 있는 모든 데이터를 알고리즘에 주입해 컴퓨터가 그것들이 어떻게 행동하는지를 배우고 예측할 수 있게 한 것이다.

그 결과 컴퓨터 알고리즘은 직접 설명을 듣지 않고도 세포 안에서 어떤 단백질이 응축물을 형성하는지 알아내는 방법을 배울 수 있었다. 이 연구 결과는 미국국립과학원회보(PNAS) 최신호에 게재됐다.

케임브리지대학 세인트존스칼리지의 투오마스 놀스(Tuomas Knowles) 교수. ©Nathan Pitt(University of Cambridge)

이번 연구를 주도한 세인트존스칼리지의 투오마스 놀스(Tuomas Knowles) 교수는 “암과 신경퇴행성 질환의 연구에 머신러닝 기술을 도입하면 게임 체인저가 될 수 있다”라며 “우리의 궁극적인 목표는 인공지능으로 표적형 약물을 개발해 증상을 획기적으로 완화시키거나 치매 발생을 완전히 예방하는 것이다”라고 말했다.

알츠하이머병은 전 세계 5,000만명의 사람들에게 영향을 미치는 대표적인 치매 질환이며, 파킨슨병이나 헌팅턴병과 같은 다른 신경퇴행성 질환도 수백만명에게 영향을 미친다. 그런데 세계보건기구(WHO)에 의하면 전 세계 치매 인구는 2013년 4,400만명에서 2030년에는 7,600만명, 2050년에는 1억3,500만명으로 증가할 것으로 보인다.

알츠하이머병만 해도 치료제가 없을뿐더러 여전히 불확실한 것이 많기 때문이다. 치매 원인이 무엇인지, 플라크와 같은 치매 병변이 생기는 이유는 무엇인지 등등 많은 것이 베일에 가려 있다.

인간의 한계 벗어난 새로운 치료법 기대

놀스 교수는 “단백질 응축물은 우리의 DNA가 단백질로 변환되는 유전자 발현이나 단백질 합성과 같은 세포의 주요 사건을 통제하기 때문에 최근 과학계에서 많은 관심을 받고 있다”라고 말했다.

단백질 액적과 연관된 어떠한 결함도 암과 같은 질병으로 이어질 수 있다. 질병을 일으키는 세포 내부의 문법적 오류를 바로잡을 수 있으려면 단백질 오작동의 분자 기원에 대한 연구에 자연어 처리 기술을 도입하는 것이 중요하다고 연구진은 주장했다.

실제로 연구진은 빅데이터를 학습한 머신러닝 알고리즘을 이용해 일부 단백질이 세포 내부에서 응축물을 형성하도록 유도하는 구체적인 문법에 대해 질문할 수 있었다. 그것을 풀 수 있으면 우리가 질병 언어의 규칙을 배우는 데 도움이 될 수 있기 때문이다.

현재 머신러닝 기술은 데이터 가용성의 증가, 컴퓨팅 성능 향상, 그리고 보다 강력한 알고리즘을 만드는 기술적 진보로 인해 빠른 속도로 발전하고 있다. 따라서 머신러닝 기술의 사용은 미래의 암과 신경퇴행성 질환 연구를 변화시킬 수 있다.

머신러닝 기술이 인간의 뇌가 이해할 수 있는 것보다 이 질병에 대해 훨씬 더 잘 이해할 수 있다는 사실이 전혀 이상하지 않은 셈이다.

이번 연구의 제1저자로 참여한 사어 박사는 “머신러닝은 과학자들이 탐구의 대상으로 생각하는 한계에서 벗어날 수 있으며, 이는 우리가 아직 생각조차 하지 못한 새로운 연결고리를 AI가 발견할 수 있음을 의미한다”고 말했다.

(2038)

뉴스레터 구독신청
태그(Tag)

전체 댓글 (0)

과학백과사전