넷플릭스, 아마존, 페이스북 등이 사용하는 인공지능(AI) 기술로 암이나 알츠하이머병과 같은 신경퇴행성 질환의 생물학적 언어를 예측할 수 있다는 연구 결과가 발표됐다.
영국 케임브리지대학 세인트존스칼리지의 연구진이 발표한 이 획기적인 연구 결과는 앞으로 병을 일으키는 세포 내부의 문법적 오류를 바로잡는데 사용될 수 있다는 점에서 주목을 끌고 있다.
넷플릭스나 페이스북은 강력한 머신러닝 알고리즘을 사용해 다음에 시청할 드라마를 추천하거나 누군가에게 친구가 될 것을 제안한다. 또한 아마존의 알렉사 같은 AI 기반 음성서비스는 개별적인 사람을 인식해 대화할 수 있다.
인공지능(AI) 기술로 암이나 알츠하이머병과 같은 신경퇴행성 질환의 생물학적 언어를 예측할 수 있다는 연구 결과가 발표됐다. 사진은 살아있는 세포 안에서 단백질이 응축되는 모습이다. ©Weitz lab, Harvard University
세인트존스칼리지의 카디 리이스 사어(Kadi Liis Saar) 박사는 체내의 단백질에 이상이 생겨 질병이 발생할 때 어떤 일이 일어나는지 살펴보기 위해 알렉사 등과 비슷한 머신러닝 기술을 사용해 대규모 언어 모델을 훈련시켰다. 즉, 수십 년간 연구하면서 생산된 빅데이터를 컴퓨터 언어 모델에 주입한 것이다.
인체에는 정상적인 신진대사를 유지하기 위해 중요한 역할을 하는 수천 가지 종류의 단백질들이 있다. 하지만 그들의 활동도 때로는 끔찍한 잘못을 저지를 수 있다. 예를 들면 알츠하이머병의 경우 단백질이 항로를 이탈해 건강한 신경세포를 죽이기 시작하면서 응집체로 알려진 고체 덩어리로 뭉쳐져 뇌에 심각한 손상을 입힌다.
단백질이 응축물 형성하는 방법 학습해
최근에 과학자들은 단백질이 응집체 외에도 응축물이라고 알려진 거의 액체 상태의 단백질 액적을 형성할 수 있다는 사실을 발견했다. 이 단백질 액적은 강한 막을 가지고 있지 않아 다른 웅축물들과 자유롭게 합쳐질 수 있다.
이에 따라 연구진은 세포에서 발견되는 이러한 형태의 변환 응축물에 대해 컴퓨터 프로그램이 배우도록 요청했다. 즉, 수많은 종류의 단백질에 대해 이용할 수 있는 모든 데이터를 알고리즘에 주입해 컴퓨터가 그것들이 어떻게 행동하는지를 배우고 예측할 수 있게 한 것이다.
그 결과 컴퓨터 알고리즘은 직접 설명을 듣지 않고도 세포 안에서 어떤 단백질이 응축물을 형성하는지 알아내는 방법을 배울 수 있었다. 이 연구 결과는 미국국립과학원회보(PNAS) 최신호에 게재됐다.
케임브리지대학 세인트존스칼리지의 투오마스 놀스(Tuomas Knowles) 교수. ©Nathan Pitt(University of Cambridge)
이번 연구를 주도한 세인트존스칼리지의 투오마스 놀스(Tuomas Knowles) 교수는 “암과 신경퇴행성 질환의 연구에 머신러닝 기술을 도입하면 게임 체인저가 될 수 있다”라며 “우리의 궁극적인 목표는 인공지능으로 표적형 약물을 개발해 증상을 획기적으로 완화시키거나 치매 발생을 완전히 예방하는 것이다”라고 말했다.
알츠하이머병은 전 세계 5,000만명의 사람들에게 영향을 미치는 대표적인 치매 질환이며, 파킨슨병이나 헌팅턴병과 같은 다른 신경퇴행성 질환도 수백만명에게 영향을 미친다. 그런데 세계보건기구(WHO)에 의하면 전 세계 치매 인구는 2013년 4,400만명에서 2030년에는 7,600만명, 2050년에는 1억3,500만명으로 증가할 것으로 보인다.
알츠하이머병만 해도 치료제가 없을뿐더러 여전히 불확실한 것이 많기 때문이다. 치매 원인이 무엇인지, 플라크와 같은 치매 병변이 생기는 이유는 무엇인지 등등 많은 것이 베일에 가려 있다.
인간의 한계 벗어난 새로운 치료법 기대
놀스 교수는 “단백질 응축물은 우리의 DNA가 단백질로 변환되는 유전자 발현이나 단백질 합성과 같은 세포의 주요 사건을 통제하기 때문에 최근 과학계에서 많은 관심을 받고 있다”라고 말했다.
단백질 액적과 연관된 어떠한 결함도 암과 같은 질병으로 이어질 수 있다. 질병을 일으키는 세포 내부의 문법적 오류를 바로잡을 수 있으려면 단백질 오작동의 분자 기원에 대한 연구에 자연어 처리 기술을 도입하는 것이 중요하다고 연구진은 주장했다.
실제로 연구진은 빅데이터를 학습한 머신러닝 알고리즘을 이용해 일부 단백질이 세포 내부에서 응축물을 형성하도록 유도하는 구체적인 문법에 대해 질문할 수 있었다. 그것을 풀 수 있으면 우리가 질병 언어의 규칙을 배우는 데 도움이 될 수 있기 때문이다.
현재 머신러닝 기술은 데이터 가용성의 증가, 컴퓨팅 성능 향상, 그리고 보다 강력한 알고리즘을 만드는 기술적 진보로 인해 빠른 속도로 발전하고 있다. 따라서 머신러닝 기술의 사용은 미래의 암과 신경퇴행성 질환 연구를 변화시킬 수 있다.
머신러닝 기술이 인간의 뇌가 이해할 수 있는 것보다 이 질병에 대해 훨씬 더 잘 이해할 수 있다는 사실이 전혀 이상하지 않은 셈이다.
이번 연구의 제1저자로 참여한 사어 박사는 “머신러닝은 과학자들이 탐구의 대상으로 생각하는 한계에서 벗어날 수 있으며, 이는 우리가 아직 생각조차 하지 못한 새로운 연결고리를 AI가 발견할 수 있음을 의미한다”고 말했다.
(2399)
로그인후 이용 가능합니다.
미세먼지 중에서도 가장 입자가 작은 나노미세먼지가 허파에 깊숙이 침투해 오래 머무르면서 영향을 끼친다는 연구결과가 나왔다. 23일 한국기초과학지원연구원(KBSI)에 따르면 바이오융합연구부 홍관수·박혜선 박사 연구팀은 형광 이미징이 가능한 초미세·나노미세먼지 모델입자를 제작해 생체에 주입한 뒤 최대 한 달 동안 장기별 이동 경로와 세포 수준에서의 미세먼지 축적량을 비교·분석했다.
과학기술정보통신부 국립전파연구원은 국제전기통신연합 전기통신표준화부문(ITU-T) 정보보호 연구반(SG17) 회의에서 우리나라 주도로 개발한 표준 4건이 사전 채택됐다고 23일 밝혔다.
한국과학기술원(KAIST)은 신소재공학과 장재범 교수와 전기및전자공학과 윤영규 교수 연구팀이 기존보다 5배 더 많은 단백질 바이오마커(생체지표)를 동시에 찾아낼 수 있는 '멀티 마커 동시 탐지 기술'을 개발했다고 23일 밝혔다. 한 번에 15∼20개 단백질 마커를 동시에 탐지할 수 있는 피카소(PICASSO) 기술은 동시 탐지 기술 가운데 가장 많은 수의 단백질 마커를 가장 저렴한 비용으로, 가장 빨리 탐지한다.
2차 발사일이 잠정적으로 6월 15일로 잡혀 있는 한국형발사체 누리호(KSLV-Ⅱ)가 '완벽 성공'에 재도전하기 위해 만반의 준비를 하고 있다. 22일 과학기술정보통신부(과기정통부) 등에 따르면 과기정통부는 이번 주에 발사관리위원회를 열어 누리호의 발사일과 시간을 확정한다. 기상 변수 등을 고려해 발사일 전후 약 1주가 예비발사 기간으로 함께 지정될 예정이다.
산림청 국립산림과학원은 23일 우리나라 주요 산림 수종 14개의 무게를 쉽게 측정할 '입목중량표' 개발에 착수했다고 밝혔다. 입목중량표는 나무의 키와 가슴높이의 굵기만 알면 누구나 쉽게 무게를 알 수 있도록 표로 제시한 것으로, 부피 단위인 재적표와 함께 가장 중요하고 기본적인 산림 경영기준표다.
양자암호 상용화를 위해 필요한 핵심 기술인 'TF QKD'의 실험 검증에 한국 연구진이 세계에서 두번째로 성공했다. 한국과학기술연구원(KIST)은 22일 한상욱 양자정보연구단장이 이끄는 연구팀이 작년 겨울 'TF(Twin-field) 양자키 분배(QKD, Quantum Key Distribution)' 검증에 성공했다고 밝혔다. 연구 결과는 이달 초 양자정보학 분야의 온라인 오픈액세스 저널인 'npj Quantum Information'에 게재됐다.
한국원자력연구원은 자석으로 방사성 물질인 세슘을 분리하는 '자성 분리 기술을 이용한 방사성 오염 토양 정화 방법'을 개발했다고 23일 밝혔다. 방사성 오염 토양에서 가장 흔히 발견되는 세슘은 지름 0.002㎜ 이하의 미세한 흙입자(점토)와 강하게 결합하는데, 점토는 표면이 음전하를 띤다.