수개월 안에 단백질구조 ‘1억 개’ 예측

딥마인드, AI로 3차원 입체구조 정확히 예측하는데 성공

단백질(protein)이란 용어는 그리스어를 어원으로 갖고 있다.

‘가장 중요한 것’이라는 것을 뜻하는 ‘프로테이오스(πρώτειος)’란 말에서 유래했는데 말 그대로 생물체를 구성하는 기본 물질이라고 보면 된다.

20여 종의 다양한 아미노산들이 기상천외한 결합을 하며 다양한 구조와 기능을 창출하고 있는데 문제는 이중 어느 하나라도 달라지면 단백질 자체의 성질이 바뀌면서 또 다른 생명현상을 양산한다는 것이다.

인공지능업체인 딥마인드에서 ‘알파폴드’를 통해 불과 1~2일 사이에 단백질 구조를 정확히 예그하는데 성공하면서 그동안 어려움을 겪어왔던 단백질 구조 분석에 가속도가 붙을 전망이다. 사진은 아미노산이 결합된 단백질 모양. ⓒWidipedia

인공지능 알파폴드통해 90% 일치효과 확인

지금 팬데믹 사태를 몰고 온 코로나19 바이러스 역시 전염 과정에 있어 연결고리가 되는 스파이크 단백질에 변이가 일어난 경우다.

이외에도 각종 암을 비롯 알츠하이머, 파킨슨 등 각종 질환들 역시 단백질 변이에 따른 것으로 과학자들은 난치병 치료를 위해 단백질 구조를 분석해왔다. 그리고 최근 인공지능에 도움을 받아 그 구조를 세밀하게 밝혀내고 있다.

대표적인 경우가 딥마인드(DeepMind Technologies Limited)다.

한국의 바둑천재 이세돌 9단과 바둑 대국을 벌인 AI ‘알파고’를 개발한 딥마인드는 지난해 11월 30일 사상 최초로 유전자정보를 분석해 단백질의 3차원 입체 구조를 정확하게 예측하는 데 성공했다고 발표했다.

단백질 분석을 위해 가동한 인공지능 ‘알파폴드(Alphafold)’를 통해 과학자들이 실험을 통해 밝혀낸 단백질 구조와 비교해 90% 이상 일치하는 효과를 얻었다는 것.

그리고 지난주 “인체에 존재하는 거의 모든 단백질과 효모, 초파리, 쥐 등을 포함한 가장 널리 연구되고 있는 20종의 유기체에서 발견되는 수십만 가지 또 다른 단백질의 형태(shape)를 예측할 수 있게 됐다.”고 밝혔다.

이와 함께 세계의 생물학자를 대상으로 관련 장치에 대한 세부적인 정보와 함께 소스코드를 공개한 후 ‘이를 통해 과학자들이 질병을 더 잘 이해하고 향후 약물을 설계하는데 도움을 줄 수 있을 것으로 기대했다.

딥마인드에 따르면 ‘알파폴드’는 현재 약 35만 개의 ​​단백질 구조를 예측하고 있다. 그러나 관계자는 “앞으로 수 개월 안에 1억 개 이상의 단백질 구조를 예측할 수 있다고 자신하고 있다.

1억 개 이상의 단백질 구조를 예측한다는 것은 그동안 과학계에 알려진 모든 단백질을 예측할 수 있게 된다는 것을 의미한다.

딥마인드 공동설립자인 데미스 하사비스(Demis Hassabis) CEO는 “단백질 구조 예측은 (자신이) 20년 넘게 관심을 가지고 진행해온 엄청난 프로젝트였다.”며, “앞으로 AI 이외의 세계에서 가장 큰 영향을 미치기 때문에 흥미진진하게 바라보고 있다.”고 말했다.

다른 모든 단백질 구조 예측 가능하다

알려져 있는 것처럼 단백질은 20여종의 아미노산들이 긴 리본 모양으로 꼬여 있는 모양을 하고 있다.

이 매듭이 어떻게 구성돼 있는지 그 구조를 알면 그 단백질이 어떤 일을 하는지 알 수 있다. 또한 어떤 과정을 통해 질병이 발생하는지, 그리고 그러한 이해를 통해 신약을 개발하는데 도움을 줄 수 있다.

최근 들어서는 오염 등을 제거하고 기후변화를 해결하는데 도움을 줄 수 있는 유기체를 식별하는 등 다양한 분야에서 이들 정보들을 활용하고 있다. 그러나 문제는 단백질 구조를 알아내는데 실험실에서 장기간의 노력이 필요했다는 것이다.

반면 ‘알파폴드(AlphaFold)’는 하루나 이틀 안에 원자 차원에서 그 구조를 예측할 수 있다. 이는 인공지능을 통해 어떤 단백질이든 그 구조를 빠르고 손쉽게 예측해낼 수 있다는 것을 의미한다.

자신의 연구실에서 자체적으로 단백질 구조 예측장치를 구축한 워싱톤 대학 단백질디자인 연구소의 데이비드 베이커(David Baker) 교수는 23일 ‘MIT 테크놀로지 리뷰’를 통해 “‘알파폴드’를 통해 단백질 구조를 파악하는 것이 훨씬 쉬어졌다.”고 말했다.

베이커 교수는 “그동안 많은 생물학자들도 협력연구를 진행해왔다.”며, “정말로 가속화된 멋진 생물학적 연구들이 많이 있다.”고 말했다. 연구팀은 ‘알파폴드’를 적용한 자체적인 단백질 예측 시스템을 ‘RoseTTAFold’라고 호칭하고 있다.

현재 ‘알파폴드’ 새 버전에서 제시하는 예측 자료들은 예측된 단백질 형태가 실제 형태와 얼마나 가까운지 표시하는 신뢰도 점수와 함께 제공되고 있다.

딥마인드는 이 측정값을 통해 ‘알파폴드’가 개별 원자 수준 36%까지 모양을 예측할 수 있다는 사실을 확인하고 있다. 이전에는 실험실에서 수십 년 간의 연구를 통해 17% 정도에서 그 구조를 확인하고 있었다.

단백질 구조 예측을 위해 자체적으로 소프트웨어를 개발하고 있는 컬럼비아 대학의 시스템 생물학자 모하메드 알쿠라이쉬(Mohammed AlQuraish)는 “단백질 구조 예측이 이 정도 수준에 올라섰다는 사실이 매우 인상적”이라며, “향후 또 다른 유기체에 있는 단백질 구조를 예측하는 일이 더 빠른 시기에 가능해질 것”이라고 예측했다.

딥마인드는 ‘알파폴드’에 의해 단백질 구조가 예측 되는대로 그 알려진 사실을 과학계에 모두 공개하겠다고 밝히고 있다.

(2497)

뉴스레터 구독신청
태그(Tag)

전체 댓글 (0)

과학백과사전