[KISTI 과학향기] 제3676호 단백질 연구의 새 장을 열다
과학에서 위대한 발견은 탁월한 방법과 엄청난 집념을 거름 삼아 탄생한다. 그리고 그 과정 속에는 사람들의 희망과 감동, 불안과 우려가 뒤섞여 있다. 최근 이러한 만감이 교차될 법한 과학 뉴스가 연달아 소개되었다. 사람의 몸을 구성하는 단백질, 그리고 삶을 편리하게 만들어주면서도 우리 일자리를 위협하는 인공지능에 관련된 이야기다.
알파폴드2, 단백질 구조 예측하는 인공지능
지난 2020년 11월, 알파고를 개발한 것으로 잘 알려진 인공지능 회사 구글 딥마인드가 ‘알파폴드2(AlphaFold2)’를 발표했다. 단백질 구조 예측 인공지능인 알파폴드2는 작년 12월에 있었던 단백질 구조 예측 능력 평가 대회(CASP)에서 92.4점으로 1위를 기록했다. 일부 테스트에서 2위와의 격차가 25점까지도 벌어졌던 것을 감안하면 엄청난 성과임이 분명했다. 딥마인드를 이끄는 데미스 허사비스는 오랫동안 ‘단백질 접힘’ 난제에 관해 관심을 가져왔다며 개인적인 소회를 밝히면서 알파폴드2가 지금껏 진행한 프로젝트 중 가장 대단한 일이라고 이 성과의 중요성을 강조했다.
우리 몸의 주요 구성 성분이자 신체 내 모든 현상에 관여하는 단백질은 생김새가 중요하다. 단백질의 입체 구조, 즉 모양이 곧 단백질의 기능을 결정짓기 때문이다. 단백질은 유전정보에 따라 아미노산들이 연결되어 만들어진다. 이때 이 긴 사슬의 아미노산 분자들이 서로 상호작용하는 방식과 주변 환경 조건에 따라 접히는 모양이 달라진다. 많은 변수가 관여함에도 아미노산 서열을 기반으로 단백질의 구조를 파악할 수 있다면, 이 정보는 효소 특성 파악이나 약물 영향 평가 등 다양한 분야에 활용될 수 있다.
단백질의 3차원 구조. 아미노산이 이토록 복잡하게 접혀 단백질을 이루기 때문에 단백질 구조를 밝혀내는 것은 굉장히 어려웠다. ⓒshutterstock
그동안 과학자들은 X선 결정법이나 저온전자현미경법(Cryo-EM) 등의 실험 결과를 이용해 단백질의 구조를 직접 분석하여 지금까지 10만여 종의 구조를 해독했다. 하지만 이러한 분석법은 시간이 너무 오래 걸린다는 단점이 있었다. 이에 대한 보완책이 컴퓨터를 이용해 단백질 내 상호작용을 계산하는 분석법이었다.
알파폴드2의 약진은 기존 방법과 달리 인공지능을 도입한 덕에 이루어졌다. 이 프로그램은 먼저 그동안 축적된 단백질 구조 데이터와 아미노산 배열을 학습한다. 그다음 이를 토대로 하여 새로운 아미노산 서열로부터 구조를 예측해낸다. 이전 방식이 분석하는 데 몇 주에서 몇 달까지 소요하던 것에 비해, 딥러닝과 텐션 알고리즘을 결합한 알파폴드2는 고작 하루 이틀 만에 결과를 내놓았다.
알파폴드2의 놀라운 성적은 생물학계의 모든 이목을 집중시켰다. 그러나 딥마인드측은 이러한 폭발적인 관심과 궁금증에 즉각적으로 호응하지 못했다. CASP 이후 알파폴드2에 관한 자세한 발표를 미뤄 온 것이다. 이 때문에 한때 학계에서는 딥마인드의 연구 독점을 우려하는 분위기가 조성되기도 했다.
또 다른 단백질 구조 예측 인공지능인 로제타폴드, 단백질 연구의 새 장을 열 것
흥미롭게도, 또 다른 단백질 구조 예측 인공지능인 ‘로제타폴드(RoseTTAFold)’는 이러한 배경에서 탄생했다. 알파폴드2의 성과를 눈여겨보던 수많은 이들 중에는 미국 워싱턴대 단백질 디자인 연구소의 데이비드 베이커(David Baker) 교수팀이 있었다. 이 연구진은 알파폴드2에 대한 상세 정보가 공개되길 기다리던 중, 발표가 기약 없이 늦어지자 당시까지 알파폴드2에 관해 알려진 내용을 바탕으로 알파폴드2와 같은 프로그램을 직접 만들어 재현해 보기 했다. AI 엔지니어링 전문가 한 명 없이 시작된, 다소 무모한 도전이었다.
프로젝트를 주도한 백민경 박사후 연구원은 로제타폴드를 설명하는 자리에서, 인간 실험 정확도와 엇비슷한 성능의 알파폴드2의 성과를 보면서 오랜 기간 심혈을 기울였던 자기 연구가 쓸모 없어진 것은 아닐지, 자신이 일자리를 잃게 되는 것은 아닐지 걱정했다고 솔직한 심정을 토로했다. 하지만 그렇다고 포기한 채 가만히 있을 수만은 없었기 때문에 이 프로젝트를 시작한 것이다.
결과적으로 로제타폴드 프로젝트는 지난 7월 15일, 알파폴드2와 근접한 성능을 가진 로제타폴드를 발표하면서 성공을 거두었다. 그리고 공교롭게도 같은 날, 딥마인드측은 알파폴드2의 개발 과정이 담긴 논문과 소스코드를 공개했다. 또한 사람들의 우려와 달리 그로부터 일주일 후, 딥마인드는 알파폴드2로 만든 단백질 구조 예측 데이터베이스 사이트를 열었다.
로제타폴트가 예측한 단백질의 3차원 구조. ⓒ로제타폴드
이 거대한 데이터베이스는 누구든 쉽게 이용할 수 있으며, 인간 단백질 98.5%를 포함한 여러 유기체 단백질 구조에 대한 3D 예측 모델을 제공한다. 현재까지 딥마인드가 알파폴드를 이용해 새로 예측한 단백질 구조는 약 35만 개이며, 딥마인드측은 여기서 나아가 앞으로 몇 달 후에는 1억 개 이상의 단백질 구조를 예측해 발표하기를 계획하고 있다고 밝혔다. 지금까지 세상에 알려진 모든 단백질이 약 2억 개인 점을 고려하면 그중 절반의 비밀이 풀리는 셈이다.
현재 알파폴드2는 일회용 플라스틱 분해를 가속화하는 효소 연구, 희귀 유전 질환 치료제 개발 등, 우리에게 희망이 되는 과제에 활용될 것으로 알려졌다. 아직까지는 딥마인드 측에서 유료화 계획에 대해 언급한 바가 없기 때문에, 앞으로 딥마인드의 행보를 정확히 예측하기는 어렵다. 다만 이전 과학자들이 헌신한 결과를 학습해야만 작동할 수 있는 딥러닝 알고리즘의 특성상, 지금처럼 많은 사람이 과학의 혜택을 누릴 수 있다면 더욱 바람직할 것이다.
글: 정유희 과학칼럼니스트/일러스트: 이명헌 작가
*이 글은 한국과학기술정보연구원(KISTI)에서 발간하는 ‘과학향기’ 로부터 제공받았습니다.
제3678호 IPCC 6차 보고서, 위기의 지구 진단하다
제3680호 인간형 로봇과 완전 자율 주행차, 테슬라가 그리는 미래
(5532)
로그인후 이용 가능합니다.
몸집이 크고 순종인 수컷 반려견이 몸집이 작은 잡종견보다 더 어린 나이에 암 진단을 받는 경우가 많다는 연구 결과가 나왔다. 미국 캘리포니아주 라호이아의 액체생검업체 펫디엑스(PetDx)의 질 라팔코 박사팀은 2일 과학저널 '플로스 원'(PLOS ONE)에서 암에 걸린 개 3천452마리의 암 진단 중간 나이를 분석, 이런 결론을 얻었다고 밝혔다.
액체 상태의 물과 가장 흡사한 새로운 형태의 얼음이 발견돼 학계에 보고됐다. 액체 상태의 물이 고체로 바뀐 얼음은 다 같은 것이 아니라 결정 형태가 밝혀진 것만 20종에 달한다. 여기에다 분자가 일정하지 않아 밀도로 따지는 비정질얼음도 두 가지나 있는데, 물과 밀도가 거의 똑같은 얼음이 추가된 것이다.
허블 우주망원경이 태양과 같은 별이 연료를 모두 소진하고 핵만 남은 백색왜성의 질량을 처음으로 직접 측정해내는 성과를 냈다. 미국 항공우주국(NASA)에 따르면 샌타크루즈 캘리포니아대학의 천문학자 피터 맥길 박사가 이끄는 연구팀은 허블 망원경을 이용해 백색왜성 LAWD 37의 질량을 측정한 결과를 영국 '왕립 천문학회 월보'(MNRAS)에 발표했다.
전남대가 참여한 공동연구팀이 고정밀 바이오센서, 차세대 디스플레이용 투명 전극 등에 적용할 수 있는 전도성 고분자 물질의 내구성을 향상하는 기술을 개발했다고 1일 밝혔다. 전남대 고분자융합소재공학부 윤창훈 교수 연구팀과 충북대 전자공학부 강문희 교수는 공동연구를 통해 800 S/cm 이상 높은 전기 전도도를 갖는 전도성 고분자(PEDOT:PSS) 물질의 물에 대한 내구성을 개선할 메커니즘을 발견했다.
중성자별끼리 충돌해 초강력 폭발을 일으키며 금을 생성하는 '킬로노바'(Kilonova)의 모든 조건을 갖추고 이를 준비 중인 쌍성계가 처음으로 관측됐다. 이런 쌍성계는 1천억개가 넘는 우리 은하 별 중에서도 열 손가락 안에 꼽을 정도로 극히 드문 것으로 제시됐다.
한국과학기술원(KAIST) 바이오및뇌공학과 조광현 교수 연구팀은 폐암 세포의 성질을 변환시켜 전이를 막고 약물 저항성을 제거하는 기술을 개발했다고 30일 밝혔다. 연구팀은 폐암 세포를 전이시킬 능력이 없는 상피세포가 전이 가능한 중간엽세포로 변하는 '천이 과정'(EMT)에서 나타나는 다양한 암세포 상태를 수학모델로 만들었다.
중성자별끼리 충돌해 초강력 폭발을 일으키며 금을 생성하는 '킬로노바'(Kilonova)의 모든 조건을 갖추고 이를 준비 중인 쌍성계가 처음으로 관측됐다. 이런 쌍성계는 1천억개가 넘는 우리 은하 별 중에서도 열 손가락 안에 꼽을 정도로 극히 드문 것으로 제시됐다.