영국인 50만명에 대한 건강기록과 유전자 기록을 가지고 있는 영국바이오뱅크(UKBiobank)는 지난 2017년 획기적인 조치를 취했다.
이들이 가지고 있는 50만명에 대한 기록을 연구자들에게 공개하기로 한 것이다. 이렇게 많은 데이터를 다양한 방법으로 분석하고 연구하면 지금까지 전혀 생각할 수 없는 대단한 연구결과를 낼 수 있다.
이 계획이 발표되자 약 300개의 연구그룹이 8테라바이트에 달하는 기록을 다운로드하기로 계약했다. 이는 영화 500개에 달하는 분량이다. 이 같이 자료를 공개하면 굳이 슈퍼컴퓨터를 가지고 있지 않은 과학자들도 세계적인 연구를 할 수 있다.
영국바이오뱅크는 2017년 7월 19일부터 3주 동안 연구자들이 암호화된 이 자료를 다운로드하도록 했다.
그 결과는 놀라웠다. 미국의 한 연구그룹은 이를 바탕으로 불과 며칠만에 2000가지 질병에 관련된 12만개의 유전자 마커를 분석했다. 그때까지는 단지 6만개의 유전자 마커가 질병과 연관된 것으로 밝혀졌을 뿐이다.
바이오뱅크가 공개된 지 2년도 안 된 현재, 국제저널은 물론이고 저널에 발표되기 전에 공개하는 바이오아카이브(bioRxiv)에는 연구논문들이 넘쳐나고 있다.
‘심장병, 당뇨병, 알츠하이머와 연관된 유전자’에 대한 자료부터 시작해서 ‘인격형성, 우울증, 출생체중, 불면증 등에 유전자가 어떤 역할을 하는지’ 등 그 내용도 엄청나게 다양하다.
사람유전자의 2%는 네안데르탈인 흔적
여기에는 교육수준, 성적 취향 등 오랫동안 논란의 대상이었던 내용과 연관된 DNA마커들에 대한 내용도 있다.
현재 살고 있는 사람 사이에 네안데르탈인의 흔적이 많이 남아있는 것도 발견됐다. 이를 바탕으로 우리 몸 안에 네안데르탈인의 유전자가 2%쯤 섞여 있다는 주장이 나왔다.
최근에는 ‘아주 오랜 시간에 걸쳐 이뤄지는 것으로 생각됐던 유전자의 진화가 현재도 진행되고 있다’는 암시가 드러나면서 진화생물학이 새로운 차원에 접어들었다.
사이언스 3일자 보도에 따르면, 수 년 전 미국 콜롬비아 대학교의 몰리 세보스키(Molly Przeworski)와 뉴욕 유전체센터의 조 피크렐(Joe Pickrell)은 콜롬비아 캠퍼스 가까운 곳에서 점심을 먹기 위해 만났다. 이들의 대화 주제는 노화와 알츠하이머 질환으로 옮겨갔다.
피크렐은 당시 70세와 85세 사이에 나타나는 ApoE4 대립유전자 보유자에 대해 연구하고 있었다. 이 대립유전자는 알츠하이머 질환과 심장혈관 질환을 유발하는 것이다. 이 대립유전자를 보유한 사람은 그렇지 않은 사람에 비해서 약 2배 사망위험이 높다.
두 과학자는 자연선택이 현재에도 이 대립유전자를 제거하고 있는지에 대해 궁금증을 가졌다. 인간의 진화를 촉진하는 자연선택은 오랜 기간 동안 관찰해야 알 수 있다.
피크렐과 세보스키는 현재의 인간 생존에 영향을 미치는 유전적 변이도 탐지할 수 있을지에 대해서도 궁금증을 가졌다.
이를 알아내려면 ‘한 두 세대에 걸쳐 자연선택이라는 진화의 도구가 인간에게 해로운 유전자 변이를 뽑아내거나, 이로운 유전자를 선호하는지’를 확인해야 한다.
이를 탐지하려면 거대한 DNA 데이터가 필요하다. 통계적 확신을 위해서는 적어도 10만명 수준의 샘플이 요구되는 것이다.
그래야 ‘서로 다른 연령의 사람들에게서 변화하는 공통적인 대립유전자가 얼마나 자주 나타나는지’를 탐지할 수 있다.
이들은 미국 캘리포니아 오크랜드의 카이저 병원(Kaiser Permanente)의 노화 데이터베이스에 있는 57,696명의 유전자 자료를 조사했다.
그런데 이 시점에서 UKB가 거대한 데이터를 공개한 것이다. 두 과학자는 여기서 117,648명의 개인 정보를 추가로 이용했다.
이들을 해당 데이터를 5년 단위로 나눠 추출한 다음, 여러 가지 대립유전자의 잦은 출현을 들여다보았다. 그 결과 ApoE4와 CHRN3라는 두 공통된 유전자 변이가 생존율을 크게 좌우하는 것을 발견할 수 있었다.
이 두 개의 유전자는 나이가 들면 갑자기 희귀해진다. 아마도 해롭기 때문일 것이다. 이중 알츠하이머를 일으키는 ApoE4는 알츠하이머 발병과, CHRN3는 흡연과 큰 관련이 있는 것으로 알려졌다.
연구 결과, 실제로 ApoE4 유전자를 적게 보유할수록 생존률이 높았다. 이러한 경향은 여성들에게서 두드러졌다.
동시에 CHRN3 유전자의 변이를 가진 극소수의 남자들은, 이 변이를 갖지 못한 남자보다 75세가 넘어서 생존할 확률이 현저하게 낮았다.
연구원들은 자연선택이 이 두가지 대립유전자를 제거할 만큼 충분한 시간을 갖지 못했을 것이라고 결론을 내렸다. 아마도 최근 들어 발생한 환경과 인간 행동의 변화가 사람을 죽음에 이르게 했기 때문일 것으로 본 것이다.
해로운 유전자 많으면 일찍 사망
예를 들어 CHRN3 대립유전자는 많은 남자들이 담배를 피우기 전까지는 생존에 영향을 미치지 않았다. 과거에 좀 더 활동적이었던 여성들은 ApoE4 대립유전자가 원인이 된 심장혈관질환에 덜 취약했을 것으로 세보스키는 추정했다.
한편 사춘기나 출산을 늦추도록 하는 유전자는 사람들을 더 장수하게 했다. 사춘기가 1년 늦게 오면 남성 여성 모두 사망이 3~4% 줄었으며, 여성의 경우 출산이 1년 늦으면 사망률이 6% 줄었다.
두 사람의 연구는 인간의 유전체가 1세대나 2세대라는 아주 짧은 시간에서도 진화하는 것임을 보여주는 첫 번째 연구다.
이러한 성과는 바이오뱅크의 데이터 덕분이다. 영국 맨체스터에 기반을 둔 바이오뱅크는 2006년부터 2010년 사이에 40세에서 69세 된 영국인 50만명의 데이터를 영국 국립건강서비스(National Health Service)를 통해서 수집했다.
바이오뱅크 소속 연구자들은 사람들의 혈액과 소변을 채취하고, 생활습관을 물어보는 한편, 2400개 이상의 서로 다른 특징과 표현형(phenotype)를 조사했다. 이 중에는 인지상태. 신체 건강 등이 포함되어 있다.
현재 전세계에서 약 7000명의 연구자들이 이 데이터를 가지고 1400개 프로젝트를 진행하고 있는 것으로 알려졌다. 이미 600개 가까운 논문이 발표됐다.
한때 시간과 돈 낭비라는 비난도 받았지만, 지금은 바이오뱅크가 가진 빅데이터의 쓸모를 의심하는 사람은 아무도 없다.
바이오뱅크의 자료가 많은 과학자들의 손에 들어감에 따라 현재 벌어지고 있는 진화의 내용들이 더욱 더 밝혀질 것으로 기대된다.
- 심재율 객원기자
- kosinova@hanmail.net
- 저작권자 2019-01-09 ⓒ ScienceTimes
관련기사