인간의 거의 모든 유전체는 약 20년 전 인간 게놈 프로젝트(Human Genome Project)를 통해 염기서열이 분석됐으나, 이들 유전체 가운데 약 2%만이 폭넓게 연구돼 단백질 코딩 유전자가 확인됐다.
단백질은 살아있는 조직의 기초를 형성하고, 생물학적 과정에서 중추적인 역할을 하는 것으로 알려져 있다.
이런 상황에서 유전체 활용 비영리 연구기관인 미국의 허드슨알파 생물기술연구소(HudsonAlpha Institute for Biotechnology) 연구팀은 ‘DNA 구성요소 백과사전 프로젝트(ENCODE, the Encyclopedia of DNA Elements Project)’와 수십 년 동안의 장기적인 국제 협력을 통해, 다른 기관 협력자들과 더불어 인간 유전체의 나머지 98%가 어떤 중요성을 가지고 있는지를 밝히기 위해 노력해 왔다.
프로젝트의 목표는 인간 게놈의 기능을 이해하고, 중요한 부분을 식별해 내는 것이다. 이 연구팀이 최근 프로젝트 최종 연구 결과를 발표했다.

인간 유전체 조직과 조절에 대한 새로운 통찰
프로젝트 최종 단계(ENCODE 3)에서 나온 결과에는 허드슨알파의 마이어스(Myers) 연구실과 칼텍의 바바라 월드(Barbara Wold) 박사 실험실, 펜실베이니아대 로스 하디슨(Ross Hardison) 박사, 캘리포니아(어바인)대 알리 모르타자비(Ali Mortazavi) 박사, 앨라바마대 및 허드슨알파의 에릭 멘덴홀(Eric Mendenhall) 박사 등이 많은 기여를 했고, 이 결과물은 7월 30일 과학저널 ‘네이처’(Nature)에 9편의 논문 개요로 출판됐다. 또한 다른 주요 저널에도 21편의 심층 연구가 발표됐다.
ENCODE는 미국 국립보건원(NIH) 산하 국립인간유전체연구소(NHGRI)에서 연구자금을 지원했다.
ENCODE 컨소시엄 연구팀은 세 번째 최종 단계에서 유전자가 언제 어디서 켜지는지를 조절하는 DNA 스위치 후보 수백만 개를 ENCODE 데이터베이스에 추가했다.
이에 따라 인간과 쥐 유전체의 기능적 요소에 대한 포괄적인 지도를 개발하려는 목표에 한발 다가서게 됐다.
ENCODE 3는 또한 일부 DNA 스위치를 유용한 생물학적 범주에 할당한 새로운 등록부(registry)를 제공했다.

생리학적 수준으로 발현된 전사인자 최대 규모로 연구
이번 연구에서는 특히 최대 규모의 전사인자 연구가 발표돼 주목된다. 허드슨알파의 마이어스와 멘덴홀 박사팀이 인간과 쥐 유전체의 DNA 요소에 대한 지식을 넓히기 위해 전장 유전체 실험으로 전사인자(transcription factor) 생물학 연구를 수행했다.
프로젝트 매니저인 마크 매키위츠(Mark Mackiewicz) 박사는 이 연구를 감독하며 연구 진행을 도왔다.
전사인자는 인체 게놈에서 가장 큰 단백질 군에 속하며, DNA로 암호화된 유전자의 RNA 복제본을 만드는데 관여한다. 전사된 RNA는 세포에서 매우 중요한 단백질을 만드는데 사용된다.
일부 예외가 있기는 하지만 우리의 모든 세포들은 두 개의 동일한 유전체 사본을 가지고 있다. 그러나, 인체에 있는 200여 개 이상의 서로 다른 유형의 세포들이 서로 다른 기능을 수행하기 위해서 모든 유전자가 모든 세포 유형에서 활성화 혹은 발현될 수 있는 것은 아니다.
유전자 발현은 전사인자 단백질이 조절 요소인 DNA의 짧은 스트레치와 결합하면서 조절되는데, 이것이 유전자 발현을 켜고 끄는 스위치 역할을 한다. 유전자가 켜지고 꺼지는 이런 능력을 통해 각각의 서로 다른 세포 유형에서 독특한 유전자 조합이 발현되게 된다.

대규모 전사인자 연구 통해 새 사실 확인
허드슨알파 연구팀은 멘덴홀, 월드, 모르타자비 및 하디슨 박사 등 협력자들과 함께 인체 간암 세포주에서 발현된 전사인자의 약 4분의 1을 연구함으로써 지금까지 생리적 혹은 정상적 수준으로 발현된 전사인자에 대한 연구 중 최대 규모의 조사연구를 수행했다.
수리야 체트리(Surya Chhetri) 박사과정생과 함께 논문 공동 제1저자로 등재된 허드슨알파의 크리스 패트리지(Chris Partridge) 선임 과학자는 “전사인자의 유전체적 목표를 이해하는 것은 유전자 조절과 발달을 포함한 생물학의 여러 측면을 이해하고, 많은 질병과 장애의 생물학적 기전을 식별하는데 지극히 중요하다”고 강조했다.
연구팀은 이런 대규모 전사인자 그룹을 분석함으로써 전사인자들 사이의 새로운 연관성을 확인하는 한편, DNA에서 전사인자들의 공간적 상호작용을 상술하고, 유전체에서 촉진자(promoters)와 상호 작용하는 전사인자들과, 증강자(enhancers)와 상호 작용하는 전사인자들을 구별할 수 있었다.
이런 모든 결과들은 정상 상태를 다루는 생물학이나 질병 상태 모두에서 인간 유전체가 어떻게 기능하는지를 이해하는데 한 걸음 더 다가가게 한다는 평가다.

ENCODE 프로젝트, 공동연구의 중요성 부각시켜
ENCODE 프로젝트의 중요한 특징은 인간 유전체를 이해하려는 야심찬 노력 외에, ENCODE 컨소시엄 구성원들이 생성한 데이터를 연구자들이 신속하게 접근해 완벽하게 사용할 수 있도록 한다는 점이다.
이에 따라 ENCODE 프로젝트에 참여하지 않은 연구자들이 이 프로젝트로 생성한 데이터를 사용해 2000편 이상의 출판물을 발표했다.
허드슨알파 대표이자 유전학부 석좌인 릭 마이어스(Rick Myers) 박사는 이 프로젝트의 장기적이고 광범위한 협업적 특성을 자랑스럽게 생각한다고 말했다.
마이어스 박사는 “인간 게놈 프로젝트를 수행하며 우리가 배운 것 중 하나는 ENCODE 프로젝트와 같은 대규모 연구는 연구그룹들이 서로 협력할 때 훨씬 더 효율적으로 수행된다는 것”이라며, “이는 특히 ENCODE의 임무가 전체 연구자와 생의학 커뮤니티에 사용될 데이터와 자료 및 결과물의 원천을 생성하는 것이기 때문”이라고 설명했다.
그는 “우리가 일찍이 인식한 또 다른 점은 출판에 앞서 아무런 조건 없이 모든 사람이 주간 단위로 데이터를 자유롭게 활용할 수 있도록 함으로써 연구자들이 어디에서나 훨씬 빠른 속도로 연구를 진행할 수 있도록 해준다는 점”이라고 강조했다.
- 김병희 객원기자
- hanbit7@gmail.com
- 저작권자 2020-08-03 ⓒ ScienceTimes
관련기사