유전물질인 DNA 다섯개 중 한 개는 가까이 있는 유전자들의 조절 스위치 역할을 하지만, 이같은 유전자 조절영역에서의 어떤 변이가 실제로 일반적인 질병들을 일으키는지에 대해서는 정확하게 알려진 바가 없다.
미국 존스홉킨스 대학 연구진은 10년 간에 걸친 연구 끝에 어떤 변이들이 조절 스위치의 활동에 가장 큰 영향을 미치는가를 기존의 방법보다 훨씬 정확하게 예측할 수 있는 컴퓨터 공식을 만들어냈다. 이 방법은 많은 질병의 진단과 치료를 위한 새로운 목표를 제시할 것으로 기대된다.
이 연구의 요약본은 '네이처 지네틱스'(Nature Genetics) 6월 15일자에 게재됐다.
마이클 비어 존스홉킨스 의대 교수(생명의학 공학)는 “우리 컴퓨터 프로그램은 특정한 세포 타입으로부터 유전정보를 샅샅이 찾아내 어떤 ‘조절 스위치’의 변이가 세포의 유전자 활동을 변화시키고 그에 따라 기능도 바뀌게 하는지를 예측할 수 있다”고 소개했다. 그는 “질병 관련 변이 목록을 이미 20개 정도의 요인으로 압축해 연구자들이 질병 발생 확률이 높은 것들에 집중하도록 했다”고 밝혔다.
DNA에서 C가 G로 바뀌는 변이, 유전체의 위치에 따라 엄청난 결과 초래
세계 여러 나라의 과학자들은 유전 조절 영역에서의 공유 변이를 찾기 위해 암이나 뇌신경 질환 같은 통상적인 다중유전자 질환을 앓는 많은 환자들의 유전체를 분석해 왔다. 이런 연구의 결과 수백개의 변이들이 제시되었는데 문제는 이 변이들 대부분이 양성(良性)이라는 점이라고 비어 교수는 말했다. 이 때문에 그와 동료 연구진은 유전자 활동 레벨에서 영향을 줄 수 있는 변이들과 그렇지 않은 변이들 간의 차이점을 학습할 수 있는 컴퓨터 프로그램 고안에 착수했다.
그는 “당뇨병과 같은 흔한 질병들은 유전자 조절영역에서 여러 가지 다양한 변이들의 결과로 인해 나타나는 것으로 보인다”며, “이 변이들은 기존 단백질에 직접적인 변화를 일으키지 않고 양을 줄어들게 한다”고 말했다. 그는 여러 질병에서 어떤 유전자들이 가장 큰 문제를 일으키는지 분류하는 것이 치료법을 발전시키는 핵심이라고 덧붙였다.
DNA의 네 글자 중에서 시스테인(cysteine)의 C가 구아닌(Guanine)의 G로 바뀌는 단순한 변화가 유전체의 어디에서 일어나느냐에 따라 엄청나게 다른 결과를 나타낸다고 한다.
비어 교수는 “만약 매우 중요한 단백질을 인코딩하는 유전자의 중간에서 그런 일이 일어난다면, 아무런 단백질도 만들어지지 않거나 유기체가 죽거나 하는 변화를 일으킬 수 있다”고 말했다. 유전자 조절 영역 중 어떤 유전자 바깥에서 C가 G로 바뀌는 변이가 일어난다면 유사한 극단적인 일이 벌어질 수 있는데, 이 변이가 유전자 조절영역 전체의 작동을 멈추게 하거나 혹은 아무런 결과를 생산해 내지 못 할 수 있다는 것이다.
다른 대체 프로그램보다 56%, 10배 이상의 정확도 보여
새로운 공식을 개발하기 위해 연구팀은 먼저 DNAse 감응성(sensitivity)이라 불리는 도구를 이용해 컴퓨터 프로그램이 잠재적인 유전자 조절영역을 인식하도록 ‘훈련’시켰다. DNAse는 효소의 하나로서 DNA가 팽팽하게 감겨져 있지 않으면 어느 부분에서든지 이를 잘라버린다. DNA에서 특정 시퀀스의 개방성은 세포 형태에 따라 서로 다르며, 개방된 DNA의 조절 영역만이 활성화된다. 주어진 세포 형태에서 어떤 DNA의 구간이 DNAse에 얼마나 취약한가 하는 것은 어떤 조절 영역들이 중요한가를 나타내주는 지표가 된다는 것이다.
당시 비어 교수 연구실의 대학원생이었던 이동원 박사는 컴퓨터에 이미 알려진 시퀀스 명단을 입력하고 컴퓨터 프로그램이 한 타입의 암세포에 있는 DNAse 감응 시퀀스들의 특징을 인식하도록 가르쳤다. 그러자 컴퓨터는 그 나머지 DNAse 감응 시퀀스들을 예측해 냈고, 시퀀스의 얼마나 많은 개별 섹션들이 그 조절 영역의 전체 DNAse 감응성에 기여하는지를 측정해 냈다.
컴퓨터는 또한 변이하는 모든 DNA 글자(A,C,G,T)를 시뮬레이션 하고, 각 섹션의 DNAse 감응성에 대한 기여도를 재계산해 냈다. 변이 전후의 감응도 차이가 크면 클수록 변이가 유전자 활동 수준에 미치는 영향이 컸다고 비어교수는 말했다.
공식의 타당성을 시험하기 위해 연구진은 그들의 컴퓨터 예측 결과와 다른 대체 프로그램을 이용한 결과를 비교해 봤다. 그러자 프로그램 ‘규칙들’을 완전히 동등하게 세팅한 상태에서 비어교수의 프로그램은 후자보다 56%, 10배 이상의 정확한 결과를 나타냈다.
여러 질병들에 시험 적용한 결과 상관관계 확인
연구진은 공식을 더욱 직접적으로 시험하기 위해 같은 대학의 앤드루 매켈리언(Andrew S. McCallion) 매커식-네이선스 유전의학연구소 조교수와 협동연구를 통해 쥐의 멜라닌 세포(피부 색소세포)에 있는 두 개의 색소 관련 유전자를 조절하는 영역에서 변이가 어떤 결과를 나타내는지 예측하는 시험을 했다. 연구팀은 서로 다른 수준의 예측 결과를 보인 40개의 변이를 선별해 실험실에서 배양한 멜라닌 세포에서 이 변이들이 어떤 결과를 나타내는지 시험했다. 두 유전자의 활동 정도를 측정하자, 컴퓨터 프로그램이 예측한 것과 실제 세포에서 일어난 변화 사이에는 매우 강한 상관관계가 확인됐다.
매켈리언 교수는 “우리 연구진은 10여년 이상 일반적인 질병들에서 문제를 일으키는 변이들이 어떤 속성을 지니고 있는지 밝히려는 노력을 해왔다”며, “연구진의 연구 경력과 전략이 비어교수 연구팀과 우리 연구팀에게 놀랄 만한 결과를 안겨주었다”고 말했다. 그는 올바른 세포 자원으로 컴퓨터 프로그램을 ‘훈련’시키면 정교한 판독이 안 되는 문제 시퀀스 변이들이 일으키는 결과를 예측할 수 있다”고 덧붙였다.
- 김병희 객원기자
- kna@live.co.kr
- 저작권자 2015-06-17 ⓒ ScienceTimes
관련기사