지구는 잘 알려진 동물과 식물에서부터 고세균이나 바이러스 및 박테리아와 같이 작지만 강인한 미생물에 이르기까지 다양한 생명체를 보유하고 있다.
이런 생명체들은 근본적으로 세포 수준에서까지 완전히 다르다고 과학자들은 생각해 왔다.
최근 덴마크 코펜하겐대와 막스플랑크 생화학연구소가 이끄는 국제 연구팀은 이를 확인하기 위해 박테리아와 고세균에서부터 식물과 인간까지 서로 다른 100개 생물종의 단백질을 분석해 보았다.
이 분석은 다른 여러 생물종들에 걸쳐 수행된 연구 가운데 가장 큰 단백질 지도화(mapping) 작업이다. 분석 결과 연구팀은 이런 여러 생명체들이 실제로는 수많은 공통된 특성을 가지고 있다는 사실을 발견했다.
이 연구는 과학저널 ‘네이처’(Nature) 17일 자에 발표됐다.

코펜하겐대 노보 노르디스크재단 단백질 분석센터 마티아스 만(Matthias Mann) 교수는 "서로 다른 100종의 단백질체(proteome)를 매핑한 결과 실제로 매우 다른 것은 분명하지만 생각보다 공통점도 많았다"고 밝혔다.
그는 "모든 생명체에서 단백질의 많은 부분들이 신진대사와 단백질 균형 유지에 중점을 두고 있다"고 설명했다.
실험적으로 확인된 단백질 배증시켜
이전에 연구자들은 주로 다양한 유기체의 DNA에 관심을 보였다. 예를 들면, 인간과 다른 동물들이 얼마나 많은 유전물질을 공유하는가 하는 주제 같은 것이었다.
그러나 유기체 연구에 사용되는 기술들이 분자 수준으로 발전함에 따라 연구자들은 세포를 주력으로 움직이는 단백질로 눈을 돌렸다.

노보 노르디스크 재단 단백질 연구센터 알베르토 산토스 델가도(Alberto Santos Delgado) 박사후 연구원은 "모든 생명체의 공통된 특성은 단백질체의 상당 부분을 항상성(homeostasis)이라고 일컫는 일종의 균형 유지에 초점을 맞추고 있다는 사실"이라고 강조했다.
델가도 연구원은 이어 "또 다른 공통적인 특징은 광합성에서부터 탄수화물 연소에 이르기까지 방법은 다르더라도 단백질의 많은 부분이 에너지 생성을 돕는다는 점"이라고 덧붙였다.
연구팀은 질량 분석법(mass spectrometry)이라는 고급 기술을 사용해 100종의 단백질을 모두 분석했다. 실험적으로 확인된 단백질들은 이 기술을 통해 두 배로 늘렸다.
이전의 연구에서는 유전자 코드와 생물정보학적 계산에만 근거해 어떤 단백질이 얼마나 많이 존재하는지를 예측했다. 그러나 이번의 새로운 단백질 매핑 연구는 수많은 새 단백질 존재에 대한 실제 데이터를 제공했다.

기계학습이 새로운 상관관계 보여줘
논문 제1저자인 막스플랑크 생화학연구소의 요하네스 뮐러(Johannes Muelle) 박사과정생은 "정량적 질량분석 기반의 단백질체 분석을 데이터베이스 자원과 연결하는 작업을 통해 5300만 개의 상호 연결성을 가진 800만 개의 데이터 포인트를 지닌 데이터세트를 생성했다"고 밝혔다.
뮐러 연구원은 "모든 데이터를 공개해 다른 연구자들이 이 데이터를 활용해 새로운 상관관계를 식별할 수 있도록 했다"고 전했다. 또한 뮐러 연구원은 "기계 학습으로 가능해진 새로운 기술들이 부상하고 있으며, 이 기술들이 우리가 제공한 대규모의 균일한 데이터 세트로부터 유익한 것을 얻어내리라 기대한다"고 말했다.
한편 연구팀은 이번 프로젝트의 모든 데이터를 ‘생명의 단백질체’ 웹사이트(https://proteomesoflife.org/)에 공개했다.
- 김병희 객원기자
- hanbit7@gmail.com
- 저작권자 2020-06-19 ⓒ ScienceTimes
관련기사