사이언스타임즈 로고

AI 알고리즘, 무려 16만 개의 새로운 RNA 바이러스를 발견하다 전 세계 환경 샘플에서 바이러스의 보고를 식별하는 데 도움

  • 콘텐츠 폰트 사이즈 조절

    글자크기 설정

  • 프린트출력하기

우리는 인공지능의 시대에 살고 있다

바야흐로 인공지능(AI: Artifical Intelligence)의 시대이다. 최근 모든 학문에 ‘AI’라는 단어가 붙고 있는 것과 더불어 올해 노벨 물리학상, 화학상은 AI와 융합된 분야에 시상되기도 했다. 그만큼 AI는 우리 생활에 상당히 밀접해 있는 듯 보인다. 여기에, 최근 우리와 매우 가까워진 또 하나의 단어가 있다. 바로 코로나 이후 등장해 우리 생활을 지배하기 시작한 ‘RNA 바이러스’이다. 참고로, RNA 바이러스는 단일 리보핵산(RNA) 가닥으로 구성된 유전 물질을 가지고 있으며 이는 헤르페스 바이러스와 같은 DNA 바이러스의 이중 가닥 DNA와는 다르다.

신호우(Xin Hou) 박사가 이끄는 중국 및 호주 국제 연구진이 국제 학술지 셀(Cell)에 발표한 연구결과에 따르면 위 두 가지 객체가 함께 어우러져 인류에 도움이 되는 결과를 내놓고 있다고 한다.

이 연구에 사용된 루카프로트 AI 알고리즘은 올해 화학 노벨상에서 인정받은 알파폴드 시스템과 유사하게 작동한다. © Hou et al. 2024

 

AI 알고리즘, 무려 16만 개의 새로운 RNA 바이러스를 발견하다

우리는 오랜 데이터 수집을 통해 전 세계 생태계에서 유전 물질 정보를 저장해오고 있다. 이 중 분석되지 않은 10,000개 이상의 유사한 메타게놈 샘플을 AI 알고리즘인 루카프로트(LucaProt)로 분석했다. 연구진들은 이번 분석을 통해 무려 161,979개의 잠재적인 RNA 바이러스 종과 180개의 RNA 바이러스 초군을 발견했다. 연구진은 이번 분석을 통해 밝혀진 16만 개의 잠재적 바이러스가 ‘바이러스의 넓은 바다에서 한 방울’에 불과하다고 설명하며, 이는 세계 바이러스피어(바이러스 세상의 규모)의 진정한 규모를 암시한다고 주장한다.

총 10,000개 이상의 유사한 메타게놈 샘플이 분석되었다. © Hou et al. 2024

연구를 공동 주도한 호주 시드니 대학의 바이러스학자 에디 홈즈는 “해당 연구는 단백질 구조를 식별하고 다양한 바이러스를 찾는 데 있어 AI가 얼마나 혁신적인지 보여주고 있다”고 설명했다. 이 연구에 사용된 루카프로트 AI 알고리즘은 올해 노벨 화학상에서 인정받은 알파폴드 시스템과 유사하게 작동한다. 홈즈와 그의 협력자들은 루카프로트 시스템이 유전 물질의 ‘암흑 물질(DNA에는 데이터베이스에 축적된 정보와 일치하지 않는 코드 라인이 있을 수 있는데, 연구자들은 이를 암흑 물질로 부름; 천체물리학에서 설명하는 암흑 물질과는 다른 정의)’을 통과한다고 설명하는데, 이들은 식물, 동물, 곰팡이, 박테리아 및 바이러스와 같은 ‘비생물’ 물질의 정보로 가득 찬 ‘메타게놈’ 샘플로부터 시작된다.

현재까지 연구 중 가장 방대한 양의 연구를 자랑한다. © Hou et al. 2024

구체적으로 연구는 루카프로트라는 알고리즘을 훈련시켜 암흑 물질에서 바이러스 RNA 종의 유전 정보를 예측하도록 학습되는데, 시드니 남쪽의 농업 연구소에서 채취한 50그램의 메타게놈 샘플 하나에서도 무려 1,600개 이상의 새로운 바이러스가 발견되었다고 한다.

 

해당 연구가 중요한 이유

영국 엑서터 대학의 진화 생물학자인 벤 롱던은 “루카프로트는 바이러스를 식별하는 데 매우 유용한 도구”라고 설명하며, 이미 그의 연구에서도 이 도구를 사용하고 있다고 밝혔다. 롱던은 “루카프로트는 AI가 새로운 바이러스의 발견에 대해서 얼마나, 그리고 어떻게 큰 도움을 주고 있는지를 보여주고 있으며, 그것들을 분류하고 심지어는 자유롭게 적절한 이름을 소개해 줄 수도 있다”고 설명한다.

연구자들은 16만 개의 바이러스는 아직 발견되지 않은 '바이러스의 넓은 바다에서 한 방울'에 불과하다고 설명하며, 이는 세계 바이러스피어의 진정한 규모를 암시한다고 주장한다. © Hou et al. 2024

이번 연구를 통해 연구진은 다양한 바이러스가, 지구의 다양한 환경에, 방대한 규모로, 서식하고 있음을 강조하며 놀라운 결과를 세상에 내놓았다. 다행인 점은 이렇게나 방대한 양의 바이러스 후보가 우리에게 크게 해롭지 않을 것이라는 점이다. 즉, 수천 개의 새로운 바이러스가 발견되었지만, 인간에게는 안전할 가능성이 높다는 점이 매우 흥미롭다. 홈즈 박사는 이번 연구가 인간에게 새로운 바이러스 위협을 주지 않을 가능성이 높다고 주장한다.

그 이유는 16만 개의 새로운 바이러스 중 포유류 바이러스에 가까운 것이 없고 그렇기에 인간을 감염시키기 힘들 것으로 예측되기 때문이다. 또한, 설령 인간을 감염시킬 수 있다고 하더라도 그것들이 위험하거나 질병을 일으키는 바이러스라는 징후는 현재까지 없는 상태이다. 이들은 심지어 박테리아와 마찬가지로 ‘좋은’ 또는 ‘친화적인’ 바이러스로 건강에 유익할 수도 있는 존재들이다.

물론 바이러스가 해롭지 않더라도, 그들이 존재 자체를 인지하고 있는 것이 중요하다. 이는 주로 신종 감염병을 이해하기 위해 어떤 바이러스가 존재하는지, 그것들이 어떻게 공유되는지, 그리고 어떤 요인이 숙주 종 사이에서의 전이를 결정하는지를 이해해야 하기 때문이다. 따라서, 이번 발견은 바이러스의 다양성을 이해하고, 그것들이 어떻게 더 감염성이 있거나 덜 감염성이 있게 진화할 수 있는지를 이해하는 한 걸음이 될 수 있다.

 

관련 연구 바로 가기 - "Using artificial intelligence to document the hidden virosphere (인공 지능을 사용하여 숨겨진 바이로스피어 파헤치기)", Xin Hou et al. 2024

김민재 리포터
minjae.gaspar.kim@gmail.com
저작권자 2024-10-28 ⓒ ScienceTimes

관련기사

목록으로
연재 보러가기 사이언스 타임즈에서만 볼 수 있는
특별한 주제의 이야기들을 확인해보세요!

인기 뉴스 TOP 10

속보 뉴스

ADD : 06130 서울특별시 강남구 테헤란로7길 22, 4~5층(역삼동, 과학기술회관 2관) 한국과학창의재단
TEL : (02)555 - 0701 / 시스템 문의 : (02) 6671 - 9304 / FAX : (02)555 - 2355
정기간행물 등록번호 : 서울아00340 / 등록일 : 2007년 3월 26일 / 발행인 : 정우성 / 편집인 : 윤승재 / 청소년보호책임자 : 윤승재
한국과학창의재단에서 운영하는 모든 사이트의 콘텐츠는 저작권의 보호를 받는 바 무단전재, 복사, 배포 등을 금합니다.

사이언스타임즈는 과학기술진흥기금 및 복권기금의 지원으로 우리나라의 과학기술 발전과 사회적 가치 증진에 기여하고 있습니다.