October 17,2019

정직한 논문과 부정직한 논문?

데이터 인용에 연구윤리 적용 시급

FacebookTwitter

디지털 시대를 맞아 인터넷을 통해 다수의 논문이 게재되면서 한 사람의 연구자가 다양한 과학 논문을 손쉽게 인용할 수 있는 시대가 됐다.

그러나 과학계는 쏟아져 나오는 논문의 질을 놓고 격한 논란을 벌여왔다. 별다른 노력을 하지 않은 채 대중적 관심을 노려 적은 수의 샘플로 연구 결과를 도출해내는 논문들이 다수 출몰하고 있다는 것.

특히 논문을 인용하면서 컴퓨터를 활용해 도출한 연구 결과를 주고받게 되는데 이런 연구 관행이 과학 발전에 도움을 주고 있느냐를 놓고 연구 현장에 있는 과학자들 사이에 치열한 논쟁이 이어져 왔다.

ⓒ 컴퓨팅 데이터를 대상으로 한 논문 인용 방식을 놓고 과학자들 간에 윤리적 논란이 벌어지고 있는 가운데  미국 과학·공학·의학 아카데미(NASEM)에서 관련 보고서를 발표해 큰 주목을 받고 있다.

컴퓨팅 데이터를 대상으로 한 논문 인용 방식을 놓고 과학자들 간에 윤리적 논란이 벌어지고 있는 가운데 미국 과학·공학·의학 아카데미(NASEM)에서 관련 보고서를 발표해 큰 주목을 받고 있다. ⓒ NASEM

NASEM, 연구자들에게 창의적 복제 권고 

미 의회 역시 깊은 관심을 갖고 과학계 리더들을 통해 연구를 진행해왔다. 그리고 8일 이 난제를 다룬 보고서가 최근 미국 과학·공학·의학 아카데미(NASEM)를 통해 발표됐다. 보고서 제목은 ‘Reproducibility and Replicability in Science’.

8일 ‘유레칼러트(eurekalert)’, ‘기즈모도’ 등에 따르면 ‘복제’로 번역되고 있는 ‘리프로듀시빌리티(reproducibility)’와 ‘리플리커빌리티(replicability)’라는 용어는 일반인들 사이에 혼용이 가능할 정도로 매우 유사한 의미를 담고 있다.

그러나 NASEM 보고서에서는 이 두 용어를 엄격히 구분하고 있다.

과학 논문 안에는 컴퓨터를 활용해 도출한 다양한 자료들이 포함돼 있다. 이 자료들은 연구자들마다 다르게 고안한 분석‧처리 방식을 통해 제각기 다른 형태로 표출된 독특한 내용들이 포함돼 있다.

보고서는 연구자가 다른 논문에 있는 컴퓨터에 의한 연구 결과를 인용할 경우 ‘리프로듀시빌리티(reproducibility)’라고 표현하고 있다. 인용한 자료 안에 들어 있는 컴퓨터와 관련된 모든 데이터 처리 방식을 포괄하는 말이다.

따라서 이 인용 방식은 다른 논문에 들어 있는 데이터를 물론 그 데이터가 도출된 과정에서 활용된 컴퓨터와 관련된 방법론, 분석‧처리 과정 등을 모두 활용하는 것이 된다.

반면 ‘다른 논문과 같은’ 과학적 의문을 해결하기 위해 다른 논문에서 사용한 컴퓨터와 관련된 방법론, 분석‧처리 방식, 데이터 등을 활용하지 않고 자신만의 독특한 방식으로 데이터를 도출해내는 것이 ‘리플리커빌리티(replicability)’다.

보고서는 이 인용 방식을 활용할 경우 다른 논문에 있는 연구 방식과 유사한 방식을 사용할 수 있으나 자체적으로 특색 있는 연구 방식과 데이터를 인용하는 만큼 연구 결과에 있어서도 다른 논문과 차이가 있는 고유한 데이터를 도출하게 된다고 밝혔다.

“연구 재생산보다 혁신 도모해야” 

보고서는 또 이 인용 방식이 엄격한 기준에 의해 지켜질 경우 이전에 진행됐던 컴퓨터와 관련된 연구 방식을 더 발전시켜 더 엄밀한 분석이 이루어지고 혁신적인 연구 결과를 도출하는데 큰 도움을 줄 수 있을 것으로 내다봤다.

이번 보고서 작성을 이끈 ‘고든 앤 베티 무어 재단(Gordon and Betty Moore Foundation)’의 하비 파인버그 (Harvey Fineberg) 이사장은 “끊임없이 발표되고 있는 과학논문들 속에는 이 두 가지 인용 방식이 다수 포함돼 있다”고 말했다.

파인버그 이사장은 “다른 논문에 있는 데이터를 그대로 가져와 사용하는 것과 연구 방식을 수정해 새로운 데이터를 도출하는 것과는 큰 차이가 있다”며, “연구 발전을 위해 이 인용 방식에 차별화가 이루어져야 한다”고 주장했다.

그는 또 “차별화를 위해 연구 투자자들, 과학언론, 학술기구, 정책담당자, 그리고 과학자들 모두 노력을 기울여야 한다.”고 강조했다.

“장기적인 안목에서 연구 발전을 위해 ‘리프로듀시빌리티(reproducibility)’와 ‘리플리커빌리티(replicability)’를 엄격히 구분해 그 연구 성과를 평가해 나가는 수준 높은 연구평가 기준을 마련해야 한다”며, 관계자들의 관심을 촉구했다.

디지털 시대를 맞아 수많은 연구 결과들이 인터넷 등을 통해 서로 정보를 주고받으며 과학적 지식을 축적해나가고 있다.

과학적 성공을 꿈꾸며 성장하고 있는 젊은 과학자들 역시 컴퓨터를 통해 쏟아져 나오는 수많은 정보를 접속하고, 이를 연구 활동에 접목시켜 뛰어난 연구논문을 작성하기 위해 치열하게 컴퓨팅 훈련을 받고 있는 중이다.

그러나 이런 환경 속에서 과학자들이 어떤 방식으로 과학적 데이터를 다뤄야 하며, 연구 결과를 어떤 식으로 공유하고 발표해야 하는지 등에 대해 뚜렷한 연구 윤리 기준이 마련돼 있지 않은 상황이다.

이에 보고서는 “남의 논문에서 컴퓨터 처리 방식과 데이터를 그대로 가져와 인용하는 ‘리프로듀시빌리티(reproducibility)’ 방식이 관행화될 경우 과학적 연구 결과에 재생산이 확대되겠으나 근본적인 혁신을 도모하기 힘들다”며 새로운 기준 마련을 촉구했다.

보고서는 복잡한 컴퓨터 처리 과정에 의해 다양한 데이터가 도출되고 있는 만큼 논문 형식 안에 그 방법론에 대한 영역을 만들어 그 내용을 공개할 수 있도록 해야 한다고 주장했다.

그동안 과학 논문의 질을 놓고 연구자들 사이에 벌어진 갈등은 심리학, 의료계와 관련돼 집중적으로 제기돼왔다. 다른 연구에 적용되는 컴퓨터 분석 및 처리 방식을 가져와 약간의 연구를 더 가미한 후 세간의 주목을 끌기 위해 발표되는 논문들이 범람하고 있다는 것.

일부 과학자들은 이런 사태에 직면해 과학계 연구현장에 연구윤리와 관련된 법적인 잣대를 적용할 필요가 있다고 주장해왔다.

이런 주장이 거세지면서 과학계는 물론 정치계까지 새로운 기준을 마련하기 위한 방안을 모색해왔다. NASEM의 이번 보고서는 연구현장에서 컴퓨팅과 관련된 그동안의 논쟁을 종식하고, 관련법을 제정할 수 있는 계기가 될 것으로 보인다.

의견달기(0)