September 17,2019

데이터와 개인 정보의 공존 방법은?

국가생명윤리포럼 개최…비식별 정보로 해결 모색

FacebookTwitter

디지털 기술의 발전은 우리의 생활 전반을 데이터 중심 환경으로 바꿔가고 있다. 4차 산업혁명의 원동력이라 할 수 있는 사물인터넷과 인공지능 기술이 발전하면서 빅데이터라는 정보의 바다가 하루에도 수백만 개씩 만들어지고 있기 때문이다.

여기서 주목할 점은 단순히 데이터가 생성되는 것으로만 그치는 것이 아니라, 데이터를 활용한 정보 주체의 권리도 함께 강조되고 있다는 사실이다. 다양한 데이터가 매일 생성되고 보관되는 상황에서, 한편에서는 데이터 활용을 촉진하고자 하는 움직임이 활발하게 진행되고 있는 반면에 다른 한편에서는 정보 주체의 권리 보호를 주장하는 목소리가 커지고 있는 것이다.

특히 보건 의료 분야는 정보의 민감성으로 인해 그 어느 분야보다도 활용과 보호의 대립이 첨예하게 맞서고 있는 상황이다. 보건 의료 데이터와 ICT 기술의 결합에 대한 관심과 시도가 증가하고 있지만, 그에 못지않게 데이터 활용에 대한 공익과 개인의 프라이버시 침해를 우려하고 있어서 조화로운 균형을 통한 해결방안 모색이 시급하다고 할 수 있다.

데이터의 활용과 개인정보 보호의 조화로운 공존을 모색하는 자리가 마련됐다 ⓒ 김준래/ScienceTimes

데이터의 활용과 개인정보 보호의 조화로운 공존을 모색하는 자리가 마련됐다 ⓒ 김준래/ScienceTimes

이에 국가생명윤리심의위원회는 지난 21일 쉐라톤강남호텔에서 ‘2019 국가생명윤리포럼’을 개최하여 보건의료 데이터의 활용과 개인 정보 보호의 조화로운 공존을 모색하는 자리를 마련했다.

‘보건의료 빅데이터의 활용과 정보주체 보호의 거버넌스’라는 주제로 열린 이번 행사는 보건의료 데이터의 활용 움직임과 개인 정보 보호 정책이 충돌하는 현실의 문제점을 살펴보고, 이를 해결할 수 있는 방안을 전문가들과 함께 찾아보자는 취지로 마련되었다.

충돌하고 있는 데이터 활용과 개인 정보 보호

‘보건의료 빅데이터의 안전한 활용 및 정보주체의 보호를 위한 법제 개선방향’이라는 주제로 기조발제를 맡은 가천대의 최경진 교수는 “데이터를 활용하려는 움직임과 개인 정보를 보호해야 한다는 목소리가 조화를 이뤄야 하지만, 현실은 그렇지 못하다”라고 말했다.

실제로 최 교수의 말처럼 현실에서의 데이터 활용과 개인 정보 보호는 그 접점을 찾지 못하고 있는 상황이다. 예를 들어 질병관리본부의 경우 오는 2021년까지 희귀질환자 등 2만명을 대상으로 대규모 바이오 빅데이터 체계를 구축하는 계획을 최근 발표한 바 있다.

개인정보 개념과 범위 ⓒ 가천대학교

개인정보 개념과 범위 ⓒ 가천대학교

하지만 이 계획이 제대로 진행될지는 미지수라는 것이 업계의 시각이다. 개인의 신분을 드러낼 여지가 조금이라도 있는 데이터는 수집과 가공, 그리고 활용이 불가능하기 때문이다. 현행 개인정보보호법은 주민등록번호처럼 개인을 특정할 수 있는 데이터뿐만 아니라 다른 정보와 결합해 개인의 신분이 드러날 가능성이 있는 데이터도 개인 정보로 정의하고 있다.

최 교수는 “누가 데이터 사업을 한다고 말만 꺼내도 논란거리가 되는 것이 현실”이라고 밝히며 “개인 정보를 남용하는 것은 반대하지만, 이를 가공하여 개인 임을 식별하기 어렵게 만든 정보라면 데이터 산업의 발전을 위해서라도 사용할 수 있어야 한다”라고 주장했다.

첨단 기술로 가공한 비식별 정보로 개인 정보 보호 가능

얼굴 사진이나 이름, 또는 주민등록번호처럼 보는 즉시 대상자를 떠올릴 수 있는 정보는 명백한 개인 정보다. 하지만 이를 가공하여 별도의 해석 과정 없이는 대상자임을 알 수 없는 정보로는 △가명 정보 △비식별 정보 △익명 정보 등이 있다.

가명 정보는 개인 정보에 가명 처리를 하여 생성된 정보를 말한다. 개인 정보이지만, 다른 정보와 결합하지 아니하고는 더 이상 합리적인 방법으로 특정 개인임을 알아볼 수 없는 정보라는 의미다. 비식별 정보 역시 가명 정보처럼 다른 정보와 결합하지 아니하고는 특정 개인을 알아볼 수 없도록 만든 개인 정보를 가리킨다.

반면에 익명 정보는 개념이 조금 다르다. 개인 정보에 별도의 처리를 하여 생성한 정보라는 것은 가명 정보나 비식별 정보와 같지만, 원본의 개인 정보와 대조하거나 다른 정보와 결합하더라도 특정 개인임을 알아볼 수 없도록 하는 조치를 뜻한다.

최 교수는 “가명 조치나 가명화 과정을 거치는 가명 정보는 개인 정보이지만 비록 유출이 된다 하더라도 위험성이 낮다”라고 설명하며 “특히 건강 정보나 성생활 정보, 또는 유전자 검사 정보 같은 민감한 정보들은 가명 조치나 가명화 과정을 통해 안정성을 확보할 필요가 있다”라고 강조했다.

자율성 보장 비례성에 기반한 책임성의 확보 ⓒ 가천대학교

자율성 보장 비례성에 기반한 책임성의 확보 ⓒ 가천대학교

최 교수의 발표에 따르면 데이터 활용과 개인 정보 보호의 조화를 위해서는 ‘이익형량론’과 ‘데이터 이동권’이 바탕이 되어야 하는 것으로 나타났다.

이익형량론은 현행법이 너무 엄격하여 합리적 해석을 하기 어렵게 만든다고 판단된다면, 사후적으로 충돌하는 이해관계를 조정할 수 있는 이익형량 규정을 별도로 신설하는 방안을 의미한다.

또한 데이터 이동권은 유럽연합(EU)이 개인정보보호규정(GDPR)을 통해 마련한 규제로서, 정보 주체가 자신의 데이터를 요청하고 이를 표준 포맷으로 받아 다른 기업과 경쟁자에 넘길 수 있는 권리를 가리킨다. 글로벌 기업들에 집중화되고 있는 데이터 독점 문제를 해소할 수 있는 방안 중 하나로 꼽힌다.

인공지능 기술이 본격화되기 전만 하더라도 데이터 독점에 대한 우려는 그리 크지 않았다. 쓰나미에 비유할 정도로 방대한 데이터가 매일 생성되고 있고, 특정 기업이 데이터를 독점한 사례도 없었기 때문이다.

그러나 인공지능이 머신러닝을 넘어 딥러닝을 채택하면서 상황이 바뀌고 있다. 딥러닝은 데이터 의존성이 높아서 데이터를 많이 확보할수록 정보의 정확성이 높아지기 때문에 구글과 같이 데이터를 쓸어 담는 기업들이 등장하고 있는 것이다.

최 교수는 이익형량론과 데이터 이동권이 반영된 개인정보 보호법제의 나아갈 방향으로 △법 해석 적용의 통일 △안전한 활용을 통한 보호의 실현 △독립성 확보 △전문성 확보 △분야별 특수성 반영 보장 등을 제시하며 발표를 마무리했다.

의견달기(0)