가짜를 만드는 진짜 기술의 발달

딥페이크 관련 콘텐츠 생산 급증에 따른 부작용 잇달아

최근 몇 년 사이 ‘팩트 체크(Fact Check)’라는 말이 유행처럼 번졌다. ‘팩트(Fact)’의 사전적 의미는 ‘지어낸 것이 아닌 사실’이다. 그러므로 팩트 체크는 가짜와 진짜를 구별하는 것. 일반적으로 사실을 오독할 수 있는 가능성, 오류 등을 가려내는 필터링으로 활용된다. 하지만 요즘의 팩트 체크가 점검해야 하는 대상은 과거의 가짜와는 다른 차원의 것이다. 가짜를 만드는 기술이 점차 발달하고 있기 때문이다.

팩트와 페이크의 변별이 어려운 시대가 도래했다. ⓒ 게티이미지

가짜를 만드는 기술, 딥페이크

전 세계적으로 딥페이크(Deepfake)와 이를 활용한 콘텐츠가 확산되고 있다.

딥페이크는 딥러닝(deep learning)과 가짜(fake)의 합성어로, 원본 이미지나 동영상 위에 다른 영상을 중첩하여 가공하거나, 새로운 콘텐츠를 생성하는 기술이다. 주로 특정 인물의 얼굴과 음성을 학습한 후 다른 인물과 합성하는 방법으로 활용되고 있으며, 영화, 음악 등 다양한 분야의 활용이 기대되는 기술이기도 하다.

딥페이크를 구성하는 핵심기술은 ‘생성적 대립 신경망(Generative Adversarial Networks, GAN)’이다. 생성 모델과 감별 모델이 공존하는 이 기술은 생성 모델이 데이터를 학습하여 진짜에 가까운 데이터를 만들고, 감별 모델은 생성 데이터의 가짜를 찾아내는 과정을 반복한다. 이 과정에서 서로를 ‘적대적 경쟁자’로 인식하여 상호 발전하고, 점점 더 실제에 가까운 거짓 데이터를 만들어내는 것이다. 이렇게 진짜 같은 가짜를 만들어내는 생성적 대립 신경망 연구의 발전은 급속히 증가하고 있으며, 이에 따라 딥페이크가 확산되고 있다.

딥페이크는 원본 이미지나 동영상 위에 다른 영상을 중첩하여 가공하는 기술이다. ⓒgettyimagesbank

가짜는 진실을 말하지 않는다?

지난 1월, 틱톡(TikToc) 운영사인 중국 바이트댄스가 딥페이크 서비스를 만들었다는 보도에 유력 외신들은 큰 우려를 나타냈다. 페이스북, 마이크로소프트, AWE 등 세계 13개국 100개 파트너사로 결성된 ‘AI 파트너십(Partnership on AI)’이 지난해 12월에 ‘딥페이크 감지 챌린지(DFDC, Deepfake Detection Challenge)’를 개최한 목적도 동일하다. 바로 딥페이크의 부작용 때문이다.

딥페이크의 부작용을 알리고, 악용을 막기 위한 ‘딥페이크 감지 챌린지(DFDC, Deepfake Detection Challenge)’가 열렸다. ⓒDFDC 홈페이지 (https://deepfakedetectionchallenge.ai)

딥페이크라는 용어는 2017년 미국의 커뮤니티 사이트 레딧(Reddit)의 이용자 ‘deepfake’가 유명인의 얼굴을 성인 영상물에 합성한 동영상을 유포하고, 이것이 주목을 받는 데서 유래했다.

기술적인 측면에서 다양한 산업적 활용의 가능성을 잠재하고 있음에도 불구하고 처음 언급된 용어의 기저 의미처럼 지금까지의 딥페이크 활용은 매우 부정적이다. 주로 가짜 뉴스와 포르노 영상 등에 악용되고 있고, 그에 따른 부작용도 크다.

소프트웨어정책연구소의 2020년 2월 이슈리포트에 따르면, 2019년 9월 기준 1만 4678건의 딥페이크 영상 중 성인물이 전체의 96%를 차지하고 있으며, 영상 조회수가 1억 4000만 뷰에 이른다. 그뿐만 아니라 페이스북 CEO 저커버그의 인터뷰 조작 영상, 미국의 하원의원 낸시 펠로시의 발언 조작 영상 등 유명인사의 조작된 영상이 SNS를 통해 유포되었다.

딥페이크를 어떻게 활용할 것인가

소프트웨어정책연구소는 딥페이크 영상이 확산된 최근 2년간(2018~2020년)의 소셜 빅데이터를 분석한 결과도 함께 발표했다.

딥페이크의 언급 분석 결과 첫째, 딥페이크의 언급 양이 증가한 시점마다 사회, 문화적으로 이슈를 발생시키는 딥페이크 콘텐츠가 등장하였다. 둘째, 예술, 경영, SW 개발 관련 직군의 언급 비중이 높고, 영화·음악, 정치와 관련되어 언급이 되고 있다. 셋째, 딥페이크 발생 초기에는 Reddit을 통해 전파되다 이후 트위터가 주요 채널이 되었다.

이 분석에 따르면 딥페이크 콘텐츠와 언급양은 증가 추세이며, 향후 다양한 SNS와 딥페이크 기술이 결합되면 확산 폭이 더욱 확대될 것으로 예상된다. 딥페이크의 주요 기술인 GAN을 활용한 딥페이스랩(DeepFaceLab), 페이스스왑(Faceswap) 등 오픈 소스 영상 합성 프로그램이 배포되면서 더욱 성행한 것과 동일한 사이클이다.

딥페이크 언급양 분석 ⓒ소프트웨어정책연구소 2020-2월 이슈리포트

딥페이크의 감성 분석 결과 딥페이크에 대한 부정적 인식이 긍정적인 인식에 3배 이상으로 강하게 나타났다. 또한 딥페이크에 대한 세부 감정은 슬픔이 가장 크고, 두려움과 즐거움이 유사한 비중으로 나타났다. 그러나 딥페이크의 발생 초기보다 즐거움에 대한 감정은 감소하고, 슬픔과 두려움에 대한 감정이 증가하는 추세를 보인다.

이 분석은 딥페이크 기술의 명과 암을 여실히 보여주는 결과다. 여전히 부정적인 인식이 큰 비중을 차지하고 있다는 것은 딥페이크의 현주소, 즉 어두운 측면을 반영한다. 그러나 초기에 즐거움에 대한 감정이 컸고, 여전히 존재하고 있다는 것은 향후 산업적 활용에 방향성을 보여주는 결과인 셈이다.

딥페이크 인식 및 세부 감정 분석 ⓒ소프트웨어정책연구소 2020-2월 이슈리포트

앞으로 딥페이크 기술은 더욱 발전하고, 기술이 보편화되면서 접근 또한 용이해질 전망이다. 그러나 이것이 여전히 기술윤리적 측면에서 언급되는 것은 단순히 재미, 유희로만 소비되지 않기 때문이다. 개인은 물론 정치, 사회에 악영향을 미칠 수 있다는 우려가 현실로 드러나고 있기 때문이기도 하다. 하지만 이 기술의 순기능과 더불어 기술을 압제하는 것은 올바른 대처가 아니라는 목소리 또한 높다. 지금부터라도 기업과 정부는 이 기술의 위험 요소를 최소화한 사업 모델을 발굴하여 다양한 산업적 활용과 긍정적 모멘텀을 만들어야 할 것이다.

 

 

 

(4853)

태그(Tag)

전체 댓글 (0)

과학백과사전