데이터스토리텔링, 통찰 수준을 넘어야

빅데이터 가치와 의미 전달할 수 있어야

“빅데이터가 화두가 되면서 더욱 스토리텔링에 관심이 모아지고 있습니다. 그런데 아직까지 데이터스토리텔링에 대한 개념 정리가 덜 된 채 사용되고 있습니다.”

지난 1일, 인터랙티브 디지털 콘텐츠 회사인 DME의 최재원 대표는 데이터사이언스 컨퍼런스에서 “데이터스토리텔링 개념 정의가 시급하다”고 말했다.

보통 데이터라고 하면 과학적이고 분석적인 이미지를 갖고 있다. 반면 스토리는 창작적인 요소를 가진 예술적 분야로 느껴진다. 데이터스토리텔링이 이질적 분야의 결합이라고 볼 수 있는 이유이다. 그러나 그럼에도 불구하고 인터넷이나 신문에서는 빅데이터를 다루는 데이터사이언티스트의 중요한 자질 중 하나로 데이터스토리텔링으로 꼽고 있다.

현재 데이터스토리텔링을 데이터 시각화의 동의어로 여겨

그럼 현재 데이터스토리텔링 용어는 어떻게 쓰이고 있을까. 최 대표는 “논문이나 신문을 통해 보는 데이터스토리텔링은 거의 데이터 시각화의 동의어로 쓰이고 있다”고 답했다.

복잡한 데이터를 그래픽화 하거나 단순화 한다는 것은 알아보기 쉽게 하기 위함이다. 통찰력을 도출하는 데도 필요하다. 한마디로 ‘데이터마이닝 + 시각화’인 셈이다. 여기서 의문 하나가 생긴다. ‘데이터스토리텔링이 이 정도 수준이면 되는가?’이다.

솔직히 데이터스토리텔링을 데이터의 시각화로만 한정해서 보면 아름답고 보기 좋다. 문제는 데이터에서 어느 정도 규칙적인 패턴이 보이기는 하지만 이를 통해 얻을 수 있는 인사이트(insight)가 단순하다는 데 있다. 만약 이 정도 수준에서 끝난다면 데이터스토리텔링이 중요하다고 강조할 수도 없다.

▲ DME 최재원 대표 ⓒ디지털스토리텔링학회


최 대표는 “통찰의 수준을 넘어서 그 이상이어야만 제대로 된 데이터스토리텔링”이라고 강조하면서 “그렇게 이루어져야만 빅데이터의 가치와 의미를 제대로 전달할 수 있는 역할을 해낼 수 있을 것”이라고 설명했다.

데이터스토리텔링은 의사결정과 본연의 의미와 가치를 전달해야

어떤 사회적 현상이 과학적으로 인정받기 위해서는 인과관계가 있어야 하고 합리적 추론도 가능해야만 한다. 즉 이야기 속에 어떤 규칙적 구조가 있어야 한다고 볼 수 있다. 그런데 사회 속에서 무수히 넘쳐나는 데이터들은 무질서하다.

하지만 실타래처럼 얽혀있는 변수와 현상의 관계성을 발견하게 되면 과학이 된다. 디지털스토리텔링은 여기에 의사결정과 본연의 의미와 가치를 전달해야 한다. 어떻게 보면 데이터를 분석하고 메시지를 던지는 과정과도 유사하다고 볼 수 있다.

파키스탄의 무인정찰기 ‘드론’의 민간인 피해를 보여주는 ‘out of sight, out of mind(http://drones.pitchinteractive.com/)’는 ’스토리텔링 데이터 비줄라이제이션‘의 좋은 사례이다. 파키스탄에서 드론의 사용되기 시작한 해, 사망자 수, 이와 관련한 중요한 사건을 시각화한 이 그래프는 이제는 사람들의 기억에서 멀어지고 있는 아프가니스탄의 참혹상을 환기시키고 있다.

이 안에서는 오바마가 대통령이 되면서 갑작스럽게 사망자 수가 더 증가하고 있음을 보여주고 있다. 또한 미국 정치와 파키스탄과 연계된 중요한 이슈도 드러내고 있다. 왜 이런 참혹적인 사건이 나는지 그래프를 보는 사람들은 인과관계를 통해 추론이 가능하기도 하다. 그래프의 색깔도 붉은 색깔을 이용했다. 사망자가 급속히 늘어날 때는 화면이 온통 붉은 색으로 뒤덮인다. 그야말로 전쟁의 참혹상을 그대로 보여주고 있는 셈이다.

최 대표는 “파키스탄에서 드론의 사용을 시작한 것이 마치 이야기의 발단처럼 보인다. 그리고 폭격으로 인한 절정과 결말까지 짜임새 있는 스토리 한편을 보는 느낌을 전달한다”고 말했다. 그는 이 그래프가 데이터스토리텔링의 좋은 예로 보는 이유를 “굉장히 많은 민간인이 살상됐다는 사실을 감정적으로 공감이 되도록 했기 때문”이라고 덧붙여 설명했다.

사람이 인지구조와 심리를 고려한 데이터스토리텔링이 이루어져야

그렇다면 왜 꼭 스토리를 덧입혀야만 하는 것일까. 사람의 인지적 구조가 불완전해서라고 할 수 있다. 하버드 대학에서 영상 속 흰옷을 입은 사람들이 패스를 몇 번했는지 맞추라고 한 후, 중간에 영상 속에서 고릴라를 지나가게 했다. 실험에 참여한 사람들은 패스에 집중하느라 고릴라가 지나간 것을 인지하지 못한 사람이 50%나 된다. 이는 사람들이 보여주는 것을 모두 받아들이는 것이 아니라 선택적으로 받아들이고 있음을 보여준 연구라고 할 수 있다.

사람들은 인과관계가 확실한 이야기 구조를 좋아하기 때문이기도 하다. 회사 동료에게 “내 차 도둑맞았어” 라고 하면, 동료는 “차가 어디에 있었느냐, 색은 무엇이냐, 언제 사건이 발생했느냐, 어떻게 도둑맞게 됐느냐” 등을 묻는다. 부족한 정보를 채워 인과관계를 확실히 하기 위한 질문인 것. 즉 불완전한 인과관계 이야기를 불편해한다고 볼 수 있다.

최 대표는 “빅데이터라는 복잡한 데이터를 스토리텔링을 할 때 심리적 측면도 고려해야 한다”면서 “이는 판단과 결정이라는 행위가 언뜻 생각하기에는 뇌의 같은 영역에서 이루어지는 것처럼 보이지만 실상 판단은 합리적이고 과학적인 좌뇌에서 하고, 결정은 감정적이고 정서적인 우뇌에서 하기 때문”이라고 언급했다.

데이터를 분석하는 이유는 의사결정에 반영하기 위한 것이 크다. 따라서 감정적 호소가 이루어져야만 그 데이터의 의미 전달이 더 정확히 제대로 전달될 수 있다. 아쉽게도 아직 데이터스토리텔링 연구는 가이드 수준을 벗어나지 못하고 있다. 물론 데이터 시각화 패턴 연구도 이루어지고는 있지만 아직은 걸음마 단계라고 할 수 있다.

최 대표는 “데이터를 가져와서 감으로 혹은 미적으로 하는 것이 아닌 심리적 인지적 측면을 잘 활용해야만 비과학적인 것을 과학적인 것으로 바꿀 수 있는 데이터스토리텔링이 될 수 있다”며 “바로 이것이 빅데이터의 본질을 가치와 부합되는 것”이라고 자신의 생각을 밝히며 강연을 마무리했다.

(5816)

뉴스레터 구독신청
태그(Tag)

전체 댓글 (0)

과학백과사전