소셜미디어 속 여론을 제대로 파악하는 방법?

신개념 데이터 분석 기술 '오피니언 마이닝' 기법 각광

글로벌 통합정보 분석 기업인 N사는 최근 코로나19와 관련된 소셜미디어 데이터 분석 결과를 발표했다. 그 결과 국민 건강을 위협하는 코로나19에 대해 많은 국민들이 관심을 갖고 있으면서도 불안에 떨고 있다는 사실을 데이터 분석 기법을 통해 파악할 수 있었다.

특히 소셜미디어 상에 등장하는 가짜 뉴스의 확산으로 인해 혼란과 불안감이 가중되고 있다는 점도 지적했다. 그러나 희망적인 의견도 제시했다. 소셜미디어의 순기능을 활용해 국민들 스스로 올바른 정보를 널리 확산하고 심리적인 불안을 해소하며 어려운 상황을 슬기롭게 헤쳐나가기 위한 노력도 함께 나타나고 있다는 점을 지적한 것이다.

코로나19와 연관된 소셜미디어 데이터 분석 결과는 우려와 도움을 요청하는 여론이 높은 것으로 나타났다 ⓒ pixabay

이 회사는 어떻게 그 수많은 소셜미디어를 통해 코로나19와 관련된 여론의 동향을 파악할 수 있었을까. 이에 대해 관련 분야 전문가들은 오피니언 마이닝(opinion mining) 기법을 활용하면 과거에 파악할 수 없었던 소셜미디어 상의 잠재된 의견을 읽어낼 수 있다고 조언한다.

여론과 의견을 유용한 정보로 재가공

오피니언 마이닝이란 인터넷 웹사이트와 소셜미디어에 나타난 여론과 의견을 분석해서 유용한 정보로 재가공하는 기술이다. 일종의 ‘신개념 데이터 분석 기술’이라 할 수 있다.

따라서 오피니언 마이닝을 활용하면 사람들이 특정 제품 및 서비스에 대해 긍정적인지 부정적인지에 대해 분석할 수 있고, 여기서 한발 더 나아가 그 원인까지 도출할 수 있다.

특히 정치나 경제, 또는 사회적으로 특정한 사안들이 발생했을 때, 여론이나 대중의 관심도가 실시간으로 어떻게 변하는지를 확인할 수 있는 것은 오피니언 마이닝이 가진 강점이라 할 수 있다.

오피니언 마이닝 기법이 본격적으로 세상에 알려지게 된 것은 지난 2012년에 진행됐던 미국의 대통령 선거전 덕분이다. 당시 오바마 대통령의 재선을 위해 노력했던 선거 캠프는 오피니언 마이닝 기법을 통해 막대한 선거자금을 모집할 수 있었다.

오피니언 마이닝이란 소셜미디어에 나타난 여론과 의견을 분석해서 유용한 정보로 재가공하는 기술을 말한다 ⓒ piqsels

원래 오피니언 마이닝은 오픈마켓이나 소셜커머스 같은 전자상거래 시스템과 함께 발전하기 시작했다. 상품을 직접 눈으로 보거나 손으로 만져볼 수 없는 전자상거래의 특성상 해당 상품을 먼저 구입했던 소비자들의 구매 후기가 커다란 영향을 미치면서, 오피니언 마이닝 기법에 대한 연구가 본격적으로 시작된 것이다.

소비자 입장에서 보면 수많은 구매 후기들 중에 실제로 상품을 구입하여 사용해 본 소비자들의 후기가 긍정적인지 또는 부정적인지를 구별할 필요가 있다. 반면에 판매자의 입장에서는 방대한 양의 구매 후기들 중에서 상품에 대한 소비자들의 반응을 아는 것이 필요하다.

이런 이유로 소비자들이나 판매자들 모두 자연어 처리 및 텍스트 마이닝 같은 기법을 활용하여 대량의 데이터 속에서 유용한 정보를 찾아내는 방법을 찾기 시작했고, 결과적으로 오피니언 마이닝이라는 기법이 탄생하게 된 계기가 됐다.

생각과 의견을 통계화하고 수치화

오피니언 마이닝 기법을 활용하면 네티즌들이 올리는 댓글이나 포스팅 등의 텍스트에서 긍정적 성향과 부정적 성향을 분류하여 더 객관적이고도 정확하게 상품이나 서비스의 평판을 파악할 수 있다. 인터넷에 올려져 있는 텍스트를 분석해서 네티즌들의 감성과 의견을 통계화하고 수치화하여 객관적인 정보로 바꿀 수 있다는 의미다.

물론 사람들이 일상적으로 사용하는 말이나 글을 의미 있는 정보로 변환한다는 것이 결코 쉬운 일은 아니다. 특히 우리말인 한글은 형용사와 부사 등 꾸미는 말이 다양하고, 웹사이트나 소셜미디어에서는 정제되지 않은 언어로 표현하는 경우가 많기 때문에 그 수많은 표현들을 수치화시키기에 어려움이 크다는 것이 전문가들의 의견이다.

예를 들어 ‘작다’라는 어휘가 세탁기를 평가하는 사용 후기에서 사용될 경우에는 ‘용량이 작다’라는 의미이기 때문에 부정적인 의미를 갖는다. 반면 똑같이 ‘작다’라는 표현이지만 휴대폰의 사용 후기에서는 소지하기 간편하다거나 귀엽다는 긍정의 의미로 해석될 수 있다. 따라서 상황 정보에 대한 고려 없이 단순히 ‘작다’라고만 표현된다면 잘못된 결과가 나타날 수도 있는 것이다.

이 같은 오류를 피하기 위해 오피니언 마이닝은 텍스트 속에 포함된 진정한 의미를 찾기 위해 단계별 분석 기법을 도입하고 있는데, 첫 번째 기법으로는 인터넷상에 올려져 있는 글이 주관적인지 또는 객관적인지를 결정하는 ‘주관성 분석’을 들 수 있다.

텍스트에 나타난 글쓴이의 태도가 주관적인지 혹은 객관적인지를 판단하는 분석 기법인 오피니언 마이닝 ⓒ pixabay

이는 주어진 텍스트에 나타난 글쓴이의 태도가 주관적인지 혹은 객관적인지를 판단하는 분석 기법이다. 여기서 주관적이라고 하는 것은 긍정적 또는 부정적 의견을 포함하는 것이고, 객관적이라고 하는 것은 감정적으로 중립 상태임을 표시한다.

두 번째인 ‘극성 분석’은 주어진 텍스트가 주관적인 의견을 갖고 있을 경우 긍정인지 혹은 부정인지를 분류하는 기법이다. 이 기법을 적용하기 위해서는 분석하려는 글의 핵심 어휘나 신조어들을 미리 정의해 둘 필요가 있다. 특히 온라인상에서는 특정한 시기마다 유행하는 신조어가 올라오기 때문에 신속하게 업데이트하는 것이 중요하다.

마지막으로 ‘극성의 정도 분석’은 주관적으로 쓰인 글에 대해 긍정적인 정도와 부정적인 정도를 측정하는 기법이다. 이 기법을 잘 활용해야만 오피니언 마이닝을 통해 제대로 된 정보를 확보할 수 있다.

이처럼 오피니언 마이닝은 자칫하다가는 엉뚱한 방향으로 흐를 수 있는 까다롭고 복잡한 기법이다. 하지만 그만큼 전망도 밝다. 온라인 여론에 더욱 귀를 기울이고, 이를 활용해서 마케팅 전략을 세우려는 기업들이 증가하고 있기 때문이다.

또한 오피니언 마이닝 기법을 이용하다 보면 모래알처럼 흩어져 있던 온라인상의 텍스트 데이터가 보다 가치 있는 정보로 변모하는 과정을 체험할 수 있기 때문에 보다 예측가능하고 정확한 전략을 수립할 수 있다.

이와 같이 온라인과 소셜미디어의 여론 관리에 대한 중요성이 그 어느 때보다 부각되고 있는 상황에서 오피니언 마이닝 기법은 기업이나 단체의 의사결정에 있어 필수적인 설루션이 될 것으로 전망되고 있다.

(379)

뉴스레터 구독신청
태그(Tag)

전체 댓글 (0)

과학백과사전