세계 최대 소셜네트워킹서비스(SNS)인 ‘페이스북(Facebook)’의 가입자 수가 최근 12억 명을 넘어섰다. 또한 그 뒤를 잇는 ‘트위터(Twitter)’의 회원 수는 5억 명 이상이며, 하루 평균 한 번 이상 접속하는 사용자만 해도 2억 명에 달한다. 양대 SNS 회원들이 하루에 올리는 게시물의 수는 상상을 초월한다.
이 같은 수많은 SNS 메시지들에서 여러 정보 간의 상관성을 조사해 숨겨진 의미를 찾아내는 ‘데이터 마이닝(Data Mining) 기법’을 여기에 결합하게 되면 생각지도 못했던 새로운 가치들이 창출될 수 있다.
예를 들어 아직 본격적으로 의미가 탐지되지 않은 신제품이나 서비스에 대한 보다 집약화된 의견들을 얻을 수 있고, 얼리어댑터의 관심사가 무엇인지도 알 수 있다. 또 새롭게 주목해야 할 트렌드가 무엇이며, 대중들의 싫고 좋음의 선호가 무엇에 의해 결정되는지를 파악할 수 있다.
SNS는 하루 24시간 1년 내내 휴대폰이나 브로드밴드망을 통해 연결되어 있으며, 셀 수 없는 수많은 사용자들이 개인 의견을 피력하고 다른 사용자들의 의견에 접하기도 하면서 새로운 사실들을 제공하고 있기 때문이다. 따라서 이 같은 알고리즘에 기반을 둔 데이터 마이닝 기법을 활용하면 이전과는 비교도 되지 않은 빠른 속도로 정보의 교환 및 의미 있는 가치의 추출이 가능하다.
미국 로체스터대학의 컴퓨터과학 연구진이 개발한 ‘엔이메시스(nEmesis)’는 트위터 상에 올라오는 수많은 게시물 중 음식물로 인한 질병과 관련된 지리 데이터를 선별해 식중독 발병이 의심되는 식당을 실시간으로 예측하는 시스템이다.
식중독 발병 의심 식당 실시간으로 예측
사람들은 SNS에서 음식에 관해 이야기하는 것을 좋아하며, 특히 무엇인가가 잘못되었을 때는 더욱 그런 경향이 많다. 따라서 ‘배가 아프다’거나 ‘토하다’ 등과 같은 키워드를 포함하고 있는 트위터의 게시물을 모니터해 그들이 식사를 한 식당을 추적하면 식중독 발병이 의심되는 식당을 실시간으로 예측할 수 있다. 즉, 독감의 확산을 막기 위해 데이터를 검색하는 ‘구글 플루 트렌드(Google Flu Trends)’와 비슷한 방식인 셈이다.
연구진은 엔이메시스로 약 4개월 동안 뉴욕시에 있는 9만4천 명의 트위터들로부터 380만 개의 게시물을 선별해 식중독 발병 위험이 높은 480개의 식당 목록을 예측했다. 그 후 그 식당 목록을 뉴욕시 공중보건 당국에서 조사한 식당 검열 결과와 비교해 보았더니 실제로 약 3분의1이 일치하는 것으로 확인됐다.
하지만 엔이메시스를 개발한 연구진은 그 같은 비교결과를 시스템의 적중률과 동일시할 수 없다는 입장을 밝혔다. 엔이미시스는 실시간으로 트위터 상의 모든 정보를 분석하지만, 뉴욕시 보건 당국의 식당 검열은 한정된 시간에만 간헐적으로 이루어지고 있으므로 실제 일어난 식중독 발병 사례를 모두 기록하는 것이 실질적으로 불가능하기 때문이다. 또한 일부 트위터 사용자들이 어떤 특정한 식당을 공격하기 위해 이 시스템을 나쁘게 이용할 가능성도 있다.
따라서 24시간 실시간으로 제공되는 엔이메시스 자료와 뉴욕시 공중보건 당국의 공조체제가 이루어진다면 더욱 정확한 식중독 발병 식당에 대한 최신 정보를 제공할 수 있을 것이라고 연구진은 밝혔다.
SNS에 올라오는 방대한 양의 게시물을 활용해 우울증과 같은 기분장애 질환의 치료 및 예방에 대한 실제적인 정보를 얻을 수 있는 온라인 툴도 개발되었다. 호주연방과학기술원(CSIRO)의 연구원들이 우울증연구소를 위해 개발한 이 시스템은 시간에 따라 사회․경제적 및 환경적 요인에 의해 커뮤니티의 정신 건강이 어떻게 변하는지를 실시간을 알 수 있게 해준다. 이러한 요인들에는 날씨 및 하루의 시간, 자연재해에 대한 뉴스, 경제 상황에 대한 소식 등이 포함된다.
이 시스템은 분당 3만 2천 개 이상 올라오는 방대한 양의 트위터 게시물에 대처하기 위해 아마존 웹서비스인 키네시스 플랫폼(Kinesis platform)을 이용하고 있는데, 분 단위로 감정적인 트렌드를 분석할 수 있는 것이 특징이다. 또한 전 세계의 위치와 성별에 따라서 결과들을 더 세밀하게 분석할 수도 있다.
SNS 활용한 새로운 비즈니스
한편, SNS를 통해 새로운 비즈니스를 창출하는 사례도 점차 늘고 있다. 미국 뉴욕에 소재하는 ‘데이터쿱(Datacoup)’라는 벤처기업은 최근 소셜 미디어 계정과 신용카드 거래에 대한 정보를 제공하고 이를 현금 형태로 보상받도록 한 새로운 형태의 비즈니스를 선보였다.
즉, 사용자들이 자신의 페이스북이나 트위터 같은 소셜 미디어 계정과 신용카드나 직불카드에 대한 거래기록 젱보를 제공하는 대가로 1개월에 8달러를 지급 받을 수 있는 베타 버전을 개발해 운용 중인 것으로 전해진다.
데이터쿱이 이 비즈니스를 개발한 목적은 젊은 층의 앞서가는 소비 트렌드 정보가 필요한 기업들에게 맞춤 정보를 제공하고 이를 통해 수익을 창출하도록 하기 위함이다. 물론 기업들에 제공되는 정보에는 민감한 프라이버시에 관한 정보는 제거된다. 데이터쿱의 발표에 의하면 약 1천500명의 사용자들이 베타 버전에 가입했으며, 조만간 다른 일반 사용자들에게도 이 비즈니스를 공개할 예정이라고 한다.
다음커뮤니케이션의 벤처 육성 조직인 ‘다음 NIS’에서 최근에 출시한 ‘카드인(Kardin)’도 SNS를 활용한 새로운 사업 모델 창출의 좋은 사례 중 하나에 속한다. 이 상품은 이용자의 종이명함을 SNS로 지인들에게 공유한 후 종이명함이나 변경된 내용을 업데이트하면 지인들에게 공유되었던 명함이 자동으로 업데이트되는 모바일 소셜 명함 애플리케이션이다.
이 앱은 종이명함을 휴대폰 등으로 촬영한 후 사진 및 프로필, SNS 계정, 관심사 등 자신의 정보를 추가해 SNS로 공유할 수 있어 승진 및 이직, 창업과 같은 이용자의 비즈니스 현황뿐만 아니라 인맥 관리도 효율적으로 할 수 있다는 장점을 지닌다. 또한 명함을 받은 이용자는 SNS에서 마음대로 명함을 열고 저장할 수 있으며, 받은 명함을 최신, 회사, 이름 순으로 쉽게 확인할 수 있다.
한편, 일부에서는 SNS를 활용한 데이터마이닝 기법이 개인정보를 침해할 가능성이 있으므로 적절한 규제가 필요하다는 주장을 하고 있다. 데이터마이닝 자체가 나쁘다는 것이 아니라 SNS로 공유된 개인정보가 여러 가지 방식으로 활용될 수 있으니 SNS 이용자들이 그 같은 상황을 염두에 두고 SNS를 이용해야 한다는 것. 또한 SNS 정보에 대한 오남용을 통제할 수 있는 정부 차원의 관리도 필요하다고 주장한다.
- 이성규 객원편집위원
- 2noel@paran.com
- 저작권자 2014-06-03 ⓒ ScienceTimes
관련기사