사이언스타임즈 로고

정보통신기술
김준래 객원기자
2013-02-14

과거를 분석해 미래를 예측한다 뉴스 데이터를 활용한 미래 예측 시스템

  • 콘텐츠 폰트 사이즈 조절

    글자크기 설정

  • 프린트출력하기

영화 ‘마이너리티 리포트(Minority Report)’에 나오는 3명의 예지자는 아직 일어나지 않은 범죄를 미리 예방하기 위해, 미래에 나타날 범죄를 사전에 알아내는 ‘프리 크라임(pre-crime)’ 시스템으로 미래예측을 활용하는 모습을 보여준다.

▲ 영화 '마이너리티 리포트'에서 '프리크라임'으로 범죄를 예측하고 있다. ⓒMinority Report Homepage
이와 같이 공상과학 영화에서나 나올 법한 일들이 어느덧 현실로 다가오고 있어 흥미를 더하고 있다. 다만 이런 현실이 영화와 다른 점이라면 영화 속의 범죄예측 시스템은 초능력자의 예지 능력에 의존하는 반면, 현실에서는 웹사이트 기사와 각종 기록물 같은 데이터를 과학적으로 분석하여 이를 예측에 활용한다는 것이다. 

미래를 예측하는 과학적 분석방법이란 다양한 정보기술력의 혼합체로 설명할 수 있다. 통계처리와 데이터마이닝, 그리고 게임이론 등과 정보기술들에 근거해 미래에 벌어질 일들을 예측하는 기술들을 응용한 융복합 시스템이라 생각하면 된다. 특히 최근의 예측분석 모델은 빅데이터들 속에서 일정한 패턴을 발견해 여기서 미래 예측에 필요한 정보를 분석하는 기법을 주로 사용하고 있다.

미래를 예측하는 소프트웨어 등장

이처럼 예측 분석에 대한 관심이 날로 높아지고 있는 상황에서 최근 미국 매사추세츠공대(MIT)가 발간하는 과학기술 전문저널인 ‘테크놀러지 리뷰(Technology Review)'는 온라인 판을 통해, 과거 보도했던 뉴스의 기사들을 토대로 하여 앞으로 미래에 닥칠 일을 예측할 수 있는 소프트웨어가 개발되었다고 보도했다.

테크놀러지 리뷰에 실린 연구 보고서에 따르면, 마이크로소프트사와 이스라엘 연구진이 공동으로 개발한 이 시제품 단계의 프로그램이 뉴스 기사에 등장하는 다양한 내용들을 분석하여 질병 유발이나 소요사태 발생과 같은 사건들의 발생 유무를 예측하고 제시하는 역할을 수행하고 있는 것으로 나타났다.

▲ 과거의 뉴스 기사들을 토대로 미래에 닥칠 일을 예측하는 소프트웨어가 개발되었다. ⓒRecorded Future

과거의 기사들을 조합해 미래의 일을 예측하는 방법에 대해 공동 연구진이 밝힌 개발과정을 참조하면 다음과 같다. 1973년의 뉴욕타임스를 보면 방글라데시의 가뭄 관련 기사가 게제된 것을 알 수 있고, 1년 뒤인 1974년에는 방글라데시의 콜레라 유행 관련 기사가 실린 것을 확인할 수 있다.

이런 현상은 10년 뒤 다시 반복되어 1983년의 방글라데시에는 가뭄 발생 기사가, 그리고 역시 1년 뒤인 1984년에는 콜레라로 인한 사망 기사가 실려 있는 것을 볼 수 있다. 이처럼 유사한 과거 기사들을 조합하는 방식으로 미래 일을 예측할 수 있다는 것이 공동 연구진의 설명이다.

과거 자료 분석을 통해 미래를 예측한다

이번에 개발된 미래 예측 시스템은 기존의 히스토리 데이터(History Data)를 대상으로 한 실험에서 힌트를 얻은 것으로 전해지고 있다. 예를 들어, 2006년도에 앙골라에서 발생한 가뭄 사태는 향후 콜레라 발생에 대한 중요한 징후가 될 수 있었다고 예측되었는데, 이는 가뭄 이후에 콜레라가 창궐한다는 이전의 관련 사건들 분석을 통해 파악을 했기 때문이다.
▲ 최근의 예측분석 모델은 빅데이터를 활용하고 있다. ⓒRecorded Future
이외에, 앙골라에서의 콜레라 발생에 대한 또 다른 징후로 2007년도의 아프리카 지역에서 나타난 거대 폭풍들도 연관되어 있다고 미래 예측 시스템은 제시하고 있다. 이처럼 질병이나 폭동, 그리고 대량 사망과 같은 부분의 예측에 대해 미래 예측시스템이 제시하는 경고내용은 거의 70%에서 90% 정도의 정확도를 가지고 있다고 연구진은 자신하고 있다.

이번에 개발된 미래 예측 시스템은 1986년부터 2007년까지 22년 간의 뉴욕타임즈 기사 내용을 토대로 구축되었고, 주요 사건들이 벌어질 때마다 인터넷을 통하여 필요한 데이터들을 수집하여 활용하는 접근방법을 취하고 있는 것으로 알려졌다.

현재 공동 연구진을 이끌고 있는 호르비츠(Horvitz) 박사는 “미래 예측 시스템을 통한 테스트를 통하여 증명된 성과가 향후 실제 상황에서 사용될 때, 전문가들의 지원을 통해 더욱 개선된 버전으로 나타날 수 있다”고 언급하면서 “특히 정부 당국의 관련 부처 전문가들이 이 프로젝트에 참여할 수 있다면 시스템 성능은 배가될 수 있을 것으로 기대한다”고 밝혔다.

이와 관련하여 공동 연구개발에 참여하고 있는 마이크로소프트사의 관계자도 “현재 미래 예측 시스템은 정부 당국 등이 질병 발병이나 기타 문제를 다루는 데에 더욱 선험적인 접근이 가능하도록 지원할 수 있다”고 하면서 “이와 같은 연구들은 사용자들에게 있어 향후 발생 가능한 부분을 예측하고 이에 대한 영향을 분석하여 대비하도록 하는데 기여할 수 있을 것”이라고 전망했다.

미래 예측 소규모 데이터 시장, 이미 존재

한편 상용화된 예측 도구를 위한 소규모 데이터 시장은 이미 존재하는 것으로 파악되고 있다. 이 중 ‘레코디드퓨쳐(Recorded Future)’라는 명칭의 벤처기업은 온라인과 기타 소스로부터 도출한 데이터를 사용하여 미래에 발생 가능한 부분들이 무엇인지를 예측하는 소프트웨어를 개발하여 제공하고 있는 회사로 알려져 있다.

레코디드퓨쳐 사는 그동안 미래에 무엇이 일어날지에 대한 힌트를 찾기 위해 인터넷으로부터 실시간 데이터를 수집하는 도구를 개발해 왔다. 이 회사의 검색 도구는 과거 뿐만 아니라 미래로 확장되는 시간축에 대한 결과들을 대량으로 쏟아낼 수 있는 기능을 갖고 있는 것으로 나타났다.

▲ 미래 예측 결과들은 다양한 유형으로 재가공된다. ⓒRecorded Future

구글과 같은 기존의 검색 엔진들은 순위를 매기고 다른 웹페이지를 연결하기 위해 링크들을 사용한다. 반면에 레코디드퓨쳐 사의 소프트웨어는 온라인에 서술된 사람이나 장소, 그리고 이벤트간의 ‘보이지 않는’ 연결들을 추적하기 위해 페이지들의 내용을 분석함으로써 더 깊고 넓은 수준을 제공한다.

가령, 약품 회사인 머크(Merck) 사에 대한 정보 검색은 매출에 대한 최신 뉴스 뿐만 아니라 웹사이트 임상시험에 다양한 약물의 시험이 등록되었는지에 대한 시간 정보를 보여준다. 그리고 또다른 검색 결과는 다양한 뉴스들이 페이스북(Facebook)을 언제 처음 공개할지를 예측하는 내용들을 쏟아내는 것을 보여준다.

레코디드퓨쳐 사는 결과를 보여주는 시간표를 만들어내는 검색을 수행하기 위해 온라인 인터페이스를 제공하는 것 뿐만 아니라, 고객들이 애플리케이션 프로그래밍 인터페이스(API)를 통해 도구의 데이터와 분석을 도표화하는 소프트웨어를 작성하는 것을 가능하게 해주는 서비스를 제공함에 따라 미래 예측 시장의 선도적 위치를 차지하고 있다는 것이 관계자들의 공통된 의견이다.

김준래 객원기자
joonrae@naver.com
저작권자 2013-02-14 ⓒ ScienceTimes

태그(Tag)

관련기사

목록으로
연재 보러가기 사이언스 타임즈에서만 볼 수 있는
특별한 주제의 이야기들을 확인해보세요!

인기 뉴스 TOP 10

속보 뉴스

ADD : 06130 서울특별시 강남구 테헤란로7길 22, 4~5층(역삼동, 과학기술회관 2관) 한국과학창의재단
TEL : (02)555 - 0701 / 시스템 문의 : (02) 6671 - 9304 / FAX : (02)555 - 2355
정기간행물 등록번호 : 서울아00340 / 등록일 : 2007년 3월 26일 / 발행인 : 정우성 / 편집인 : 윤승재 / 청소년보호책임자 : 윤승재
한국과학창의재단에서 운영하는 모든 사이트의 콘텐츠는 저작권의 보호를 받는 바 무단전재, 복사, 배포 등을 금합니다.

사이언스타임즈는 과학기술진흥기금 및 복권기금의 지원으로 우리나라의 과학기술 발전과 사회적 가치 증진에 기여하고 있습니다.