빅 데이터가 이슈로 떠오른 것은 불과 2~3년 전이다. 빅 데이터를 떠받쳐줄 분석·처리 기술들이 등장했기 때문이다. 대표적인 기술이 '하둡(Hadoop)'이다. 그동안 처리하기 힘들었던 빅 데이터를 여러 컴퓨터에 병렬로 분산시켜 처리할 수 있는 기술이다.
여러 개의 컴퓨터를 마치 하나인 것처럼 묶었기 때문에 저장 공간의 문제, 처리 능력의 문제 등을 해결해 준다. 그 실례로 최근 KT가 도입한 하둡 기반의 빅 데이터 플랫폼은 그동안 스마트폰 증가로 문제가 돼왔던 통화 폭주, 이용자패턴 분석 등의 문제를 해결하고 있는 중이다.

실제로 많은 기업들이 이 하둡을 사용해 빅 데이터를 처리하고 있다. IBM, 오라클, MS 등 기존 RDBMS(관계형DB관리시스템) 업체를 비롯 SAS, 인포메티카 등 데이터 분석업체들까지 하둡과의 연결을 시도중이다.
세계 교육계 ‘데니터 마이닝’ 기술에 주목
데이터 마이닝(Data Mining) 역시 각광을 받고 있는 기술이다. 다양한 데이터 중에서 상호 관계를 분석해 필요한 정보를 추출해 내는 기술을 말한다. 적절히 활용할 경우 사건과 사건과의 관련, 사건과 사건 간의 연속성, 데이터들의 움직임 등 이전에 볼 수 없었던 새로운 사실들을 알아낼 수 있다.
최근 이 기술의 발전은 놀라울 정도다. 최근 뉴욕타임즈에 보도에 따르면 스탠퍼드・컬럼비아대학교와 MS사 연구진은 이 기술을 활용해 항우울제의 일종인 '파록세틴'(paroxetin)과 고지혈증치료제인 '프라바스타틴(pravastatin)‘의 동시복용에 따른 부작용을 발견했다고 밝혔다.
그런데 그 연구방식이 매우 이색적이다. 연구진은 지난 2010년도에 있었던 약 8천만 건의 검색기록을 구글, MS, 야후 등으로부터 넘겨받았다. 그리고 이 두 약물을 동시 복용할 때와 따로 복용할 때로 나누어 분석한 후 동시 복용할 때 과혈당증(hyperglycemia)을 유발할 가능성이 매우 높다는 것을 밝혀냈다.
데이터 마이닝 기술을 활용한 최초 사례다. 이전에 구글이 자사 검색엔진을 활용해 독감 조기 감지 시스템 ‘구글 플루 트렌드(Google Flu Trend)’를 구축한 것 역시 데이터 마이닝 기술과 무관하지 않다.
세계 교육계 역시 이 데이터 마이닝 기술에 주목하고 있다. 이 기술을 도입할 경우 학생들의 학습방식, 교사들의 교수법, 교육 관련 통계관리, 교육 정책 연구와 수립 등 여러 분야에서 효율적인 활용이 기대되고 있기 때문이다.
‘학습 애널리틱스’ 기술로 미래 예측 가능
영동대학교 임베디드소프트웨어학과의 최제영 교수는 '스마트환경에서의 빅데이터 동향'이란 제목의 보고서를 통해 “온라인 교육현장에서 수집된 학습 데이터를 분류하고, 관계를 찾아나감으로써 새로운 예측 모델이 가능하다”고 말했다.
또 “이 예측 모델은 개별화 학습 시스템을 구성하는 데 중요한 역할을 할 것이며, 이를 토대로 학습 지원을 더 다양화할 수 있을 것”으로 내다봤다. 학생, 교사 등 관계자들에게 이전에 볼 수 없었던 피드백을 제공해주고, 결과적으로 학습형태를 개선하는 데 큰 도움을 줄 것이라는 전망이다.
‘학습 애널리틱스(learning analytics)'도 주목받고 있는 기술 중의 하나다. 데이터 마이닝이 데이터들 상호관계에 초점을 맞추고 있다면 이 기술은 컴퓨터과학, 수학, 통계학 등을 이용해 대량의 데이터 속에서 유용한 정보를 추출해 내는 능력을 갖고 있다.
데이터 마이닝 기술은 분석을 위해 통계학, 기계학습 등의 기술을 사용해 특정 상황에 대한 추론 모델을 적용한다. 반면 학습 애널리틱스는 정보과학, 사회학, 심리학, 통계학, 컴퓨터과학, 교육학 등에서 적용하고 있는 개념들을 활용한다.
데이터 마이닝처럼 학습 과정을 분해하는 것이 아니라 추론을 통한 피드백을 통해 미래 진행될 학습을 예측하고, 학생들 능력과 수준에 맞도록 교육을 지원하는 데 초점을 맞추고 있다. 위기의 학생을 중재하고, 이전에 추출한 피드백을 학생들에게 제공하는 방식을 취한다.
이를테면 학생과 교과과정 간의 연관관계를 발견하고, 어떤 교육전략이 더 효과적이고, 견고한 학습을 낳을 수 있는지 알아내는 데에 학습 애널리틱스 기법을 활용할 수 있다.(계속)
- 이강봉 객원편집위원
- aacc409@naver.com
- 저작권자 2013-03-11 ⓒ ScienceTimes
관련기사