December 15,2019

AI 민주화 시대로 ‘성큼’

데이터 분석뿐 아니라 AI 구현도 쉬워져

FacebookTwitter

지난 10월 시장 조사 전문 기관 ‘가트너(Gartner)’는 2020년에 주목받을 10대 유망 추세를 발표했다. 그중 전문성의 민주화(Democratization of Expertise)가 눈에 띈다. 가트너는 일반인도 전문가처럼 데이터 분석 기술을 활용할 수 있을 것으로 전망한 셈이다.

참고로 가트너는 이를 위해 2023년 4가지 관점의 변화가 예상된다고도 언급했다. ‘데이터 분석의 민주화’, ‘개발의 민주화’, ‘설계의 민주화’ 그리고 ‘정보기술(IT) 전문 지식의 민주화’가 이에 해당한다.

정리하면, 일반인도 전문성 민주화 추세에 따라 데이터 분석 전문가의 역할을 부분적으로 수행할 수 있다. 그리고 이를 시민 접근성(Citizen Access)으로 표현했다.

시민 데이터 과학자의 등장

전문성의 민주화 추세는 갑자기 등장한 것이 아니다. 2015년 가트너는 시민 데이터 과학자(Civil Data Scientist)라는 기술 용어를 처음 언급했다. 그리고 이러한 용어가 확산되어 사용되기 시작했다.

해당 기술은 단어에서도 유추할 수 있듯이 일반인도 전문가처럼 데이터 분석 업무를 수행할 수 있게 한다. 일반인이라는 용어가 애매할 수 있는데, 일반인은 데이터 분석이 본인의 주요 업무가 아닌 사람으로 생각하면 된다.

자동화되는 데이터 분석 ⓒpxhere

자동화되는 데이터 분석 ⓒpxhere

데이터 분석은 고도의 지식과 훈련을 요구할 정도로 전문성을 가진 업무이다. 데이터 분석을 위해서는 분석하는 데이터가 속한 영역의 이해도 중요하다. 그래야만 분석할 데이터 대상을 추출할 수 있기 때문이다.

사이버 보안 분야를 예로 들어보자. 데이터 분석가는 과거에 있었던 사이버 공격의 패턴을 도출해야 한다. 그러기 위해서는 사이버 공격은 어떤 방식으로 이뤄지는지를 이해해야 한다. 그래야만 데이터 생성 요소와 분석 대상을 정할 수 있다.

그뿐만 아니라, 데이터 분석에 필요한 모델을 선정해야 한다. 이는 일반인이 접근할 수 없다. 분석 모델 유형을 모르기 때문이다. 가시화 영역도 중요하다. 데이터 분석만은 의미가 없다. 통찰력을 제공할 수 있도록 정보를 가공해야 한다. 참고로 이러한 가시화를 ‘능동형 지능(Actionable Intelligence)’이라고 표현한다.

그런데 이러한 전문성의 진입 장벽이 시민 데이터 과학으로 낮아지고 있다. 다시 말해, 해당 기술이 분석 데이터 선정, 분석 모델 선정 그리고 가시화 등을 쉽게 할 수 있도록 지원해준다. 이에 따라, 일반인은 데이터 분석 전문성 없이도 스스로 데이터 분석이 가능하다. 참고로 이를 ‘자기 스스로의 분석(Self-Service Analytics)’이라고 한다.

가트너는 2020년에 이러한 현상이 보편화될 것으로 전망하고 있다. 데이터 분석 업무의 40%가 자동화될 것으로 전망했기 때문이다.

정리하면, 시민 데이터 과학자 혹은 데이터 분석 업무 자동화는 일반인에게 두 가지 측면의 전문성을 요구하지 않게 한다.

첫째는 데이터 분석의 전문성이다. 데이터 분석에 필요한 전문적인 기법이 필요 없다. 분석 툴이 자동으로 적합한 분석 기법을 선택하기 때문이다.

둘째는 영역 특수성의 이해이다. 데이터 추출을 위해서는 분석 영역의 특수성 이해가 필요하다. 그런데 데이터 추출도 자동화되기 때문에 이러한 이해가 필요 없다.

자동화된 기계학습과 AI 민주화 시대의 등장

AI에서도 데이터 분석이 중요하다. ⓒFlickr

AI에서도 데이터 분석이 중요하다. ⓒFlickr

전문성의 민주화는 데이터 분석에서 더욱더 확대될 전망이다. AI 영역으로도 확대될 전망이다. 기계학습 등장이 AI에서 데이터 분석을 중요시하게 했기 때문이다. AI는 사람의 지능을 흉내 내는 기술이다. 흉내 내는 방법으로는 ‘규칙 적용’과 ‘데이터 삽입’이 있다.

규칙 적용은 말 그대로 사람이 동작 규칙을 직접 만들어 AI에 적용하는 것이다. 이러한 AI는 복잡 영역에 적용하기에 어려움이 있다. 사람이 무수히 많은 변수를 고려한 규칙을 만드는 것은 거의 불가능에 가깝기 때문이다.

반면 데이터 삽입은 AI가 데이터를 통해 스스로 학습하게 하는 방법이다. 이는 복잡 영역에도 적용할 수 있다. AI가 스스로 데이터를 학습하면서 규칙을 자동으로 만들기 때문이다.

여기서 AI에 데이터가 적용된다는 점이 중요하다. 데이터 분석처럼 AI 구현에서도 데이터가 활용된다. 다시 말해, 학습 데이터 제공 유형과 기계학습 모델 선정이 중요하다. 데이터 과학이 AI에서도 중요해진 셈이다.

AI 구현에서도 데이터 과학 전문성이 요구되는 셈이다. 그런데 AI 구현에도 시민 데이터 과학자와 같은 추세가 발생하면서, 구현 난이도가 낮아지고 있다. AI 구현에 있어 학습 방법론 자동화 기술이 등장했기 때문이다.

참고로 이러한 현상을 AI 민주화라고 한다. AI 민주화는 AI 구현이 보편화할 정도로 쉬워짐을 의미한다. 일반인도 AI를 구현할 수 있을 정도로 말이다.

이처럼 AI 민주화가 가능한 이유는 ‘자동화된 기계학습(AutoML, Automated Machine Learning)’이라는 기술이 있었기 때문이다. 해당 기술은 AI에 필요한 학습 데이터 유형 추출에서 기계학습 알고리즘 선정까지의 업무를 자동으로 처리한다.

결국, 데이터 시민 과학자는 AI 민주화로 확대되고 있다. 공통점은 두 영역 모두 데이터 분석이 중요하다는 것이다. 다만, 다른 점은 일반인의 수행 능력 범위가 단순 데이터 분석에서 서비스 구현으로 확대되는 것이다.

의견달기(0)