September 23,2019

스마트 기기서 동작하는 AI 개발 박차

차세대 미래 먹거리로 부상 중인 ‘AI 경량화’

FacebookTwitter

지난 8월 인공지능(AI) 스피커가 화두로 떠올렸다. 주요 화두는 AI 스피커의 사생활 침해 여부였다. 네이버에서 개발한 AI 스피커 ‘클로바’가 음성 정보를 취득한다는 사실이 도마 위에 오른 것이다.

취득 목적은 음성 인식률 향상이었다. 네이버는 이를 근거로 해명했으나 효과가 없었다. 그래서 지난 6일 음성 수집 여부를 결정할 수 있는 ‘옵트아웃(Opt-Out)’ 기능을 클로바에 업데이트했다. 사용자는 해당 기능을 통해 음성 수집 여부를 결정할 수 있다.

AI 스피커의 음성 수집 문제는 국내에서만 발생한 게 아니다. 해외에서도 이러한 문제가 이슈화된 적이 있다. 아마존, 구글, 애플 등이 음성 정보를 수집한 것이다.

지난 5월 워싱턴포스트지는 AI 스피커가 개인 정보를 수집하는 문제를 다룬 기사를 집중적으로 보도했다. 이에 해당 기업 역시 사용자가 선택적으로 음성 수집 여부를 결정할 수 있게 했다.

이들 기업의 음성 수집 목적은 음성 인식 정확도 향상일 가능성이 높다. 수집 방식을 자세히 들여다봐도 사생활을 침해할 부분이 거의 없다. AI 스피커는 특정 음성 명령을 인식해야지 동작한다. 이때 음성을 저장하는 것이다. 그러므로 AI 스피커가 사용자 몰래 도청하는 것이 아니다.

음성 판별 작업에서도 개인 정보 침해 부분을 최소화하려는 노력이 보인다. 우선 거의 모든 기업이 전체 데이터의 1%에서 2% 내의 데이터만 추출한다. 그리고 작업자는 음성 데이터를 문자로 옮기는 작업하고 이를 AI 스피커에 전달한다. AI 스피커는 이러한 데이터를 학습함으로써 정확도를 향상할 수 있다.

문제는 이러한 과정에서 사생활 침해가 발생할 수 있다. 그러나 AI 스피커 제공 기업은 음성 데이터 생산지를 숨기기 때문에 개인 정보 노출 위험은 적다.

사이트 방문 정보, 검색 정보 등이 오히려 개인 정보를 침해할 여지가 높다. 이들 데이터는 마케팅에 활용될 수 있지만, 무작위 추출 음성 데이터는 사용될 곳이 없다.

클라우드 방식이 정보 침해 가능성 높여

그러나 찝찝하기는 마찬가지이다. AI 스피커 기기가 도청하지 말라는 법이 있을까? 해킹을 당할 수도 있다. 아울러 음성 데이터는 중앙 서버에 계속 쌓이게 되는게, 사실 중앙 서버에 쌓이는 것이 진짜 문제다.

AI 스피커는 인식한 음성에 따라 자체적으로 동작하는 것이 아니라 중앙 서버의 AI 지원을 받는다. 스피커 자체 기기만으로 음성을 제대로 인식하기는 어렵기 때문이다. 이러한 이유로, 음성 데이터가 특정 기관의 중앙 서버에 쌓일 수밖에 없다. 물론 명령어, 화자 인식 등과 같은 단순 인식은 기기에서 동작할 수 있다.

사실 이 부분은 AI 스피커뿐만 아니라 중앙 서버 기반으로 동작하는 클라우드 방식의 고유 문제점이기도 하다. 국내 기업이 클라우드 도입을 꺼리는 이유이기도 하다.

클라우드 방식은 컴퓨팅 자원을 빌려 쓸 수 있는 장점이 있으나, 중요 정보를 유출할 위험이 있다. 국내에서 클라우드를 구축하더라도, 사설 클라우드(Private Cloud) 형태인 경우가 많다. 참고로 사설 클라우드는 내부에 클라우드 센터를 만들어 자체 클라우드를 운영하는 형태이다.

사설 클라우드는 내부 자체적으로 구축한 클라우드이다. ⓒ Pixabay

사설 클라우드는 내부 자체적으로 구축한 클라우드이다. ⓒ Pixabay

AI 가볍게 하는 경량화 기술

많은 기업이 AI 서비스 제공에 있어 클라우드 방식을 선호한다. AI에 필요한 컴퓨팅 파워를 중앙에서 원격으로 지원받을 수 있기 때문이다. 그러나 개인 정보 침해라는 문제가 있다.

해결책은 있다. 클라우드에 의존하지 않을 만큼 AI를 경량화하는 것이다. 다시 말해, 중앙 서버가 아닌 일반 스마트 기기에 사용할 수 있을 만큼 AI를 경량화하는 것이다. 실제로 이러한 연구가 진행되고 있다.

참고로 이를 AI 경량화 기술이라고 부른다. 2017년 11월 MIT 테크놀로지 리뷰는 재미있는 앱을 소개했다. 해당 앱은 구글에서 개발한 것으로 누군가 스마트폰을 뒤에서 바라보면 이를 알려주는 서비스를 제공한다. 이는 스마트폰 사용자의 화면에 담긴 개인 정보를 보호하게 한다.

원리는 단순하다. 앱이 스마트폰 카메라를 통해 인식된 얼굴 행동을 보고 스마트폰을 엿보는지 여부를 판별한다. 그런데 이를 위해서는 AI 기술 적용이 필요하다. 실제로 AI를 적용했다. 그런데 해당 앱은 스마트폰 자체에서 동작이 가능하다. 다시 말해, AI를 스마트폰 내에서 자체 구동시킨 것이다. 이러한 구동이 가능한 이유는 구글의 자체 AI 경량화 기술을 사용했기 때문이다.

텐서플로우(TensorFlow)는 구글에서 제공하는 AI 알고리즘 플랫폼이다. 개발자는 텐서플로우를 통해 AI 개발에 필요한 알고리즘을 지원받을 수 있다. 2년 전 구글은 AI 경량화 기술을 제공하는 텐서플로우 라이트를 선보였다. 해당 플랫폼을 이용하면 스마트폰뿐 아니라 저사양 기기에서도 IT 서비스를 이용할 수 있다.

애플은 AI 경량화 전문 기술을 보유한 스타트업을 작년 11월에 인수했으며, 경량화된 AI를 가지고 이미지 인식 서비스를 제공하고 있다.

중국 알리바바도 AI 경량화 기술을 연구하고 있다. 지난 9월 알리바바는 모바일 뉴럴 네트워크(MNN)라는 AI 알고리즘을 선보였다. 해당 알고리즘은 텐서플로우 라이트처럼 스마트폰뿐만 아니라 저사양 기기에서도 AI 서비스를 구현할 수 있게 했다.

국내에서도 이러한 기술을 연구하고 있다. 대표적으로 삼성전자를 들 수 있다. 지난 7월 삼성전자는 AI 경량화 기술을 선보였다. 삼성전자에 따르면, 기술력은 세계 최고이다. 기존 기술 대비 4배 이상 더 가벼워졌고, 8배 이상 더 빨라졌기 때문이다.

AI 효율적인 하드웨어도 개발

AI 경량화 알고리즘은 소프트웨어 개발에 관한 부분이고, 이러한 연구 외에도 AI에 적합한 하드웨어 개발 연구도 진행되고 있다.

이러한 분야에 대표 주자로 엔비디아(NVIDIA)를 꼽을 수 있다. 직렬처리프로세서(CPU)가 아닌 병렬처리방식의 그래픽처리프로세서(GPU)로 AI 처리 효율성을 높였다.’ 최근에는 AI의 딥러닝 구동 방식을 그대로 모방한 하드웨어가 개발 중이다. 이를 뉴로모픽(Neuromorphic)이라고 부른다. 일부 스마트폰에 이미 탑재돼 있다.

현재는 AI를 중앙 서버에 구현하는 방식으로 주로 진행되고 있다. 그러나 앞으로 AI 관련 연구는 스마트 기기에도 AI를 쉽게 구현할 수 있게 한다. 이로 인해 정보 침해 문제도 줄어들게 될 전망이다.

IBM의 뉴로모픽 하드웨어 ⓒ Flickr

IBM의 뉴로모픽 하드웨어 ⓒ Flickr

의견달기(0)