NPU, 스마트폰의 AI 서비스 견인

2020년, 스마트폰 전용 AI칩 경쟁 치열할 것으로 전망

인공지능(AI) 시대라고 할 만큼 AI가 주목받는 시대이다. 지난 10월 가트너는 10대 유망 기술을 발표했는데, 놀라운 사실은 그중 4개 기술이 AI와 관련 있었다.

이는 AI가 전 세계에 미칠 영향력이 그만큼 크기 때문이다. 프라이스워터하우스쿠퍼스(PwC)는 2030년에 AI가 세계에 미칠 파급 효과를 경제적 가치로 환산해 전망한 적이 있다. PwC 전망에 따르면, AI는 2030년에 15.7조 달러(약 1.9경 원)의 파급효과를 유발한다.

이는 국내총생산(GDP) 1위인 미국의 GDP와 맞먹는 수치이고, 3위인 일본 GDP의 4배에 달한다. 한국 GDP의 10배 이상 달하는 수치이다. 이처럼 AI는 거의 모든 산업에 영향을 미칠 전망이고, 4차 산업혁명을 이끄는 주요 기술이다.

이러한 AI에는 클라우드가 뒤따르는 경우가 많다. 많은 사람이 AI가 높은 컴퓨팅 자원을 요구하는 것으로 생각하기 때문이다. 클라우드처럼 고사양 하드웨어를 갖춘 인프라가 필요한 셈이다.

이러한 이유로, 클라우드 서비스 제공자는 고사양 하드웨어 인프라를 갖추지 못한 중소기업을 대상으로 이러한 인프라를 대여하는 서비스에 관해 적극적으로 홍보하고 있다. 이를 서비스형 인공지능(AIaaS)이라고 하는데, 중소기업은 요금을 지불하고 필요 자원을 제공받을 수 있다. 아마존웹서비스(AWS), 마이크로소프트(MS)의 애저(Azure), 구글 클라우드, 네이버 비즈니스 플랫폼(NBP) 등 거의 모든 클라우드 서비스에서 AIaaS를 제공하고 있다.

 

클라우드와 같은 환경에서 모든 AI 서비스를 제공할 수 없어

그런데 여기서 한 가지 의문점이 들 수 있다. AI 구현과 동작은 반드시 고사양 하드웨어를 갖춘 환경에서만 가능한 것일까? 스마트폰의 일부 AI 서비스를 예로 들어보자.

주요 스마트폰에는 음성 AI 기능이 탑재돼 있다. 그리고 이를 실행하는 음성 명령어가 있다. 삼성 빅스비의 경우, ‘하이 빅스비’라고 말하면 화자와 음성을 동시에 인식해 반응한다. 혹은 얼굴 인식, 홍채 인식 등 AI 기반 생체 인증을 생각해보자.

물론, 이러한 기능은 클라우드가 아닌 스마트폰에서 자체적으로 동작한다. 간단하게 생각해보자. 스마트폰의 음성 명령어 인식이 중앙 서버에서 동작한다면, 스마트폰은 주위 음성을 모두 중앙 서버로 동작해야 한다. 이는 현실적으로 불가능하다. 그리고 네트워크 통신 장애를 일으킬 수 있다. 수많은 네트워크 통신이 중앙 서버로 흘러가기 때문이다. 그뿐만 아니라, 개인정보보호 문제의 소지 위험도 있다. 사생활 관련 음성 내용을 중앙 서버로 보내는 꼴이기 때문이다.

얼굴 인식도 생각해보자. 중앙 서버는 스마트폰에서 인식한 얼굴 정보를 네트워크를 통해서 모두 검증해야 한다. 이 또한 서버에 과부하를 줄 수 있다.

 

NPU, 스마트폰 전용 AI칩

AI 구현에 특화된 AI 전용 반도체 ⓒ pixabay

AI 구현에 특화된 AI 전용 반도체 ⓒ pixabay

AI는 고사양을 요구하는 경우가 많다. 그러나 모든 곳에 그래야만 하는 것은 아니다. 그러므로 기기 자체에서 AI를 구현하고 동작하는 것이 추세가 될 전망이다. 이를 가트너 10대 유망 기술에서도 유추할 수 있다.

10대 유망 기술 중에서 “강화된 엣지(Empowered Edge)”와 “자동화된 기기(Autonomous Things)”가 있다. 강화된 엣지는 클라우드가 아닌 기기 자체에서 컴퓨팅 자원을 활용해 서비스를 제공하는 기술 추세를 뜻한다. AI 서비스 또한 이에 해당한다고 볼 수 있다. 자동화된 기기는 AI의 자동화 기기를 기기에 구현하는 기술 추세를 뜻한다. AI를 클라우드에서 구현할 수 있다. 그러나 강화된 엣지를 활용해 기기 자체 내에서도 이를 구현할 수 있다.

이러한 추세는 스마트폰에서 두드러지고 있는데, 스마트폰은 일부 AI 서비스를 자체적으로 제공하고 있기 때문이다. 이는 AI 전용칩 등장과도 연관이 깊다.  AI 전용칩은 AI 구현에 최적화된 반도체이다.

AI는 병렬처리 환경에서 효과적이다. 수많은 요인을 병렬로 계산해 결과를 내놓기 때문이다. 이러한 이유로, 기존 중앙처리장치(CPU)에서는 AI 구동이 비효율적이다. CPU는 컴퓨팅 파워를 모아서 직렬로 처리하기 때문이다. AI의 요인은 적은 연산량을 요구한다. 그런데 CPU는 개별 요인에 수많은 연산을 활용하기 때문에 낭비가 심하다. 그뿐만 아니라, 연산해야 할 양도 많다.

그래서 AI에서는 연산량을 여러 개로 나눠서 병렬로 처리하는 반도체가 효과적이다. 그래픽처리장치(GPU)가 이러한 역할을 담당했다.

그러나 최근에는 그보다 더 효율적인 반도체에 관해 연구가 이뤄졌고, AI에 최적화된 반도체인 뉴로포믹 프로세서(Neuromorphic Processor)가 등장했다. 엄밀히 말해, AI에서 주목받는 ‘딥러닝(Deep Learning)’에 최적화돼 있다. 딥러닝은 사람의 신경망을 본떠서 만든 기계학습 알고리즘인데, 뉴로모픽 프로세서 반도체 또한 딥러닝과 유사하게 신경망을 본떠서 만들어졌다. 그래서 딥러닝 구동에 국한해 최적화 돼있다.

최근 뉴로모픽 프로세서는 스마트폰 프로세서(AP)에 적용되고 있는 추세이다. 뉴로프로세서유닛(NPU)은 스마트폰 전용 AI칩인데, 스마트폰에 NPU 탑재로 스마트폰 내에 AI 구현이 가능해지고 있다. 엄밀히 말해, AI 구동 효율성을 향상했다. 삼성전자는 NPU 적용 전후 모델을 비교했는데, AI 서비스 연산 효율성 측면에서 적용 전 모델대비 적용 후 모델이 7배가량 더 나은 성능을 보였다.

 

NPU가 AI 구현의 만능 열쇠는 아니야

주의할 점이 있다. NPU가 만능이 아니라는 점이다. NPU는 스마트폰 내에서 AI에 필요한 연산을 향상하는 가속기 역할을 할 뿐이다. NPU가 있다고 해서 모든 AI 서비스가 스마트폰 내에서 효과적으로 구현 가능한 것은 아니다.

AI는 학습과 추론으로 나눌 수 있다. 학습은 수많은 데이터를 분석하는 과정으로 데이터 고속 처리 장치가 필요하다. 고성능 하드웨어가 반드시 수반돼야 한다. 그러므로 스마트폰에서 AI 학습을 구현하는 것은 거의 불가능하다.

추론은 학습을 기반으로 AI를 구동하는 것이다. 스마트폰 내에 AI 서비스 구현은 추론 영역에 해당한다. 학습을 기반으로 동작한다. 다만, 연산에 얼마큼 요인을 고려하고 얼마나 정교하게 계산하는지에 따라 요구 성능이 달라진다.

얼굴인식에서 얼굴검증을 예로 들어보자. 얼굴검증은 특정 사용자 여부만을 검증하면 된다. 그러므로 구현이 쉽다. 반면 얼굴식별은 무수히 많은 사용자 중에서 유사한 사람을 찾아내야 한다. 수많은 데이터를 분석해야 하므로 연산량이 많고 정확도도 낮다. 전자는 스마트폰에 구현이 가능한, 후자는 구현이 어렵다.

 

한·미·중 중심으로 NPU 경쟁 예상

삼성전자의 엑시노스990 ⓒ 삼성전자

삼성전자의 엑시노스990 ⓒ 삼성전자

NPU는 스마트폰에서 AI 서비스를 구현함에 따라 주목받을 전망이다. 이에 따라, 경쟁이 치열할 전망이다. 한·미·중을 중심으로 NPU 경쟁이 치열할 전망이다.

NPU는 미국이 크게 앞서고 있다. 대표 기업으로 퀄컴(Qualcomm)이 있다. 지난 4일 퀄컴은 스마트폰 전용 프로세서인 스냅드래곤865를 선보였다. 5번째 AI 전용 AP이다. AI 구동에서 성능은 1초에 15조 번 연산(TOPS, Trillion Operation Per Second)이 가능하다. 15TOPS 성능을 보였다.

이에 국내 기업인 삼성전자가 추격하고 있다. 삼성전자는 스마트폰 전용 프로세서인 엑시노스990을 선보였다. AI에서 성능은 10TOP이상을 보였다. 중국도 NPU 사업에 뛰어들었다. 지난 9월 화웨이는 처음으로 NPU를 탑재한 키린990을 선보였다.

참고로 삼성전자와 화웨이는 스마트폰 선두 주자이다. 이에 따라, 스마트폰 산업은 디스플레이와 카메라에서 AI 구동 성능에 초점이 맞춰질 것으로 보인다.

(2240)

태그(Tag)

전체 댓글 (0)

과학백과사전