December 11,2019

감성 AI, 콘텐츠 제작 시대 온다

AI신기술뎐, 커뮤니케이션 기술 현황 공유

FacebookTwitter

2001년 개봉한 영화 ‘A.I(에이 아이)’는 인간을 사랑하게끔 프로그래밍 된 최초의 로봇 데이비드가 인간으로부터 사랑을 받기 위해 진짜 인간이 되고 싶다는 꿈을 찾아 여행을 떠나는 내용을 그리고 있다.

과연 영화처럼 진짜로 감정을 느끼는 인공지능이 나타날까. 전문가들은 인공지능이 절대 인간을 따라 할 수 없는 3가지 영역으로 창의성과 임기응변, 그리고 위로를 꼽고 있다. 하지만 인간의 감성을 분석하고 해석하는 컴퓨터 기술 ‘감성 컴퓨팅(Affective Computing)’에 대한 연구는 1995년부터 시작되어 최근에는 AI 스피커나 챗봇과 같은 다양한 비즈니스 모델로 구체화되고 있다.

지난 3일 양재R&D혁신허브에서 '인공지능과 커뮤니케이션'을 주제로 제17회 AI기술뎐이 열렸다.

지난 3일 양재R&D혁신허브에서 ‘인공지능과 커뮤니케이션’을 주제로 제17회 AI기술뎐이 열렸다. ⓒ 김순강 / ScienceTimes

감성 AI, 인간과 교감하다

지난 3일 ‘인공지능과 커뮤니케이션’을 주제로 열린 ‘AI신기술뎐’ 강연에서 박외진 인공지능 전문기업 (주)아크릴 대표는 ‘인간과 교감하는 감성 AI’에 대해 이야기했다. 그에 따르면 인간의 감성이란 매우 오랜 기간 동안 많은 학자들에 의해 연구되어 온 주제로, 느낌과 감정, 정서, 기분 등을 아우르는 총체적인 의미다.

즉 ‘외부 작용’으로 형성된 ‘내면의 상태’가 바로 감성인데, 이것을 이용하면 남들과 차별화된 개인 맞춤형 추천이 가능하기 때문에 정보를 구조화하고 소통하는데 더 없이 효과적이다. 그렇기 때문에 인간의 감성을 이해하는, 인간과 교감하는 인공지능을 만들기 위한 노력이 계속되고 있는 것이다.

아크릴에서도 감성과 인공지능을 연결하는 노력으로 공감형 인공지능 플랫폼 ‘조나단’을 만들었다. 조나단은 먼저 텍스트 분석, 감성 인식, 공감 특화 대화 생성 기술을 딥러닝으로 구현한 설루션인 브레인(Brain)과 인공지능 서비스 개발 및 운영 환경을 위한 원스톱 환경 구축 설루션 프레임(Frame), 그리고 데이터 수집과 라벨링 지원 도구 집합인 툴즈(Tools)로 구성되어 있다.

박 대표는 “공감이란 내가 아닌 다른 사람의 감성을 똑같은 감성으로 내가 느끼고, 행동하는 것”이라며 “공감형 인공지능을 만드는 것은 종합예술과 같았다. 텍스트가 내재하고 있는 싫음, 만족, 기쁨, 짜증 등 34종의 감성을 인식하여 데이터베이스로 구축해야 했기 때문”이라고 설명했다. ‘싫지만 감동적이다’와 같이 복수의 감성을 확률분포로 표현함으로써 복합적인 감성 결과 도출도 가능했다.

이처럼 도출된 감성 결과에 가장 적절한 형태의 공감을 표현할 수 있도록 시집이나 소설 등에서 위로가 될 수 있는 50만 개 이상의 텍스트와 10만 개 이상의 동영상으로 인공지능을 학습시켰다. 여기에는 텍스트와 오디오, 이미지 각각을 인식하는 유니모달(uni-modal) 인식 기술과 모든 것을 통합으로 인식하는 멀티 모달(multi-modal) 인식 기술이 함께 구현됐다.

박외진 아크릴 대표는 '인간과 교감하는 감성 AI'를 주제로 강연했다.

박외진 아크릴 대표는 ‘인간과 교감하는 감성 AI’를 주제로 강연했다. ⓒ 김순강 / ScienceTimes

대화형 인공지능, 공감의 위로 건네

이를 통해 인공지능 일기장 앱도 만들었다. 사용자가 ‘올해 대학 입학이라 들어가기 전에 자격증 하나 따놓으려고 하는데 혼자 하려니까 너무 힘들다’는 내용의 일기를 올리면 인공지능이 사용자의 감성을 헤아려서 ‘어차피 부딪혀야 되는 일이라면 너무 현실적으로 생각하지 않았으면 해’라고 안상현의 ‘달의 위로’라는 책에 나와 있는 글로 위로한다.

이것이 바로 텍스트로 ‘공감하는 인공지능’이다. 문자 또는 음성으로 대화하는 인공지능이 바로 챗봇이기 때문에 이것도 일종의 텍스트 대화형 챗봇인 셈이다. 이처럼 인간의 학습능력과 언어 이해 능력을 보유하여 인간처럼 대화하는 비대면 상담 서비스 챗봇이 금융, 유통 등 다방면에서 많이 사용되고 있다.

다양한 인공지능 챗봇을 개발하고 있는 장세영 머니브레인 대표는 ‘대화형 인공지능으로 인간의 삶을 바꾸다’를 주제로 강연하면서 “챗봇 서비스에 있어서 사용자로부터 가장 큰 거부감을 가져오는 걸림돌이 바로 자연스럽지 못한 음성이기 때문에 딥러닝 음성합성기술로 이를 극복하기 위해 노력하고 있다”고 소개했다.

장세영 머니브레인 대표가 '대화형 인공지능으로 인간의 삶을 바꾸다'를 주제로 강연했다.

장세영 머니브레인 대표가 ‘대화형 인공지능으로 인간의 삶을 바꾸다’를 주제로 강연했다. ⓒ 김순강 / ScienceTimes

AI 콘텐츠 제작 시대 머지않아

음성합성기술이란 딥러닝 기술을 이용하여 텍스트를 음성으로 변환하여 학습하는 것으로, 특히 인공 신경망을 이용하여 자연스러운 음성합성이 가능한 것이 특징이다. 특정인의 목소리도 재현할 수 있어 최근에 오바마 전 미국 대통령의 목소리를 복제해 화제가 되기도 했다.

음성뿐 아니라 딥러닝 기술을 이용해 자연스러운 영상 합성도 가능하다.

장 대표는 “컨벌루션 신경망(CNN, Convolutional Neural Networks)을 통해 이미지를 분석하고, GAN(Generative Adversarial Network) 기술을 이용해 얼굴을 합성한다. 또 사람의 표정 데이터를 딥러닝 기술로 학습하여 피사체의 얼굴 표정, 표현 감정을 판별하거나 재생하는 감성 표현 기술로 자연스러움을 더하고 있다”고 진행과정을 설명했다.

이 같은 방법으로 AI와 영어로 대화하고 실시간으로 피드백 받는 인공지능 학습 코칭 프로그램도 개발하고, AI 뉴스봇이 자동으로 텍스트 기사를 작성하고 관심 뉴스를 큐레이션 한 후, AI 앵커 영상을 자동으로 생성하여 그 앵커가 기사 내용을 읽도록 하여 동영상 뉴스를 제작할 수 있는 플랫폼까지 나왔다.

장 대표는 “인공지능 스타와 얼굴을 보면서 양방향 대화가 가능한 AI 엔터테인먼트 서비스도 가능한데, 이는 AI로 인해 저비용으로 유명 AI 인플루언서 서비스가 가능하기 때문에 앞으로 크게 성장할 것으로 기대된다”며 “인공지능으로 영화를 제작하는 등 AI 콘텐츠 생산 시대가 머지않았다”고 내다봤다.

의견달기(0)