ETRI, 시각 인공지능 핵심 기술 오픈소스로 공개

사람 얼굴 자연스럽게 편집·복원하는 기술도 포함

2019.12.13 07:16 사이언스타임즈 관리자

한국전자통신연구원(ETRI)은 12일 시각 이미지 분석에 쓰이는 인공지능(AI) 핵심기술 ‘보브넷'(VoVNet·Variety of View Network)을 오픈소스로 공개한다고 밝혔다.

보브넷은 사물 인식 등 시각 인공지능 구현을 위한 백본 네트워크(다양한 네트워크를 연결하는 코어 네트워크) 기술이다.

사진 속 객체들의 특징을 찾아내 정보를 분석한 뒤 인공 신경망으로 모델을 만들어 준다.

ETRI는 사람 얼굴을 자연스럽게 편집하고, 원래의 상태로 복원할 수 있는 ‘에스씨페갠'(SC-FEGAN) 기술도 공개했다.

사진 속 인물의 머리 모양이나 표정을 어색하지 않게 바꿀 수 있고 일부가 훼손되거나 빈 곳이 있어도 원래 모습대로 자연스럽게 복원할 수 있다.

두 기술에는 딥러닝 기법의 하나인 갠(GAN·Generative adversarial Network, 적대적 생성 네트워크)이 적용됐다.

유사한 이미지를 생성하는 네트워크와 진짜 이미지를 판별하는 네트워크를 대립시켜 학습함으로써 진짜 이미지에 다가가도록 하는 딥러닝 방식이다.

컴퓨터 그래픽, 웹 디자인, 산업디자인 등 분야에서 결과물의 품질을 높이는 데 사용할 수 있을 것으로 기대된다.

ETRI는 인공지능 딥러닝 학습에 필요한 도심 환경 사물 560종과 사물 인식 학습 데이터 20만장도 함께 공개한다.

전봇대·신호등·자동차 등 폐쇄회로(CC) TV에 주로 녹화되는 사물 데이터로, 도시·안전·환경·교통 등 다양한 분야에 활용할 수 있다.

이들 기술과 데이터는 오픈소스 커뮤니티 깃허브에서 이용할 수 있다.

박종열 ETRI 시각지능연구실장은 “그동안 외국 기업이 공개하는 백본 네트워크 기술을 많이 사용해 왔지만, 성능이 뛰어난 컴퓨터가 필요해 비용이 많이 들었다”며 “이 기술은 낮은 사양의 컴퓨터로도 시각지능 분석이 가능해 관련 분야 벤처업계에 도움이 될 것”이라고 말했다.

(821)

태그(Tag)

전체 댓글 (0)

과학백과사전