시각장애인들에게 있어 디지털 세계는 접촉하기 힘든 먼 나라 이야기에 불과했다. 그러나 최근 인공지능, 컴퓨터영상, 영상인식 기술이 급속히 발전하면서 시각장애인과 디지털 세계를 연결해주는 기술들이 속속 개발되고 있다.
7일 영국의 소비자 중심 과학기술 비평지 ‘알퍼(alphr)’에 따르면 기술개발 선두에 서 있는 기업들 중에는 스타트업도 포함돼 있다. 태블릿 등 새로운 발상의 기기를 만들어 시각장애인이 인터넷에 접속할 수 있는 가교 역할을 하고 있다.
호주의 스타트업 ‘BLITAB’이 대표적인 경우다. 이곳에서는 시각장애인들이 사용할 수 있는 태블릿을 제작했다. 이 태블릿은 전자책(e Book)과 비슷하게 생겼지만 자세히 들여다보면 매우 다르다. 일반 태블릿처럼 스크린을 사용하는 대신 점자판을 사용한다.
주변 이미지 인식해 사람 언어로 설명
시각장애인들은 이 점자판을 통해 정보를 음성으로 변환한 ‘터치 투 스피치( text-to-speech)’, 손가락으로 접촉할 수 있는 ‘터치 네비게이션(touch navigation)’ 등의 기능을 경험할 수 있다.
인공지능, 컴퓨터영상, 영상인식 기술이 급속히 발전하면서 시각장애인을 도울 수 있는 기술이 속속 개발되고 있다. 사진은 주변 영상을 사람처럼 언어로 설명해주고 있는 스마트폰 앱 ‘에어폴리’. ⓒAirpoly
태블릿과 대화를 하면서 다양한 인터넷과 접촉할 수 있는 방식이다. BLITAB의 설립자인 크리스티나 츠베타노바(Kristina Tsvetanova) CEO는 “시각장애인들이 접촉과 소리를 통해 새로운 정보를 접촉하고, 또 새로운 정보를 입력할 수 있다”고 말했다.
BLTIAB에서는 현재 시각장애인들이 소통할 수 있는 플랫폼을 구축하고 있다. 플랫폼 안에 시각장애인들이 사용할 수 있는 다양한 소프트웨어를 축적하고 있는 중이다. 츠베타노바 CEO는 “전통적인 개념을 넘어선 새로운 솔루션들이 개발되고 있다”고 말했다.
인공지능을 활용하는 사례도 등장하고 있다. 페이스북은 AI 기술을 활용, 이미지 인식 기술을 메모리 네트워크(MemNets)과 접목시키는 방안을 개발하고 있다. ‘비쥬얼 Q&A’란 이름의 이 솔루션은 ’사진 속에 무엇이 있니?‘라고 물으면 그 내용을 상세히 설명해주는 방식이다.
욕조 속에서 놀고 있는 아기 사진을 보고 ‘아기가 어디 있니?’ 하고 물으면 ‘욕조 안에 있다’고 답변하고, ‘무엇을 하고 있니?’ 하고 물으면 ‘이를 닦고 있다’고 답변해주는 식이다. 영상 인식이 가능한 것은 첨단 인공지능 때문이다.
딥러닝 방식에 사람처럼 추상화된 정보를 해석할 수 있는 나선구조신경망 (CNN, Convolutional Neural Network)을 추가했는데, 이를 통해 언어와 영상을 동시에 이해할 수 있는 능력이 보완되고 있다.
최근 열린 기술 발표회에서 페이스북 관계자는 “영화 ‘반지의 제왕’을 보고 10만 개의 질문을 주고받는 등 다양한 방식으로 정확도를 높여가고 있다”고 말했다. 페이스북에서는 앞으로 이 인공지능 기술이 시각장애인을 도울 수 있을 것으로 보고 있다.
AI가 영상·언어 함께 이해할 수 있어
마이크로 소프트(MS)에서도 인공지능을 통해 사람의 시각을 보완할 수 있는 기술을 개발하고 있다. 지난달에 열린 ‘빌드(Build)’ 컨퍼런스에서 사람이 접촉하는 그때그때의 상황을 실시간으로 영상 인식해 설명해줄 수 있는 능력을 개발하고 있다고 밝혔다.
책을 잃는 것은 물론 영화를 보고, 사람의 얼굴 표정까지 읽고 해석하는 기능이 여기에 포함된다. 영상을 말로 설명해줄 수 있는 인공지능 기능이 완성될 경우 특히 시각장애인들에게 주변 상황을 시각적으로 이해할 수 있는 길이 열릴 것으로 보인다.
시각장애인들을 위한 기술로 ‘에이폴리(Aipoly)’도 있다. 시각 장애인을 위해 모바일 앱으로 스마트폰 등에 설치하면 눈앞의 물체나 장면을 분석해 음성으로 설명해준다. 이 앱을 개발한 ‘에어폴리‘는 실리콘밸리 소재 싱귤레리티 대학에서 설립한 스타트업이다.
그동안 미국 항공우주국 에임즈 연구센터(NASA Ames Research Center)와 협력해 인간 삶에 있어 접할 수 있는 주변 상황을 영상으로 인식할 수 있는 능력과 이를 말로 설명할 수 있는 능력을 업그레이드시켜왔다.
이 앱을 통해 사용자들은 자신의 주변에서 일어나는 약 5000개 유형의 상황을 설명하는 것을 들으면서 삶을 영위해나갈 수 있다. 흥미로운 것은 눈앞에 벌어지는 일뿐만 아니라 멀리 떨어져 있는 집안, 혹은 사무실 상황까지 감독할 수 있다는 점이다.
에어폴리 공동설립자인 알베르토 리졸리(Alberto Rizzoli) CEO는 “현재 진행하고 있는 영상과 언어 해석을 위한 업그레드 작업이 완성되면 눈을 감고서도 주변 상황을 상세하게 인식할 수 있는 길이 열리게 된다”고 말했다.
에어폴리에서는 현재 ‘알파고’왁 유사한 인공지능 시스템 테라 딥러닝(Tera Deep Learning) 시스템에 추상적인 언어·영상 이해가 가능한 나선구조신경망(CNN)을 결합해 인공지능의 능력을 확대하고 있는 중이다.
리졸리 CEO는 “현재 약 1000만 개의 이미지를 입력했으며, 이들 이미지를 사람처럼 이해하고 설명할 수 있는 언어 훈련을 시키고 있다”고 말했다. 그는 또 “이 기술이 시각장애인을 비롯 시각적인 어려움을 겪고 있는 사람들에게 큰 도움을 줄 것”이라고 말했다.
(11822)
로그인후 이용 가능합니다.
한국과학기술원(KAIST)과 서울대 연구진이 포함된 국제연구팀이 세계 최초로 지능형 '전자피부' 개발에 성공했다. 과학기술정보통신부는 KAIST 조성호 전산학부 교수와 서울대 고승환 기계공학부 교수, 미국 스탠퍼드대 제난 바오(Zhenan Bao) 교수 공동 연구팀이 이 같은 성과를 전기·전자 분야 국제 학술지 '네이처 일렉트로닉스'(Nature Electronics)에 29일 게재했다고 밝혔다.
한국과학기술단체총연합회(과총)는 '올해의 10대 과학기술 뉴스'에 국내 개발 우주발사체 '누리호' 발사 성공과 수학자 허준이의 필즈상 수상 등을 선정했다고 28일 밝혔다. 과총은 과학기술에 대한 국민의 관심을 높이기 위해 한 해의 주요 연구개발 성과와 사회적으로 주목받은 과학기술 등을 매년 선정해 발표하고 있다.
오태석 과학기술정보통신부 제1차관은 우리나라 첫 달 궤도선 다누리의 달 궤도 진입 성공을 발표하면서 "대한민국의 과학기술이 지구를 넘어 달에 닿았다"고 28일 밝혔다. 오 차관은 이날 정부서울청사에서 열린 브리핑에서 "지난 8월 5일 지구를 출발한 다누리는 145일간의 항행 끝에 달에 도착했다"며 "이제 대한민국은 세계 일곱 번째 달 탐사 국가로서 우주탐사 역사에 첫발을 내디뎠다"고 말했다.
정부가 내년에 우주항공청을 설립하고 우주산업 육성에 나선다. 또 민관이 협력해 국가전략 기술을 본격 육성하고, 양자나 첨단 바이오 등 신기술 분야의 생태계 조성에 힘쓴다. 이종호 과학기술정보통신부 장관은 28일 윤석열 대통령에게 이러한 내용의 2023년 업무계획을 보고했다.
한국재료연구원(이하 재료연)은 국민투표를 거쳐 올해의 우수 연구성과 '탑3'를 선정했다고 29일 밝혔다. 재료연은 기관의 대표 연구성과를 조명하고 과학기술에 대한 국민 공감대를 높이기 위해 국민투표 방식을 통해 우수 연구성과를 선정했다고 설명했다.
미역, 다시마 등과 같은 갈조류(brown algae)가 대기 중 이산화탄소(CO₂)는 숲처럼 많이 흡수하고 주변 생물이 분해하기 까다로운 점액 형태로 방출해 온실가스를 장기 격리하는 지구온난화 시대의 '원더 식물'로 제시됐다. 독일 막스플랑크협회에 따르면 산하 '해양미생물학연구소' 연구팀은 갈조류의 배설물을 분석해 탄소 순환 과정에서 많은 양의 CO₂를 장기간 제거할 수 있다는 연구 결과를 미국 국립과학원 회보(PNAS)에 발표했다.
내년 우크라이나 전쟁과 관련해서 러시아 패배부터 현재와 같은 전황 지속까지 전문가들의 전망이 엇갈렸다. BBC는 27일(현지시간) 우크라이나 전쟁에 관해 영국, 미국, 이스라엘의 전문가 5명의 전망을 전했다. 마이클 클라크 영국 왕립합동군사연구소(RUSI) 전 소장 겸 엑시터대 전략연구소(SSI) 부소장은 이번 봄 러시아의 공격이 관건이라고 봤다.