기획·칼럼

고전 비디오 게임인 ‘인베이더’의 추억

[TePRI Report] hiS&Tory

구글의 자회사 딥마인드(Deep Mind) 는 인공지능을 개발하는 회사다. 아마도 일반인들은 2016년 3월에 서울에서 벌어진 이세돌과 알파고의 대국 덕분에 이 회사의 이름과 그곳의 최고경영자 데미스 하사비스(Demis Hassabis)를 처음 알게 되었을 것이다. 알파고의 승리는 물론 대단한 성취였다. 당시까지 많은 바둑 전문가들은 바둑에 필요한 창의성을 강조하면서 기계가 프로기사를 이길 가능성은 낮다고 점쳤으니까 말이다.

범용 인공지능은 어떤 과제가 주어지든지 그것을 해결하는 솜씨를 바닥부터 스스로 학습할 수 있어야 한다. © 게티이미지뱅크

그러나 많은 인공지능 전문가들은 알파고를 박하게 평가한다. 왜냐하면 그 신경망 알고리즘은 바둑이라는 특수한 보드게임을 위해 고도로 전문화되어있기 때문이다. 현재 모든 인공지능 개발자들의 궁극의 꿈은 인간과 대등한 지능, 곧 범용 인공지능(general AI)다. 범용 인공지능은 어떤 과제가 주어지든지 그것을 해결하는 솜씨를 바닥부터 스스로 학습할 수 있어야 한다. 반면에 알파고는 바닥부터 스스로 바둑을 배우지 않았다.

이 신경망 알고리즘은 초기에 수많은 바둑 고수들의 기보를 인간으로부터 입력받아 바둑을 배우기 시작했다. 이 한계를 모를 리 없는 딥마인드는 2017년 10월에 ‘알파고제로(AlphaGoZero)’에 관한 논문을 발표했다. 알파고제로는 기보에 의존하지 않고 정말 바닥부터 스스로 바둑을 학습한다는 점이 특징이다. 그러면서도 이 새로운 버전의 알파고는 최고의 기력에 도달했다. 더 나아가 같은 해 12월에 아카이브(arXiv)에 올린 논문에서 딥마인드는 알파고제로를 ‘알파제로(AlphaZero)’로 일반화하여 바둑, 장기, 체스 모두에서 최고의 경지에 도달하도록 학습시켰다고 주장했다. 그럼에도 여전히 일부 전문가들은 알파고제로나 알파제로가 범용 인공지능을 향한 중요한 진보인지에 대해서 회의적이다.

한마디로 이 신경망 알고리즘들은 보드게임용이기 때문이다. 또한 알파고제로가 바둑판을 나타내는 화면의 변화와 알파고제로 자신의 행위(착수着手) 사이의 연관성을 스스로 학습하는가에 대한 의문도 제기되었다. 아마도 그렇지 않을 가능성이 높다. 왜냐하면 화면의 변화와 알고리즘 자신의 행위 사이의 연관성을 알고리즘이 스스로 학습하는 것은 대단히 어려운 과제이며, 이 과제는 바둑이 아니라 비디오게임을 하는 신경망을 개발하는 전문가들이 주로 연구하고 있기 때문이다.

구글 딥마인드의 한 연구팀은 컴퓨터를 학습시켜 프로게이머와 대등한 수준으로 인베이더를 하게 만들 수 있음을 보여주는 논문을 발표했다 © 위키미디어

드디어 ‘인베이더’가 등장할 차례다. 1980년 즈음에 이 땅에서 어린 시절을 보낸 남자라면 누구나 기억할 법한 이 고전적인 비디오 게임은 정식 명칭이 ‘스페이스 인베이더스(Space Invaders)’지만 이 글에서는’인베이더’라고 부르겠다. ‘전자오락실’에서 기계에 50원이나 100원짜리 동전을 넣고 이 게임을 하던 아이들에게는 ‘인베이더’라는 이름이 훨씬 더 친숙할 터이기 때문이다.

2015년, 역시나 구글 딥마인드의 한 연구팀은 컴퓨터를 학습시켜 프로게이머와 대등한 수준으로 인베이더를 하게 만들 수 있음을 보여주는 논문을 발표했다. 그것은 정말 대단한 성취였다. 왜냐하면 눈과 손이 관여하는 복잡한 과제를 수행하는 솜씨를 기계가 스스로 학습할 수 있음을 확실히 입증한 성과였기 때문이다. 인베이더를 학습한 신경망은 화면 속에서 어떤 대상들이 중요한지, 신경망 자신의 행위에 따라 화면이 어떻게 변화하는지, 죽지 않고 높은 점수를 획득하려면 어떻게 해야 하는지에 관하여 프로그래머로부터 아무런 설명도 듣지 않았다. 애초부터 신경망에 입력된 것은 높은 점수를 따야 한다는 목표뿐이었다. 그렇게 바닥부터 시작된 그 신경망의 학습에서 가장 중요한 요소 하나는 화면 속 대상들을 식별하는 것이었다. 따라서 그 신경망의 개발은 이미지 식별의 자동화와 직결된 문제였다.

사진을 보고 개인지 고양이인지 식별하는 과제, 살구꽃인지 벚꽃인지 식별하는 과제를 컴퓨터가 잘 해내게 된 것은 비교적 최근의 일이다. 중요한 기술적 혁신의 계기는 2012년에 이른바 ‘곱말기 신경망(convolutionalneural network)’의 위력이 명백히 드러난 것이었다. 당시에 박사과정 학생이던 알렉스 크리제브스키(Alex Krizhevsky)는 한 학회에서 곱말기 신경망에 관한 획기적인 발표를 한 뒤 얼마 지나지 않아 지도 교수와 함께 구글에 영입되었다.

이때 이후 구글과 페이스북은 곱말기 신경망 전문가들을 경쟁적으로 채용해왔다. 고객의 취향과 생활양식과 사회적 관계를 파악하고 싶은 기업에게 컴퓨터의 이미지 식별 능력은 정말 요긴할 것이다. 다시 추억의 인베이더로 돌아가자. 흥미롭게도 딥마인드의 신경망은 1980년대에 우리나라 어린이와 청소년이 거의 다 채택했던 ‘기다렸다 깨기’ 전략을 사용하지 않았다.

이 전략에서는 초반에 외계인들의 대열을 적당히 깨부숴 일정한 모양으로 만든 다음에 선봉의 외계인들이 지상에 도달하기 직전까지 기다린다. 그 후 그 선봉의 한 행을 깨부수고, 다시 기다렸다가 다음 한 행을 깨부수는 식으로 전투를 진행한다. 첫판에는 이 전략이 필수가 아니지만, 몇 판을 깨고 나면 외계인들의 움직임이 아주 빨라지기 때문에 ‘기다렸다 깨기’가 거의 필수적이게 된다.

바닥부터 시작된 그 신경망의 학습에서 가장 중요한 요소 하나는 화면 속 대상들을 식별하는 것이었다. © 게티이미지뱅크

그러나 딥마인드의 신경망은 무조건 정확하게 사격하여 외계인들을 없애는 전략을 채택했다. 이 소식을 처음 들었을 때 필자는 귀가 쫑긋 섰다. 바로 필자가 어린 시절에 우리 동네에서 그런 ‘막 깨기’ 전략을 쓰는 고수로 유명했기 때문이다. 필자는 정형화된 ‘기다렸다 깨기’가 따분했다. 그 전략을 쓰면 보너스 우주선을 더 많이 격추하여 높은 점수를 얻을 수 있었지만, 게임의 목표가 꼭 높은 점수일 필요는 없지 않은가. 필자는 표적이 보이는 대로 사격하여 정신없이 판을 끝내는 화끈한 전략을 선호했다.

딥마인드의 신경망도 그런 ‘막 깨기’ 전략을 쓴다니, 필자는 시대를 앞서간 선각자였던 것일까? 섣부른 환호는 늘 위험하다. ‘막 깨기’ 전략은 그 신경망의 한계다. 그 곱말기 신경망은 장기적인 기억을 보유할 수 없으며 계획을 세울 수도 없다. 단지 매 순간 상황을 파악하고 최적의 방식으로 반응할 뿐이다. 반면에 인간은 장기 기억과 계획 능력을 보유했기에 장기적으로 더 이로운 ‘기다렸다 깨기’를 구사할 수 있다. 이 사례에서도 드러나듯이 인간과 유사한 범용 인공지능에 도달하기까지의 길은 멀고 험하다. 일부 전문가들은 몇 백 년이 더 지나야 범용 인공지능이 출현할 것이라고 예상한다.

마지막으로 드는 의문인데, 그럼 인간이면서도 ‘막 깨기’ 전략을 채택했던 필자는 대체 어떤 놈이었던 것일까? 장기 기억도 계획도 없이 즉흥적으로 반응할 줄만 아는 위험천만한 놈이었을까? 관건은 무엇을 위해 인베이더를 하는가에 있다. 대다수의 아이들이 높은 점수와 오랜 게임 시간을 위해 그 게임을 했다면, 필자는 팽팽한 긴장과 정신없는 몰입을 즐기기 위해 그 게임을 했다. 그러므로 그들에게는 ‘기다렸다 깨기’가, 필자에게는 ‘막 깨기’가 적합했다. 이처럼 어떤 전략이 적합하냐는 목적이 무엇이냐에 의존한다.

정말로 인간과 유사한 인공지능은 목적도 스스로 설정할 줄 알아야 할 텐데, 그런 인공지능이 과연 가능할까? 혹은 필요할까? 어쨌든 일부 사람들은 범용 인공지능의 도래가 임박했다고 호언장담하고 있으니, 두고 볼 일이다.

* 이 글은 한국과학기술연구원(KIST)에서 발간하는 ‘TePRI Report’ 로부터 제공받았습니다.

(421)

뉴스레터 구독신청
태그(Tag)

전체 댓글 (0)

과학백과사전