April 21,2019

인공지능 ‘알파고’ 바둑 천재를 꺾다

2016 과학뉴스(1) 인간 뇌 본뜬 '딥 러닝'의 승리

[편집자 註] <사이언스타임즈>는 객원기자들과 필진, 편집진이 올해 국내외 대표적인 과학뉴스 7건을 선정해 오늘(22일)부터 매일 1건씩 연재합니다. 첫번째 기사는 천재 바둑기사 이세돌 9단을 꺾은 '알파고' 이야기 입니다. 세간의 예상과 달리 컴퓨터가 인간을 이긴 '알파고 쇼크'로 인해 우리는 '인공지능 시대'가 멀지 않았음을 알게 되었고 미래에 대한 희망과 불안을 동시에 갖게 되었습니다. '2016 과학뉴스 7'을 계속 기대해 주십시오.
FacebookTwitter

지난 3월, 구글 자회사인 딥마인드(Deep Mind)가 개발한 인공지능 바둑 프로그램인 알파고(AlphaGo)가 이세돌 9단을 4대 1로 꺾었을 때 충격은 상상하지 못할 정도로 컸다. 한국에서 벌어진 과학적인 사건 중에서 이것만큼 세계적인 영향을 미친 것도 별로 없을 것 같다.

과학저널 사이언스 ‘올해의 5대 사건’에 들어가

과학저널인 사이언스도 12월 초, 올해의 과학 사건 후보 5개중 하나로 알파고를 넣고 독자들의 인기투표에 부친 적이 있다. 11,000명이 투표한 가운데 알파고는 7%를 얻어 4위에 올랐다. 43%를 얻어 1위에 오른 것은 인간 배아(embryo)를 실험실 접시에서 2주 동안 키운 사건으로 무려 43%의 절대적인 지지를 얻었다. ‘인간 배아’는 정자와 난자가 수정 후 2주에서 8주 사이를 말한다.

순수 과학적인 측면에서 보면, 컴퓨터 프로그램 하나가 사람을 꺾었다는 것이 무슨 큰 일이냐고 할 수 있을지 모른다.

이세돌 9단과 알파고의 대국 모습. ⓒ 연합뉴스

이세돌 9단과 알파고의 대국 모습. ⓒ 연합뉴스

그러나 알파고가 이세돌 9단을 꺾은 것은 거의 모든 보통 사람에게 영향을 미칠만한 일이기 때문에 세계가 동시에 충격을 받았다.

4차산업 혁명이  사람들의 예상보다 훨씬 빠르게 진행되면서 사람들이 가장 염려하는 것은 ‘내 일자리는 안전한가’가 첫 번째이다. 두 번째는 ‘과연 우리 자녀들에게 무엇을 가르쳐야 하는가’ 이다. 세 번째는 ‘그렇다면 과연 인간의 미래가 어떻게 될 것인가’ 하는 내용일 것이다.

알파고가 이세돌 9단을 꺾은 것은 인공지능의 기술이 새로운 차원으로 엄청난 도약을 했다는 것을 의미하는 역사적인 일이다.

인공지능이 처음 나왔을 때 세계는 큰 기대를 가졌으나, 30년 동안 정체기를 맞았다. 컴퓨터 인공지능이 계산은 엄청나게 빨리 해 댔지만, 사물을 인식하는 데는 너무나 약점이 많았다. 예를 들어 어린아이에게 개를 데리고 오면, 색깔이 다르거나 크기가 다르거나 털 모양이 달라도 쉽게 ‘개’라고 인식한다. 그러나 최근 몇 년 전 까지 컴퓨터 인공지능은 그 간단한 개를 다른 동물과 구별하는데 실패를 하고 말았다.

이 과정에서 인공지능 과학자들 사이의 시행착오를 거치면서, 기계학습(machine learning)이나 딥 러닝(deep learning)같은 알고리즘이 최종 승자로 나타났다. 이것을 한마디로 요약하면 사람의 뇌가 사물을 인식하는 과정을 본 따 컴퓨터 알고리즘을 만드는 것이라고 할 수 있다.

인간의 뇌 활동 본 뜬  ’딥 러닝’ 활용

알파고는 딥러닝과 강화학습(Reinforcement Learning), 몬테카를로 트리 탐색 (Monte Carlo Tree Search) 등 인공지능과 게임이론의 최신 기술을 적극 활용하고 구글의 거대한 컴퓨터 계산 자원을 활용했다.

알파고는 바둑의 형세를 판단하고, 다음 수를 선택할 때의 성공확률을 두 가지로 나눠서 계산했다. 첫째는 딥러닝 기법 중 컨벌루션 신경망( Convolution neural Network)을 적용해 과거 기보를 학습하는 단계이다. 컨벌루션 신경망은 페이스북에서 얼굴인식에 사용 한 것으로 유명해진 것으로, 입력 이미지를 작은 구역으로 나눠 부분적인 특징을 인식하고 이들이 결합하여 전체를 인식한다.

알파고는 또 13단계 신경망을 이용해 컴퓨터 서버에 저장된 3천만가지의 기보를 학습했다. 페이스북이 9단계 신경망으로 사람 얼굴을 인식한 데 비해 훨씬 큰 계산량을 활용했다.

바둑에서 경우의 수가 얼마나 많은지를 보여주는 개념도 ⓒ 딥 마인드 / 유튜브

바둑에서 경우의 수가 얼마나 많은지를 보여주는 개념도 ⓒ 딥 마인드 / 유튜브

다음 단계로 지도 학습한 신경망끼리 게임해서 이긴 쪽으로 가중치를 조정하는 ‘강화학습’을 실현했다. 강화학습을 거친 신경망은, 첫 단계만 학습한 신경망과의 대결에서 80%의 승률을 보였다고 한다. 이 두 가지 신경망을 정책망(policy network)라고 부르며 첫 단계 결과는 SL정책망(Supervised Learning Policy Network), 둘째 단계의 결과는 RL정책망 (Reinforcement Learning Policy Network)이라고 부른다.

바둑을 두면서 정확한 집 계산을 통해 이길 확률을 예측하는 가치 신경망(value network)도 도입했다. 이를 바둑용어로 말하면 ‘형세판단’ 능력이다.

알파고는 여기에 2000년대 중반에 발표된 몬테카를로 트리 검색법(Monte Carlo Tree Search)을 정책망과 결합하여 활용한다. 이 검색법은 다음 수를 찾기 위해 현 상태에서 나와 상대가 모두 동일한 정책망을 가진 것으로 가정하고, 여러 번 시뮬레이션을 거쳐 가장 높은 빈도로 선택한 수를 택하는 방식이다. 이 방법은 모든 트리를 탐색하지 않고도  최적에 가까운 결과를 낼 수 있다.

이렇게 알파고는 인공지능의 여러 분야인 강화학습, 신경망, 정책망, 몬테카를로트리검색법 등을 조합해서 사람보다 더 효과적으로 수 읽기를 하고 형세를 판단해서 이세돌 9단 같은 세계 최고 수준의 고수도 꺾었다.

전세계에 흩어져 있는 1000여개의 강력한 서버를 동원해 빠른 계산을 지원한 것도 빼놓을 수 없다.

이세돌 9단은 3월 9일의 1국, 10일 2국, 12일 3국을 계속 패배했지만, 13일 4국은 이기고 15일 5국은 져서 결국 4대 1로 패배했다. 이 9단은 대국료로 100만 달러(약12억원)을 받았지만, 알파고가 이 대국을 통해 세계적으로 알린 홍보효과는 엄청난 것으로 평가된다.

알파고와 이세돌 9단의 세기적인 대결을 앞두고, 심정적으로 대부분은 이세돌 9단이 아직은 이기지 않겠느냐고 생각했지만, 일부 인공지능 전문가들은 알파고가 이길 것이라고 예상을 했다.

하지만 불합리하고 불공정한 게임이었다는 반박도 있었다. 인간 대표 이세돌은 혼자였지만, 알파고는 전세계에 흩어져 있는 1000대의 엄청난 고성능의 컴퓨터가 동시에 돌아갔으니 인간 1 : 컴퓨터 1000의 승부였다는 것이다.

전세계 인류에게 희망을 안겨준 이세돌 9단의 미소 ⓒ연합뉴스

전세계 인류에게 희망을 안겨준 이세돌 9단의 미소 ⓒ연합뉴스

알파고 이후 사람들은 더 이상 인공지능의 미래를 의심하지 않게 됐다. 인공지능이 인간의 모든 지적인 활동을 능가할 것이라는 예상이 자연스럽게 나오고 있다.

그러나 상당수의 인공지능 학자들은 인간만의 독특한 공감능력과 소통 및 협력은 결코 컴퓨터가 따라올 수 없는 요소라는 점을 들어 인공지능에 대한 공포는 과장됐다고 말한다.

인공지능이 번역, 통역, 자료검색과 빅데이터 처리 등 ‘지적 노동’을 대신해주기 때문에 사람들은 더욱 가치있는 일에 몰두할 수 있을 것이라는 희망적인 관측도 나오고 있다.

의견달기(0)