“인공지능 컬링로봇, 국내 최고 수준 컬링팀과 대결서 승리”

고려대 이성환 교수 "환경변화에 적응하며 학습하는 AI 개발…실전경기서 4전 3승"

국내 연구진이 개발한 인공지능 컬링로봇이 국내 최고 수준의 컬링팀들과 대결해 승리를 거뒀다. 컬링은 경기가 얼음 위에서 열려 변수가 많고 불확실성이 큰 데다 치밀한 전략적 사고까지 필요해 ‘빙판 위의 체스’로 불린다.

고려대 인공지능학과 이성환 교수팀은 24일 국제학술지 ‘사이언스 로보틱스'(Science Robotics)에 발표한 논문에서 환경 변화에 적응하며 학습하는 ‘적응형 심층 강화 학습'(Adaptive Deep Reinforcement Learning)을 적용한 인공지능 컬링로봇 ‘컬리'(Curly)가 국내 최고 수준의 컬링팀들과 실전 경기를 벌여 4전 3승을 기록했다고 밝혔다.

인공지능 컬링로봇 ‘컬리'(Curly) ⓒ 고려대 이성환 교수 / 연합뉴스

이 교수는 “적응형 심층 강화학습은 불확실성이 높은 실제 환경에서 다양한 변수로 임무 수행 환경이 수시로 변할 때, 인공지능 로봇이 노출된 환경에 대한 재학습 없이 실시간으로 적응하며 안정적으로 임무를 수행할 수 있게 하는 방법”이라고 설명했다.

그는 “이 방법은 외부 센서 도움 없이 컬링로봇 상단에 장착된 카메라로 획득한 투구 오차만 이용해 새 환경에 적응할 수 있게 한 게 특징”이라고 말했다.

그는 “모든 변수를 측정해 학습하는 게 불가능한 실제 환경에서 사용되는 드론이나 자율주행자동차 등에 적용이 가능할 것”이라고 덧붙였다.

이 교수팀은 앞서 2018년 3월 평창동계올림픽 당시 처음으로 ‘컬리’를 개발해 공개했다.

당시 컬리는 고등부팀과 2엔드 경기를 벌여 0:3으로 패했다.

컬리는 스톤의 위치 등을 파악하는 주장 역의 스킵로봇과 스톤을 던지는 투구로봇, 스톤의 위치 등 정보를 받아 분석하고 전략을 짜는 인공지능으로 구성된다.

연구팀은 이 연구에서 적응형 심층 강화 학습을 바탕으로 재학습 없이 새로운 빙판 환경에도 빠르게 적응할 수 있게 하는 로봇 훈련 방법을 제안하고 이를 컬리에 적용했다. 컬리는 시뮬레이션 훈련과 실제 컬링 경기장을 훈련을 병행하며 경기 능력을 키웠다.

그 결과 적응형 심층 강화 학습이 적용된 컬리는 3~4일의 학습·훈련만으로 불안정한 빙판 환경에 안정적으로 적응하며 숙련된 선수 수준의 컬링 경기 수행 능력을 획득했다. 투구로봇이 던진 스톤이 실제 움직인 거리와 목표 거리 간 평균 오차가 적응형 심층 강화학습을 적용하지 않은 경우보다 훨씬 작은 것으로 나타났다.

컬리는 국내 최고 수준의 여성 컬링팀 및 휠체어컬링 국가대표 상비군 등을 상대로 한 경기에서 3승 1패의 성적을 거뒀다. 4경기에서 엔드별로는 6승 1무 4패를 기록했고, 점수는 컬리가 총 12점, 사람 컬링팀이 9점을 얻었다.

이 연구 결과는 드론이나 자율주행 자동차처럼 시시각각 달라지고 많은 돌발변수를 발생하는 환경에서 사용되는 인공지능이 빠르게 적응하도록 학습·훈련할 수 있는 방법을 제시하고 그 유효성을 입증했다는 점에서 주목받고 있다.

이 교수는 “컬링은 경기장 온도, 습도, 정빙 정도 등에 따라 빙판이 불규칙하게 변하기 때문에 컬링 스톤을 원하는 곳에 안정적으로 보내기 위해 숙련된 선수들도 수년간 빙판 상태를 파악하는 훈련을 한다”며 “이런 불확실한 환경에 빠르게 적응하는 인공지능 개발을 위해 컬링을 실험대로 선택했다”고 설명했다.

그는 또 “기존 기계학습 기반 학습 방법이 안정적 가상환경 또는 실험실 수준의 문제를 풀고 검증했다면 이번 연구는 불확실성이 높은 실제 얼음 환경에 도전해 숙련된 인간 수준의 로봇 인공지능 핵심 원천 기술을 개발하고, 실제 환경에서 인간 수준으로 문제를 해결하고 대응할 수 있음을 보였다는 점에서 의의가 크다”고 말했다.

(170)

뉴스레터 구독신청
태그(Tag)

전체 댓글 (0)

과학백과사전