사이언스타임즈 로고

기초·응용과학
정회빈 리포터
2025-06-12

사람과 랠리하는 배드민턴 로봇의 등장 강화학습을 통한 셔틀콕의 정확한 위치 파악과 팔다리의 유기적 조절 기능 동시 구현

  • 콘텐츠 폰트 사이즈 조절

    글자크기 설정

  • 프린트출력하기

지난 4월 중국 베이징에서는 세계 최초로 휴머노이드 로봇을 위한 하프 마라톤 대회가 열렸다. 이는 로봇 기술의 놀라운 진보를 보여주는 상징적인 이벤트였다. 

과거의 로봇들은 주로 단순 작업만 반복적으로 수행하도록 설계되어 있었기 때문에 인간처럼 유연하게 움직이거나 상황에 맞춰 반응하는 모습을 기대하기는 어려웠다. 최근에 많이 등장하는 춤을 추는 로봇은 신체를 빠르고 유연하게 움직인다. 하지만 대부분 사전에 프로그래밍된 동작을 반복하는 방식이어서 예측 불가능한 상황에 능동적으로 대처하는 데는 한계가 있었다.

그런 점에서 마라톤은 로봇에게 훨씬 더 복잡한 과제이다. 주변 환경을 실시간으로 인식하고 지형 변화에 맞춰 균형을 유지하며 목표 지점으로 빠르게 움직여야 하기 때문이다. 이번 마라톤 대회를 통해 로봇이 실제로 인간처럼 움직일 수 있는 수준까지 발전했음을 많은 사람들이 실감했을 것이다. 그렇다면 머지않아 사람과 함께 스포츠를 할 수 있는 로봇도 기대해볼 수 있지 않을까?

 

스포츠에 도전하는 로봇 기술

실제로 인간과 배드민턴을 치는 로봇이 등장했다. 지난 5월 '사이언스 로보틱스'에 게재된 논문에는 라켓을 휘두르며 셔틀콕을 정확하게 쳐내는 사족보행 로봇에 대한 연구 결과가 소개되었다. 논문과 함께 소개된 영상자료에서 사족보행 로봇은 날아오는 셔틀콕을 실시간으로 인식하여 낙하지점을 계산하고, 신속하게 이동한 후 정확한 타이밍에 라켓을 휘둘러 셔틀콕을 쳐낸다. 비록 두 발로 서 있는 인간형은 아니지만 이 로봇은 사람과 몇 차례 랠리를 주고받을 수 있을 정도의 실력을 보여주었다.

사람과 랠리를 주고받는 사족보행 로봇 ⒸSci Robot
사람과 랠리를 주고받는 사족보행 로봇 ⒸSci Robot

연구를 수행한 취리히 연방 공과대학교의 마르코 후터 박사 연구팀은 로봇이 배드민턴을 칠 수 있도록 하기 위해 딥러닝 기반의 강화학습 알고리즘을 활용하였다. 강화학습은 인간이 시행착오를 통해 기술을 익히는 방식과 유사하게 로봇이 수많은 가상 시뮬레이션으로 스스로 반복 훈련하여 성공적으로 타격 전략을 학습하도록 하는 기법이다. 셔틀콕이 날아오는 수많은 경우의 수를 모두 학습하여 대응법을 익히는 것이 아니라 다양한 환경에서 셔틀콕의 움직임을 예측하고 그에 맞는 반응 전략을 습득함으로써 이전에 보지 못한 새로운 궤적의 서틀콕도 능숙하게 처리할 수 있게 된 것이다.

시뮬레이션을 통한 강화학습 이미지 ⒸSci Robot
시뮬레이션을 통한 강화학습 이미지 ⒸSci Robot

 

셔틀콕 인식과 운동 전략 학습을 위한 딥러닝 기반 강화학습

배드민턴을 치기 위해서는 우선 셔틀콕을 정확하게 인식하고 낙하지점을 파악하는 능력이 필요하다. 이를 위해 로봇은 본체에 장착된 카메라를 통해 셔틀콕의 비행 영상을 실시간으로 수집하고, 이를 바탕으로 셔틀콕이 어디로 떨어질지 예측해야 한다. 

하지만 센서의 시야각이 제한되어 있고, 셔틀콕은 짧은 시간 동안만 포착되기 때문에 정확한 낙하지점을 실시간으로 계산하는 것은 매우 어려운 과제이다. 연구팀은 이러한 한계를 극복하기 위해 셔틀콕의 위치나 속도 정보를 일부러 부정확하게 만들어 훈련 데이터에 적용하였다. 센서에 잡히는 정보가 항상 정확하지 않다는 실제 상황을 반영하기 위해 인공적으로 센서 노이즈(sensor noise)를 주입한 것이다. 로봇은 오차가 포함된 정보만으로도 셔틀콕의 비행 궤적을 예측하는 법을 스스로 익혔고, 덕분에 실제 배드민턴 게임에서 셔틀콕이 잠깐 보였다가 사라지더라도 낙하지점을 높은 정확도로 예측할 수 있었다.

사족보행 로봇의 구동 메커니즘 개요 ⒸSci Robot
사족보행 로봇의 구동 메커니즘 개요 ⒸSci Robot

셔틀콕의 낙하지점을 파악한 뒤에는 해당 위치로 빠르게 이동해야 한다. 연구팀은 로봇이 어떻게 움직일지 결정하는 학습 방식에 비대칭 액터-크리틱 (asymmetric actor-critic) 강화학습을 도입하였다. 여기서 액터는 배드민턴 선수와 같이 실제로 어떤 행동을 할지를 결정하는 역할이고, 크리틱은 코치처럼 그 행동이 얼마나 잘된 것인지를 평가해주는 역할이다. 중요한 것은 크리틱이 로봇 본체(배드민턴 선수)가 실제로는 알 수 없는 정보를 함께 참고하여 비대칭적으로(asymmetric) 평가한다는 것이다. 예를 들어 시뮬레이션 내에서는 앞으로 몇 번 더 셔틀콕을 쳐야 하는지를 미리 알 수 있으므로 이 정보를 활용하여 어떤 행동이 장기적으로 더 유리할지를 계산할 수 있다. 이러한 방식은 로봇이 제한된 정보만 가지고도 실제 상황에서 더 영리하게 움직일 수 있게 돕는다.

셔틀콕과의 거리에 따라 로봇이 움직이는 방식도 매우 흥미롭다. 셔틀콕의 낙하지점이 로봇과 가까우면 다리를 오래 땅에 붙이면서 짧은 회전만으로 방향만 바꾸는 등 최소한의 움직임으로 대응한다. 반대로 낙하지점이 멀리 떨어져 있으면 네 다리로 달리는 동물처럼 점프하듯 빠르게 질주하는 움직임을 보인다. 특히 셔틀콕의 채공시간이 짧아 동작할 여유가 없을 때에는 발에 가해지는 충격이 크거나 이후 회복 시간이 길어지더라도 보행 방식을 바꾸어 더욱 빠르게 이동하는 선택을 취한다. 즉, 셔틀콕까지의 거리와 시간에 따라 로봇이 다양한 보행 전략을 선택하고 라켓을 휘두르기까지의 동작을 최적화한다는 것이다.

셔틀콕의 위치와 채공시간에 따라 로봇은 적합한 보행 전략을 선택한다 ⒸSci Robot
셔틀콕의 위치와 채공시간에 따라 로봇은 적합한 보행 전략을 선택한다 ⒸSci Robot


인간과 함께 운동하는 로봇 시대

이번 연구는 단지 로봇 개발 기술이 스포츠를 할 수 있을 정도로 발전했음을 보여주는 데 그치지 않는다. 복잡하고 빠르게 변화하는 상황 속에서 로봇이 어떻게 순간적으로 판단하고, 몸 전체를 조율하여 정교하게 움직일 수 있는지를 보여주는 중요한 사례이기도 하다. 로봇이 이런 고난도의 운동 기능을 갖추게 되면 향후 사람과 함께 스포츠를 즐기거나 훈련 파트너로 활용하는 새로운 방식의 인간-로봇 상호작용이 가능해질 수 있다. 단순히 명령을 수행하는 기계를 넘어서 인간과 함께 협력하고 즐거움을 나눌 수 있는 동반자로서의 가능성이 열린 것이다.

정회빈 리포터
acochi@hanmail.net
저작권자 2025-06-12 ⓒ ScienceTimes

관련기사

목록으로
연재 보러가기 사이언스 타임즈에서만 볼 수 있는
특별한 주제의 이야기들을 확인해보세요!

인기 뉴스 TOP 10

속보 뉴스

ADD : 06130 서울특별시 강남구 테헤란로7길 22, 4~5층(역삼동, 과학기술회관 2관) 한국과학창의재단
TEL : (02)555 - 0701 / 시스템 문의 : (02) 6671 - 9304 / FAX : (02)555 - 2355
정기간행물 등록번호 : 서울아00340 / 등록일 : 2007년 3월 26일 / 발행인 : 정우성 / 편집인 : 윤승재 / 청소년보호책임자 : 윤승재
한국과학창의재단에서 운영하는 모든 사이트의 콘텐츠는 저작권의 보호를 받는 바 무단전재, 복사, 배포 등을 금합니다.

사이언스타임즈는 과학기술진흥기금 및 복권기금의 지원으로 우리나라의 과학기술 발전과 사회적 가치 증진에 기여하고 있습니다.