사이언스타임즈 로고

정보통신기술
연합뉴스
2026-02-24

'3인칭시점 영상을 1인칭시점으로'…KAIST, 영상 생성 AI 개발 증강·가상현실, 메타버스, 스포츠 등 다양한 분야 활용 기대

  • 콘텐츠 폰트 사이즈 조절

    글자크기 설정

  • 프린트출력하기
3인칭 시점 영상을 1인칭 시점 영상으로 변환한 예시 ⓒ한국과학기술원(KAIST) 제공
3인칭 시점 영상을 1인칭 시점 영상으로 변환한 예시 ⓒ한국과학기술원(KAIST) 제공

한국과학기술원(KAIST)은 김재철AI대학원 주재걸 석좌교수 연구팀이 3인칭 관찰자 시점 영상만을 활용해 영상 속 인물이 실제로 보고 있었을 장면을 정밀하게 생성하는 인공지능(AI) 모델 '에고엑스'(EgoX)를 개발했다고 23일 밝혔다.

이 기술은 단순히 화면을 회전시키는 수준을 넘어 인물의 위치와 자세, 주변 공간의 3차원(3D) 구조를 종합적으로 이해한 뒤 이를 기반으로 1인칭 시점 영상을 재구성한다는 점이 특징이다.

기존 기술은 정지 이미지만 변환하거나 4대 이상의 카메라 영상이 필요한 경우가 많았다. 빛의 방향이나 움직임이 복잡한 동영상에서는 화면이 어색해지는 문제도 있다.

연구팀은 인물의 머리 움직임과 실제 시야 사이의 상관관계를 정밀하게 모형화함으로써 고개를 돌릴 때 시야가 자연스럽게 전환되는 모습까지 사실적으로 구현하는 데 성공했다.

이 기술은 특정 환경에 국한되지 않고 요리·운동·작업 등 다양한 일상 상황에서도 안정적인 성능을 보였다고 연구팀은 설명했다. 이를 통해 별도 웨어러블 장치를 착용하지 않고도 기존에 축적된 영상으로부터 고품질의 1인칭 시점 데이터를 확보할 새로운 가능성을 열었다고 덧붙였다.

EgoX를 활용하면 AR(증강현실)·VR(가상현실) 및 메타버스 분야에서 일반 영상을 사용자가 직접 체험하는 듯한 몰입형 콘텐츠로 전환해 사용자 경험을 극대화할 수 있다.

스포츠 중계나 브이로그를 선수나 주인공 시점으로 전환하는 등 새로운 형태의 영상 서비스도 가능해질 것으로 기대된다.

주재걸 석좌교수는 "이번 연구는 단순한 영상 변환 기술을 넘어 인공지능이 사람의 '시야'와 '공간 이해'를 학습해 재구성했다는 점에서 의미가 크다"며 "앞으로는 기존에 촬영된 영상만으로도 누구나 몰입형 콘텐츠를 제작하고 경험할 수 있는 환경이 열릴 것"이라고 말했다.

연합뉴스
저작권자 2026-02-24 ⓒ ScienceTimes

관련기사

목록으로
연재 보러가기 사이언스 타임즈에서만 볼 수 있는
특별한 주제의 이야기들을 확인해보세요!

인기 뉴스 TOP 10

속보 뉴스

ADD : 06130 서울특별시 강남구 테헤란로7길 22, 4~5층(역삼동, 과학기술회관 2관) 한국과학창의재단
TEL : (02)555 - 0701 / 시스템 문의 : (02) 6671 - 9304 / FAX : (02)555 - 2355
정기간행물 등록번호 : 서울아00340 / 등록일 : 2007년 3월 26일 / 발행인 : 정우성 / 편집인 : 차대길 / 청소년보호책임자 : 차대길
한국과학창의재단에서 운영하는 모든 사이트의 콘텐츠는 저작권의 보호를 받는 바 무단전재, 복사, 배포 등을 금합니다.

사이언스타임즈는 과학기술진흥기금 및 복권기금의 지원으로 우리나라의 과학기술 발전과 사회적 가치 증진에 기여하고 있습니다.