사이언스타임즈

건너뛰기링크

본문 바로가기
주메뉴 바로가기
하단 바로가기

통합검색

과학기술

전체

과학기술
정보통신기술

정보통신기술: 연합뉴스

2025-10-02

"사진 속 깊이까지 읽는다" AI 공간 추론 명령어 기술 개발 켄텍 이석주 교수 연구팀, AI 3차원 공간 인식 한계 돌파

글자크기 설정

기계가 직접 이해할 수 있는 비인간 언어 경량 프롬프트(명령어) 학습 기술 ⓒ 한국에너지공대 제공

사진이나 영상 속 3차원 공간의 깊이 등 정보를 세밀하게 추론할 수 있는 인공지능(AI) 기술이 개발됐다.

한국에너지공대(KENTECH·켄텍)는 이석주 교수 연구팀이 AI 비전 언어 모델(Vision Language Model)의 3차원 공간 추론을 가능하게 하는 경량 프롬프트(명령어) 학습 기술을 개발했다고 1일 밝혔다.

다양한 유형의 데이터를 처리하고 통합할 수 있는 AI 시스템인 멀티모달(multimodal)이나 비전 언어 모델은 이미지와 텍스트를 동시에 이해하는 AI로, 비전과 자연어 처리 융합 분야에서 널리 활용된다.

예를 들어 고양이라는 단어를 보여주면 수많은 사진 속에서 고양이를 찾아내는 방식이다.

하지만 거리와 깊이 같은 기하학적 공간 인식에는 한계가 있었다.

연구팀은 사람이 쓰는 언어 대신 기계가 이해하기 최적화된 새로운 표현 방식인 비인간 언어 프롬프트를 도입했다.

이를 통해 카메라에 찍힌 사진이나 영상만으로도 물체의 깊이를 정밀하게 파악할 수 있도록 했다.

이 기술은 약 110만개 학습 파라미터만으로도 3억개 이상이던 기존 대형 모델과 견줄 만한 성능을 보였다.

이번 연구는 국제 학술지 'Pattern Recognition (Elsevier, SCIE Q1, IF=7.6)'에 지난달 26일 온라인으로 게재됐다.

이 교수는 "자율주행, 로봇 비전, 증강현실 등 경량화가 필수적인 다양한 공간 컴퓨팅 분야에 활용 가능한 핵심 원천기술로 자리매김할 것"이라고 말했다.

연합뉴스: 저작권자 2025-10-02 ⓒ ScienceTimes

태그(Tag)

관련기사

ETRI, HBM4 넘는 AI·XR 디스플레이용 초미세 접합 기술 개발 연구진 ⓒETRI 제공 한국전자통신연구원(ETRI)은 인공지능(AI)과 확장현실(XR) 시대 핵심 디스플레이로 주목받는 초고해상도 'LEDOS' 디스플레이 기술과 이를 구현하는 초정밀 레이저 접합 기술을 개발했다고 11일 밝혔다. LEDOS(레도스)는 실리콘 웨이퍼 위에 초소형 무기물 발광다이오드(LED)를 정밀하게

"생성형AI, 환자 치료문턱 낮추지만 과의존 등 양면적 영향" 국내 정신건강의학과 의사들은 생성형 인공지능(AI)이 환자의 자기관리에 도움을 주는 등 순기능을 하지만 환자의 과의존을 부르거나 의사의 진단 신뢰도를 흔드는 등 부정적 영향도 적지 않다고 인식하는 것으로 나타났다. 고려대학교 안암병원은 10일 이 병원 정신건강의학과 조철현 교수와 한국과학기술원(KAIST) 디지털인문사회과학부 정두영 교수 공동연구팀이

GIST 연구팀, 일상 동작만으로 근감소증 추적 AI기술 개발 GIST AI융합학과 강지연 교수 연구팀 ⓒ광주과학기술원 제공 광주과학기술원(GIST)은 AI융합학과 강지연 교수 연구팀이 노년층의 일상 동작만으로 근감소증 진행에 따른 근기능 변화를 추적·분석할 수 있는 인공지능(AI) 기술을 개발했다고 9일 밝혔다. 한국과학기술연구원(KIST)·빛고을전남대학교병원과 공동

대한민국 엔지니어상 여성 부문에 노숙영·신수희·정아름 대한민국 엔지니어상 여성 부문에 노숙영·신수희·정아름(왼쪽부터) ⓒ과기정통부 제공 과학기술정보통신부와 한국산업기술진흥협회는 올해 상반기 대한민국 엔지니어상 여성 부문 수상자로 노숙영 삼성전자[005930] 마스터, 신수희 LG전자[066570] 팀장, 정아름 한화오션[042660] 책임을 선정했다고 8일 밝혔다.

"단어·문장 입력하면 3D 공간 속 물체 찾는 AI 기술 개발" 연구 그림. 사용자가 텍스트로 특정 물체를 지정하면 라이트스플랫이 해당 물체를 3D 공간에서 선택하고 편집하는 모습 ⓒ울산과학기술원 제공 증강현실(AR) 화면이나 로봇이 보는 3차원 공간에서 사용자가 입력한 텍스트를 통해 물체를 찾아내는 인공지능(AI) 기술이 나왔다. 울산과학기술원(UNIST) 인공지능대학원 주경돈 교수팀은 사용자

재생에너지 잠재량·병해충 진단…AI 공공데이터 25종 개방 재생에너지 기술 잠재량부터 농작물 병해충 진단까지 국내 인공지능(AI) 기업 경쟁력을 강화하고 신산업을 육성하기 위한 공공데이터 25종이 추가 개방된다. 행정안전부는 민간 부문 수요가 높고 경제적 파급효과가 큰 'AI·고가치 공공데이터 TOP 100' 가운데 25종을 올해 중에 개방하기 위한 세부 사업계획을 확정했다고 1일

전국민 AI 축제 열린다…생성형 AI 직접 체험 초중고 학생부터 고령자까지 누구나 인공지능(AI)을 체험할 수 있는 온라인 AI 축제가 열린다. 참여자 100만명 이상을 목표로 한 대규모 행사다. 과학기술정보통신부와 교육부는 '2026 클릭온 AI 시즌1'을 27일부터 7월 7일까지 총 6주간 개최한다고 밝혔다. '클릭온 AI'는 전국민 AI 경진대회의 주요 트랙으

AI가 영상 상황 이해 현실적 효과음 생성…물체 질량·속도 추론 기술 개념도 ⓒKAIST 제공 한국과학기술원(KAIST)은 전산학부 오태현 교수 연구팀이 영상 속 상황을 이해해 보다 현실감 있는 소리를 생성하는 인공지능(AI) 기술 '파바스'(PAVAS)를 개발했다고 26일 밝혔다. POSTECH·소니 AI가 참여한 공동 연구진은 영상 속 물체의 질량과 속도 등 눈에

"AI로 전 세계 메탄 배출 더 빠르고 정확하게 감시한다" 연구 그림. 전 세계 메탄 플룸 분포 및 주요 배출원 분석 결과 ⓒ울산과학기술원 제공 울산과학기술원(UNIST) 연구진이 인공지능(AI)을 이용해 전 세계 메탄 누출을 더 빠르고 정확하게 감시할 수 있는 탐지 기술을 개발했다. 울산과학기술원은 지구환경도시건설공학과 임정호 교수 연구팀이 초분광 위성 데이터에서 메탄 구름 기둥(플룸)을

"AI와 먼저 상담"…정신과 초진 면담 지원 기술 나왔다 시스템 개요도 ⓒ한국과학기술원(KAIST) 제공 한국과학기술원(KAIST)은 거대언어모델(LLM) 기반의 정신과 초진 면담 지원 기술을 개발했다고 24일 밝혔다. 전산학부 이의진·산업디자인학과 이탁연 교수 연구팀과 강남세브란스병원 정신건강의학과 김은주 교수 연구팀은 인공지능(AI)이 환자 응답에 따라 대화의 흐름을 조정

목록으로

연재 보러가기 사이언스 타임즈에서만 볼 수 있는
특별한 주제의 이야기들을 확인해보세요!

인기 뉴스 TOP 10

속보 뉴스

QUICK LINK

문화체육관광부

COPYRIGHT ⓒ KOSAC. ALL RIGHTS RESERVED

ADD : 06130 서울특별시 강남구 테헤란로7길 22, 4~5층(역삼동, 과학기술회관 2관) 한국과학창의재단
TEL : (02)555 - 0701 / MAIL: sciencetimes@kosac.re.kr / 시스템 문의 : (02) 6671 - 9304 / FAX : (02)555 - 2355
정기간행물 등록번호 : 서울아00340 / 등록일 : 2007년 3월 26일 / 발행인 : 정우성 / 편집인 : 차대길 / 청소년보호책임자 : 차대길
한국과학창의재단에서 운영하는 모든 사이트의 콘텐츠는 저작권의 보호를 받는 바 무단전재, 복사, 배포 등을 금합니다.

사이언스타임즈는 과학기술진흥기금 및 복권기금의 재원으로 운영되며, 우리나라 과학기술 발전과 저소득·소외계층 등의 복지 증진에도 기여하고 있습니다.

굿컨텐츠서비스 로고