사이언스타임즈

건너뛰기링크

본문 바로가기
주메뉴 바로가기
하단 바로가기

통합검색

과학기술

전체

과학기술
정보통신기술

정보통신기술: 연합뉴스

2025-10-15

KAIST, 멀티모달 인공지능 성능 높이는 학습기법 개발 어울리지 않는 데이터 섞어 상충하는 신호 해석 유도

글자크기 설정

KAIST 황의종 교수 연구팀 ⓒ KAIST 제공

한국과학기술원(KAIST)은 멀티모달 인공지능(AI)의 성능을 높일 수 있는 학습기법을 개발했다고 14일 밝혔다.

멀티모달은 텍스트, 이미지, 음성, 영상 등 다양한 유형의 데이터를 동시에 인식해 처리할 수 있는 기술을 말한다.

다만 그림과 글자가 함께 있을 때 그림에 사람의 시선이 먼저 가는 것처럼, 멀티모달 AI도 특정 데이터에 더 크게 의존하는 경향이 있다.

이처럼 한쪽 데이터에 치우쳐 판단하게 되면 예측 성능이 떨어질 수 있다.

전기및전자공학부 황의종 교수 연구팀은 멀티모달 인공지능이 모든 데이터를 고르게 인식해 더 정확하게 예측할 수 있도록 돕는 새로운 학습 데이터 증강 기술을 개발했다.

서로 어울리지 않는 '비정렬 데이터'를 섞어 의미가 일치하지 않는 데이터를 생성, 학습에 포함함으로써 모델이 상충하는 신호를 해석하도록 유도했다.

이어 의미가 유사해 혼동하기 쉬운 비정렬 샘플에 더 큰 학습 비중을 부여하는 가중치 기법을 통해 성능을 높였다.

황의종 교수는 "AI 성능을 높이려면 모델 구조(알고리즘)만 바꾸는 것보다 어떤 데이터를 어떻게 학습에 쓰느냐가 훨씬 중요하다"며 "이번 연구를 통해 멀티모달 인공지능이 특정 데이터에 치우치지 않고 균형 있게 정보를 활용할 수 있도록 데이터 자체를 설계하고 가공하는 접근법을 제시했다"고 말했다.

이번 연구 결과는 오는 12월 미국 샌디에이고와 멕시코 멕시코시티에서 열리는 AI 분야 권위 있는 학회인 '신경정보처리시스템학회'(NeurIPS)에서 발표된다.

연합뉴스: 저작권자 2025-10-15 ⓒ ScienceTimes

태그(Tag)

관련기사

"저전력 뉴로모픽 AI용 '스파이킹 신경망' 새 학습기법 개발" 국내 연구진이 사람 뇌처럼 필요한 순간에만 신호를 주고받으며 적은 에너지로 작동, 저전력 뉴로모픽 인공지능(AI)에 사용될 수 있는 '스파이킹 신경망'(SNN)의 학습 성능을 높이는 새로운 기법을 개발했다. 학습 방식에 따라 인공지능 모델이 도달하는 학습 지형 비교. 기존 인공지능에 사용되는 심층신경망(DNN)은 완만한 학습 지형

KAIST, 집에서 뇌혈관질환 위험 신호 미리 찾는 AI 기술 개발 연구 이미지(AI생성) ⓒ한국과학기술원(KAIST) 제공 한국과학기술원(KAIST)은 실제 고령자의 일상생활 데이터를 분석해 집에서 나타나는 작은 변화만으로 뇌혈관질환 위험을 조기에 감지하는 인공지능(AI) 기술을 개발했다고 12일 밝혔다. 연구팀은 ㈜리본케어가 실제 주거환경에서 수집한 고령자 1천224명의 라이프로그 데이터(14일

한국기술교육대 변해원 교수, 차세대 유방암 AI 진단 모델 개발 변해원 교수 ⓒ한국기술교육대 제공 한국기술교육대는 1일 미래융합학부 및 고용서비스정책학과 변해원 교수가 유방암 진단의 정확도를 획기적으로 높인 차세대 인공지능 모델 '크로스 어텐션 다중스케일 비전 트랜스포머' 기술을 개발했다고 밝혔다. 연구 성과는 독일에서 발간하는 글로벌 의학 분야 학술지인 '메디신'(

학습 없이 0.4초 만에 이미지 복원 뚝딱, AI의 눈이 밝아진다 인공지능(AI) 기반 컴퓨터 비전 시스템의 고질적 약점으로 꼽혀온 저해상도 특징맵(feature map) 문제를 별도 훈련 데이터 없이 해결하는 기술이 등장했다. KAIST와 미국 MIT, 마이크로소프트 연구진이 공동 개발한 '업샘플 애니싱(Upsample Anything)'은 AI가 제한된 메모리 환경에서도 주변을 더 정밀하게 볼 수 있도록

UNIST "멀티모달 AI가 더 잘 배우는 이유 수학적으로 규명" UNIST 윤성환 교수(왼쪽)와 이재준 연구원 ⓒ울산과학기술원 제공 이미지나 영상, 음성, 텍스트 등 다양한 형태의 데이터를 함께 학습하는 '멀티모달(Multimodal) 인공지능(AI)'이 한 종류의 데이터만 학습한 AI보다 더 정확하고 안정적인 이유를 국내 연구진이 수학적으로 규명했다. 울산과학기술원(UNIST)은

보존과학, K-컬처의 시간을 지키다 국보 '경주 금령총 기마 인물형 토기'는 1924년 발굴 이후 수십 년간 정교한 고대 의례용 조각상으로만 기록되어 있었다. 그러나 컴퓨터 단층촬영(CT)의 투시 기술이 개입하면서 외형에 가려져 있던 유물의 실제 기능적 메커니즘이 확인됐다. 스캔 데이터를 열자, 인물 배후에 액체를 주입하는 깔때기형 수구(受口)가 나타났고, 말 가슴 전면에는 이

국내산 벤토나이트로 통풍·신장질환 진단…바이오센서 개발 벤토나이트 ⓒ한국지질자원연구원 제공 한국지질자원연구원(KIGAM)은 포항지질자원실증연구센터 김재환 박사가 캐나다 캘거리대 연구팀과 국내 동남권산 천연 점토광물인 벤토나이트를 활용해 차세대 전기화학 바이오센서를 개발했다고 16일 밝혔다. 연구팀은 전도성이 낮아 바이오센서 활용에 한계를 보이던 벤토나이트에 다중벽 탄소나노튜브(MWCNT

소수 영상만으로 인간의도 학습…KAIST, 피지컬AI 원천기술 개발 VOTP 연구이미지(AI 생성) ⓒ한국과학기술원(KAIST) 제공 한국과학기술원(KAIST)은 단 몇 개의 영상만으로 인공지능(AI)이 인간의 의도와 판단 기준을 학습할 수 있는 원천기술을 개발했다고 10일 밝혔다. 전기및전자공학부 유창동 교수 연구팀이 개발한 'VOTP' 기술은 몇 개의 좋은 사례와 나쁜 사례 영상만

밤길 물웅덩이도 척척 인식…KAIST, 자율주행 '눈' 센서 개발 편광 인공지능 센서 플랫폼 실험 이미지 ⓒ한국과학기술원(KAIST) 제공 한국과학기술원(KAIST) 연구진이 어두운 도로 위 물과 아스팔트를 구분하지 못하던 기존 센서의 한계를 넘어 빛의 '방향'까지 읽고 스스로 반응을 바꾸는 차세대 편광 센서를 개발했다. 12일 KAIST에 따르면 기존 이미지 센서는 빛의 밝기 정보

친절한 AI를 어디까지 믿을 것인가 대형 언어모델(LLM)을 사용하다 보면 과도하게 친절한 말투의 답변을 경험해 본 적이 있을 것이다. ⒸGetty Images 대형 언어모델(LLM)을 일상에서 사용하는 사람이라면 과도하게 친절한 것 같은 인공지능의 말투를 경험해 본 적이 있을 것이다. 질문을 하자마다 “좋은 질문이에요!” 또는 “정말 멋진

목록으로

연재 보러가기 사이언스 타임즈에서만 볼 수 있는
특별한 주제의 이야기들을 확인해보세요!

인기 뉴스 TOP 10

속보 뉴스

QUICK LINK

문화체육관광부

COPYRIGHT ⓒ KOSAC. ALL RIGHTS RESERVED

ADD : 06130 서울특별시 강남구 테헤란로7길 22, 4~5층(역삼동, 과학기술회관 2관) 한국과학창의재단
TEL : (02)555 - 0701 / MAIL: sciencetimes@kosac.re.kr / 시스템 문의 : (02) 6671 - 9304 / FAX : (02)555 - 2355
정기간행물 등록번호 : 서울아00340 / 등록일 : 2007년 3월 26일 / 발행인 : 정우성 / 편집인 : 차대길 / 청소년보호책임자 : 차대길
한국과학창의재단에서 운영하는 모든 사이트의 콘텐츠는 저작권의 보호를 받는 바 무단전재, 복사, 배포 등을 금합니다.

사이언스타임즈는 과학기술진흥기금 및 복권기금의 재원으로 운영되며, 우리나라 과학기술 발전과 저소득·소외계층 등의 복지 증진에도 기여하고 있습니다.

굿컨텐츠서비스 로고