파편화된 개별 데이터를 공유·연합·학습하여 활용 범위 넓혀야
최근 연합학습이 주목받고 있다. 연합학습은 로컬에서 생산된 데이터를 로컬 클라이언트에서 저장하고 학습하는 로컬라이징 방식을 뜻한다. 이미 다양한 산업계가 빅데이터를 통해 AI모델을 구축·활용하고 있는바, 기존의 방식과는 차이가 있는 연합학습을 예의주시하는 모양이다.
디지털 기술이 발전함에 따라 데이터의 양과 활용이 급증하면서 데이터가 경쟁력이 시대가 되었다. ⓒ게티이미지뱅크
데이터가 경쟁력인 시대다. 디지털 기술이 발전함에 따라 데이터의 양과 활용이 급증한 이유다. 생산의 측면에서 보면 개별 스마트 디바이스, 사물인터넷, 엣지 컴퓨터, 개별 기관 및 산업 등을 통해 독립적으로 생산된 데이터까지 더해져 그 양이 기하급수적으로 증가하는 추세다. 그리고 이를 기반으로 한 AI기술이 다양한 산업 분야에 도입·적용되면서 데이터의 중요성이 그 어느 때보다도 높다. 그렇다 보니 데이터를 생성, 수집, 학습하는 기술에 대한 수요 또한 늘고 있다.
대규모 데이터는 AI기술의 핵심 재료다. 때문에 데이터를 학습시키는 데이터 사이언스는 머신러닝, 딥러닝, 인공 신경망 기술을 축으로 발전을 거듭하고 있으며, 일반적으로 AI는 대규모 데이터를 세트로 학습하고 인공신경망이 각 데이터를 중앙서버로 보내는 방식으로 구축됐다. 그러나 최근 구글이 차세대 AI학습 방법으로 연합학습을 선택하고, 스마트폰에 적용하면서 이에 대한 관심이 집중되고 있다.
ETRI Insight(2020)를 인용하면 “연합학습은 여러 위치에서 분산 저장된 데이터를 직접 공유하지 않으면서 서로 협력하여 AI모델을 학습할 수 있는 분산형 머신러닝 기법”이다. 이 방법에서는 개별 데이터를 중앙서버로 전달하지 않고, 중앙서버의 AI모델을 클라이언트로 보내 각각의 데이터로 모델을 훈련한다. 그리고 중앙서버는 개별 클라이언트에서 학습된 데이터를 모아 최적의 AI모델을 만든다.
AI모델을 만들기 위해 개별 생산된 데이터를 하나의 클러스터나 중앙서버에 모아 일괄적으로 학습하게 하는 기존의 방식과는 차이가 있다. 비유하자면 학생을 학교에 모아 학습시키는 기존의 방법과는 달리 연합학습은 최적의 학습방법을 각 학생에게 분산·전달하여 이 방법대로 학습하고 훈련하는 것. 즉 방향성의 차이다.
클러스터링 연합학습 구조 ⓒ한국지능정보사회진흥원 「산업분야에서 연합학습 동향 및 시사점」에서 캡쳐
이미 산업계에서는 기존의 데이터 처리 방식의 한계를 넘어선 새로운 기술에 대한 수요가 높았다. 분산형 데이터가 급증하고 있는 현실에서 이들을 클라우드 서버에서 수집·분석하기 위해서는 시간 및 비용 측면에서 많은 제약이 따르기 때문이다. 뿐만 아니라 데이터 이슈에 반드시 동반되는 개인정보보호 문제도 걸림돌이다. 우리나라는 데이터 3법을 통해 개인정보를 보호하겠다는 방침을 내놨지만, 현실적으로는 법의 테두리 안에서 기술을 재단하면 발전에 제약이 따른다는 평이다.
대규모 데이터는 AI기술의 핵심 재료다. ⓒ게티이미지뱅크
특히 의료 분야가 그렇다. 의료 데이터는 대표적인 분산형 데이터다. 때문에 의료 산업을 혁신하기 위해 관리 주체별로 생성·관리되는 개별 데이터를 수집하는 것부터가 난관이다. 어렵게 데이터를 모으고 난 후에도 각기 다른 포맷의 이질적 데이터를 결합하고 학습시키고 실제로 유용한 데이터로 가공하기까지는 너무 멀다는 것.
이러한 상황을 반영하듯 보건의료 분야는 연학학습 분야를 활발하게 연구하고 있다. 각기 서로 다른 기관에서 보유하고 있는 난치성 질환이나 신종 감염병 데이터와 같은 분산형 데이터를 중앙 서버로 집중시키기 위해 데이터 수집 및 처리의 한계에 부딪혔지만 연합학습으로 이를 극복할 수 있을 것으로 기대된다.
에너지 분야도 연합학습 연구를 통해 데이터 활용 범위를 넓히겠다는 의지를 밝혔다. 전력망에 ICT기술을 접목하여 공급자와 수요자 간에 양방향으로 실시간 정보를 교환하는 차세대 전력 인프라 시스템인 스마트 그리드 연구가 진행되고 있다. 또한 스마트 미터를 통한 소비자 식별 및 행동 파악, 전기수요예측 등도 활발히 진행 중이다.
“다수의 대중이 소수의 엘리트보다 더 나은 해법을 제시한다.”
제임스 서로위키(James Surowiecki)가 「대중의 지혜」에서 주장한 말이다. 또한, 다수의 개체들이 서로 협력함으로써 얻게 된 집단적 능력을 뜻하는 ‘집단지성’을 상징하는 말이기도 하다.
실제로 인류사는 다양성을 가진 집단의 통합된 지성이 개인의 능력 범위를 넘어선 힘을 통해 진화되어 왔다고 해도 과언이 아니다. 그리고 정보화 시대, 인터넷 시대가 도래하면서 파편화된 지식을 공유하고, 협동하면서 새로운 지식을 생산하는 집단지성이 사회에 미치는 영향이 커졌다.
앞으로 연합학습은 디지털 집단지성으로 확대될 것으로 예상된다. ⓒ게티이미지뱅크
연합학습도 집단지성과 같은 구조로 진행되는 모양새다. 개별 데이터가 갖는 한계를 극복하고 연합학습을 통해 그 가치와 활용도를 높이는 것, 그로 인해 사회의 필요를 채우는 솔루션을 도출하는 과정이 집단지성의 그것과 닮았기 때문이다.
앞으로 연합학습은 디지털 기술의 발전과 함께 급증하는 데이터의 소유권 및 활용 문제를 해결하는 대안으로, 디지털 집단지성으로 확대될 것으로 예상된다.
(1576)
로그인후 이용 가능합니다.
/ 이종호 과학기술정보통신부 장관은 29일 “극한소재 실증연구 기반조성 사업은 우리나라 극한소재 실증연구 역량을 강화하고 기술경쟁력을 확보할 수 있는 교두보 마련의 기회가 될 것”이라고 말했다. 이 장관은 이날 오후 경남 창원 한국재료연구원을 방문해 극한소재 실증연구 기반조성 사업 현황을 점검한 자리에서 이같이 밝혔다고 과기정통부가 전했다. 이 사업은 초고온·극저온·특정극한 등 미래 유망소재
/ 금융권에서 전산장애 사태가 발생하지 않도록 금융당국과 각 금융협회가 가이드라인 제정에 나섰다. 금융감독원은 29일 금융 정보기술(IT) 안전성 강화를 위한 가이드라인 제정을 위한 태스크포스(TF)를 구성하고 이날 금감원 본원에서 각 금융협회와 첫 회의를 열었다고 밝혔다. TF는 오는 6월까지 성능관리, 프로그램 통제, 비상대책 등 3개 과제를 검토하고, 각 협회는 금융회사 의견을 수렴해
/ 시각이나 촉각 센서 도움 없이 계단을 오르내리고 울퉁불퉁한 곳에서도 넘어지지 않고 움직이는 사족보행 로봇기술이 국내 연구진에 의해 개발됐다. 한국과학기술원(KAIST) 전기및전자공학부 명현 교수 연구팀은 잠에서 깬 사람이 깜깜한 상태에서 시각적인 도움 없이도 화장실을 갈 수 있는 것 같은 블라인드 보행(blind locomotion)을 가능케 하는 로봇 제어 기술 ‘드림워크’(DreamWaQ)를 개발했다고 29일 밝혔다.
/ 챗GPT 등장 이후 인공지능(AI) 교육에 대한 관심이 높아지는 가운데 AI를 바르게 활용할 ‘리터러시’(문해력)를 키워야 한다는 분위기가 조성되고 있다. 서울시교육청은 29일 학교 AI 교육이 나아갈 방향에 대해 현장 교원의 의견을 수렴하는 ‘챗GPT 시대의 AI 리터러시’ 토론회를 이날과 31일 양일간 개최한다고 밝혔다. 토론회에서는 ‘서울형 AI 윤리교육 모델’을 상세히 소개하고 학교의
/ 서울디지털재단은 이달 28∼31일 대만 타이베이에서 열리는 아시아 최대 규모의 스마트시티 전시인 ‘SCSE(Smart City Summit & Expo) 2023’에 서울관을 최초로 설치했다고 29일 밝혔다. 올해 SCSE 주제는 ‘스마트시티의 새로운 차원으로 이끄는 디지털 전환’이다. 47개국에서 1천700개 부스를 마련했다. 서울관은 서울시의 디지털 포용정책 등을 알리는 정책존, 서울의 혁신 서비스와 솔루션을 효과적으로 소개하는
/ “사람마다 속도나 원인이 다른 관절의 노화를 어떻게 하면 제어할 수 있을지 고민이 많았지요.” 휴대전화 센싱(sensing) 기술로 관절의 노화 인자를 찾아내 치료하는 연구에 성공한 원광대학교 생명과학부 진은정 교수는 28일 유전자 전사체(유전체에서 전사되는 RNA 총체)를 먼저 설명했다. 사람마다 얼굴이 다르듯 유전자의 발현 양상이 천차만별인데, 이를 분석·통제하는 게 생명과학 연구의 기본이다. 유전자의
/ 식품의약품안전처는 올해 들어 인공지능(AI)을 활용한 소프트웨어 3종을 혁신의료기기 통합심사·평가 대상으로 지정했다고 27일 밝혔다. 지정된 제품은 딥노이드의 뇌동맥류 뇌영상검출·진단보조소프트웨어, 코어라인소프트의 뇌출혈 뇌영상검출·진단보조소프트웨어, 메디컬에이아이의 심부전·심전도분석소프트웨어다. 혁신의료기기 통합심사·평가 제도는 식약처, 건강보험심사평가원, 한국보건의료연구원이 순차적으로 진행하던 평가를 통합적으로 진행해, 의료기기가 허가와 동시에 신속하게 의료 현장에 진입하게 하는 제도다. 딥노이드 제품은 뇌혈관 MRA(자기공명혈관조영술) 영상을