빅데이터 시대를 맞아 ‘데이터 사이언티스트(Data Scientist)’의 인기가 하늘로 치솟고 있다. 16일 ‘인포월드(InfoWorld)’에 따르면 거의 모든 산업에 걸쳐 많은 기업들이 엄청난 보수를 제시하며 숙련된 전문가를 찾고 있는 중이다.
실제로 인터넷 경매업체인 이베이는 임직원 1만7000여 명 중 6000명이 데이터 관련 업무를 맡고 있는 중이다. 세계 최대 전자상거래업체인 아마존 역시 데이터 중심 조직 문화를 캐치프레이즈로 내걸고 데이터 사이언티스트 모시기에 나서고 있다.
많은 기업들이 데이터 전문가를 찾고 있지만 유능한 전문가를 찾기는 어려운 상황이다. IBM 연구에 따르면 오는 2020년까지 미국에서 필요로 하게 될 데이터 사이언티스트의 수는 272만 명에 이를 것으로 추산하고 있다.
그러나 현재 충원되고 있는 데이터 사이언티스트의 수는 36만4000명에 불과하다. 이에 따라 부족한 데이터 사이언티스트 수를 보충하려면 매년 약 70만 명의 데이터 전문가를 양성하거나 다른 나라 등에서 초빙해야 한다.
데이터 사이언티스트로서의 역량도 문제가 되고 있다. 방대한 데이터에서 목적에 따라 필요한 정보를 찾아내 제품이나 서비스를 개선해나가야 하는 만큼 새로운 것을 읽어낼 수 있는 판별력, 분석력이 필요하다.
많은 기업들이 자사 업무에 맞는 뛰어난 데이터 사이언티스트를 찾고 있지만 쉽지 않은 일이다. 인사 책임자들은 뛰어난 능력의 소유자가 아니라 자사 업무에 손쉽게 적응할 수 있는 데이터 사이언티스트를 구한다고 말했다.
‘인포월드’에서는 기업들이 어떤 데이터 사이언티스트를 원하는지 MS, 구글, IBM, AWS, 데이터브릭스(Databricks), HPE 등을 취재했다. 그리고 데이터 사이언티스트가 갖춰야 할 업무 역량을 5가지로 정리했다.
데이터 분석·양적추론 능력 갖춰야
소프트웨어 회사인 SAS는 뛰어난 데이터 사이언티스트의 특징으로 데이터 분석(Analytical skills)·양적 추론(Analytical skills) 능력을 강조하고 있다. 강력한 논리를 지니고 있으면서 끊임없이 변화하고 있는 상황에서 새로운 팩트를 분석·추론해낼 수 있어야 한다는 것.
자사를 대상으로 한 조사 결과 전체 데이터 사이언티스트 가운데 41%가 이 능력을 갖추고 있는 것으로 나타났다. 기업들은 데이터 사이언티스트가 편견이 없어야 한다고 강조하고 있다. 데이터를 감정적으로 다루지 않고 냉철하게 볼 수 있어야 한다는 것.
이런 능력의 보유자들은 데이터 상황을 쉽게 이해하고 또한 명확하게 데이터 개념들을 설명할 수 있다고 보고 있다. 이 능력을 갖추기 위해서는 개인적인 역량을 갖추어야 하지만 수학, 통계적인 기반 역시 요구되고 있다.
데이터를 스토리텔링할 수 있어야
데이터 사이언티스트들은 데이터 분석을 한 후 그 결과를 사내 비전문가들에게 설명해야 한다. 그런 만큼 데이터 상황을 잘 모르더라도 데이터와 관련된 내용을 이해할 수 있도록 설명할 수 있는 능력이 필요하다.
능력 있는 데이터 사이언티스트일수록 이런 표현력을 지니고 있다는 것이 인사 담당자들의 견해다. 데이터를 어떻게 수집했으며, 그 데이터를 어떻게 분석했고, 그 결과 어떤 예측을 하게 되었는지 스토리텔링(story telling)을 하듯이 설명할 수 있어야 한다.
팀워크를 살릴 수 있는 요원이 되라
크라우드 소싱 업체인 크라우드플라워(CrowdFlower)는 데이터 사이언티스트들을 대상으로 조사를 행했다. 조사 결과 이들은 자신에게 할당된 업무 시간의 60% 이상을 데이터 클리닝(data cleaning), 데이터 구성(data organization) 등 업무에 할애하고 있는 것으로 나타났다.
이전에 ‘뉴욕타임즈’는 이 비율을 80%로 발표한 바 있다. 이런 높은 수치가 나오는 것은 데이터 사이언티스트들이 자신의 업무에 집중하고 있다는 것을 말해주고 있다. 자신의 일에 만족하고 있다는 사실을 또한 말해주고 있다. 이런 집중력이 발휘될 수 있는 것은 팀 분위기 때문이다.
각 기업들은 이에 따라 일에 몰두할 수 있도록 팀 워크를 조율해나갈 수 있는 팀 플레이어(team player)를 찾고 있다. 이들을 통해 새로운 과제를 발굴하고, 또한 팀원들이 협력해 새로운 영역을 개척해나갈 수 있을 것으로 보고 있다.
기존 틀에서 벗어나 사고할 수 있어야
데이터 사이언티스트의 기본적인 임무는 데이터를 사용해 문제를 해결하는 일이다. 그러나 뛰어난 문제 해결자(problem solver)가 되기 위해 ‘정해진 틀에서 벗어나 상황 등을 추론해나갈 수 있는’ 능력을 갖춰야 한다.
이런 능력이 요구되고 있는 것은 산업 각 분야가 끊임없이 변화하고 있기 때문이다. 이에 따라 데이터 사이언티스트 역시 변화하고 있는 상황 안에서 많은 사람들이 생각하지 못하는 예고되지 않은 일들을 추론해낼 수 있어야 한다.
크라우드플라워에 따르면 그러나 이런 능력을 모두 갖추고 있는 것이 아니다. 자체 조사 결과 전체 데이터 사이언티스트 가운데 14%가 자신이 그런 능력을 갖추고 있다고 응답했다. 이에 따라 인사부서에서는 이런 능력을 갖춘 사람을 찾고 있는 중이다.
필요한 사람은 호기심이 가득한 사람
데이터 사이언티스트의 일과 호기심(curiosity)은 밀접한 관계가 있다. 링크드인의 수닐 쉬르구피(Sunil Shirguppi) 인터내셔날 데이터 서비스 책임자는 데이터 사이언티스트의 자격 요건으로 호기심을 첫 번째로 꼽았다.
호기심으로 시작돼 데이터를 분석하게 되고 또한 자신의 직관력, 데이터 수집력, 표준화, 통계, 모델링, 비주얼라이제이션, 커뮤니케이션 능력을 발휘할 수 있다고 말했다. 가설을 세우고 데이터 분석과 추론을 시작할 수 있는 분기점이라고 할 수 있다.
(7352)
로그인후 이용 가능합니다.
44억년 전 초기 지구에서 생명체 재료가 되는 탄화수소, 알데히드, 알코올 등 유기 분자들이 철이 풍부한 운석이나 화산재 입자들이 촉진하는 화학반응을 통해 생성된 것으로 보인다는 연구 결과가 나왔다.
국내 연구진이 안정적이고 부작용이 적으면서 수술 후 전이·재발을 막을 새로운 형태의 암 치료 백신 개발 가능성을 열었다. 한국연구재단은 울산대 진준오 교수 연구팀이 암세포에서 얻은 표면 단백질을 항원으로 이용한 지질 나노입자(AiLNP)를 개발하는 데 성공했다고 25일 밝혔다.
복통, 설사, 직장 출혈, 철 결핍 빈혈(iron deficiency anemia) 등 4가지 징후 또는 증상이 50세 이전에 나타나는 조기 발생(early-onset) 대장암의 경고 신호라는 연구 결과가 나왔다.
화학 섬유에서 나오는 미세 플라스틱 오염에 경각심을 갖고 생분해가 가능한 옷을 찾는 착한 소비가 생기고 있지만 생분해를 내세우며 개발된 섬유도 실제 환경에서는 제대로 썩지 못하는 것으로 나타났다.
유인 화성 탐사를 앞두고 이것이 실제 가능한지 관심이 높은 가운데 쥐 머리에 초음파를 쏴 동면 상태를 안전하게 반복 유도할 수 있다는 연구 결과가 나와 주목된다. 미국 세인트루이스 워싱턴대(WUSL) 홍 천 교수팀은 26일 과학저널 '네이처 신진대사'(Nature Metabolism)에서 초음파 펄스를 생쥐와 쥐의 뇌 특정 부위에 쏴 동면 상태를 안전하게 가역적으로 유도하는 데 성공했다고 밝혔다. 연구팀은 이 방법은 머리 위에 초음파 방출기를 장착하는 비침습적 방식으로 초음파를 쏴 뇌의 신경 세포를 일시적으로 활성화해 체온을 낮추고 신진대사를 늦출 수 있다며 향후 의학이나 장거리 우주 비행에 응용될 수 있을 것이라고 말했다.
플라보놀 성분을 함유한 사과와 블랙베리 등을 섭취하는 것이 노인의 '노쇠' 발현 가능성을 낮춘다는 연구 결과가 나왔다. 노쇠(frailty)는 나이가 들면서 신체 기능이 필연적으로 떨어지는 노화(aging)와는 구분되는 것으로, 일상에 지장을 줄 만큼 나이에 비해 신체기능이 심각하게 약해져 낙상과 골절 등을 초래할 위험이 높고 장애와 사망으로 이어질 수 있다. 미국 하버드의대 계열 임상 연구소인 '힌다·아서 마커스 노화연구소' 등에 따르면 플라보노이드의 하위그룹인 '플라보놀' 섭취와 노쇠의 연관성을 분석한 연구 결과를 '미국 임상영양학 저널'(American Journal of Clinical Nutrition)에 발표했다.
북극해 식물플랑크톤이 유엔 '기후변화에 관한 정부 간 협의체'(IPCC)의 예상치보다 최대 3배 감소할 것이라는 연구 결과가 나왔다고 극지연구소가 24일 밝혔다. 포항공과대학교 국종성 교수 연구팀, 극지연구소 양은진 박사, 미국 스크립스 해양연구소 임형규 박사 등으로 구성된 국제공동연구팀은 쇄빙연구선 아라온호 탐사를 포함한 다양한 북극해 현장 탐사에서 획득한 데이터를 활용해 북극해 식물플랑크톤의 농도 예측기법을 개발했다. 이를 적용한 결과 이산화탄소 배출 시나리오에 따라 차이는 있었지만, 2100년 식물플랑크톤의 농도는 기존 IPCC 5차, 6차 보고서의 예측과 비교할 때 감소 폭이 최대 3배로 늘었다.