과학저술 대신할 ‘인공신경망’ 개발

어려운 과학 개념 설명, 논문 요약 등 가능해

과학이 발전하면서 과학저술가(science writer)의 활동 역시 다양해지고 있다.

첨단 과학과 관련된 새로운 소식을 전달하기도 하지만 새로운 연구 결과를 설명하고 요약해주는 등 일반 대중에게 과학을 이해하게 하려는 다양한 시도를 하고 있다.

최근 들어서는 이 과정에 인공지능(AI)이 가담하고 있다. 그동안 사람이 해오던 과학저술 기능을 대신할 수 있는 ‘신경망(neural network)’ 기술이 개발돼 그동안 과학저술가들이 해온 일을 대신하고 있는 중이다.

어려운 과학 개념, 논문, 기사 등을 쉽게 설명하고, 또 요약해줄 수 있는 인공신경망이 개발됐다. 향후 과학커뮤니케이션 향방에 큰 영향을  ⓒgeneticliteracyproject.org

어려운 과학 개념, 논문, 기사 등을 쉽게 설명하고, 또 요약해줄 수 있는 인공신경망이 개발됐다. 향후 과학커뮤니케이션 향방에 큰 영향을 미칠 것으로 예상된다. ⓒgeneticliteracyproject.org

과학저술가 대신할 수 있는 신경망 

‘신경망’이란 인간의 뇌 기능을 모방한 네트워크를 말한다.

생물학적인 신경망과 구별하기 위해 ‘인공 신경망(artificial neural network)’이란 용어를 사용하기도 한다.

이 기술이 처음 제안된 것은 1943년이다. 1958년에는 지도 학습(supervised learning)이 가능한 퍼셉트론(perceptron) 모델이 개발됐고, 2010년대 들어서는 수십 개의 은닉층(hidden layer)이 들어 있는 심층 신경망(Deep Neural Network)이 등장했다.

최근 들어서는 체스와 바둑은 물론 이미지 및 자연어 처리, 음성 인식 등의 분야에서 기존의 방식을 뛰어넘는  ‘신경망’들이 속속 개발되고 있다. 심지어 과학저술가를 대신할 수 있는 신경망까지 등장했다.

19일 ‘MIT 뉴스’는 MIT 과학자들이 관련 기업들과 협력해 과학저술을 대신할 수 있는 ‘인공신경망’을 개발했다고 전했다.

이 신경망은 신문에 게재된 과학 기사를 읽어주고, 어려운 내용의 기사를 쉽게 설명하는 것은 물론, 쉬운 영어로 짧게 요약해줄 수 있는 해설 기능을 지니고 있다.

신경망에 적용한 기술은 언어처리(language processing) 외에 기계번역( machine translation), 음성인식(speech recognition) 기술 등이다. 그동안 개발해온 언어 관련 인공지능 기술이 총동원되고 있다.

관계자들은 과학 커뮤니케이터(science communicators)처럼 어려운 과학을 쉽게 설명해줄 수 있는 이 신경망 기능이 과학에 대한 사전지식이 부족한 일반 대중은 물론 학생, 연구원, 심지어 과학저술가에 이르기까지 다양하게 활용될 수 있을 것으로 기대하고 있다.

또한 대중과의 소통을 위해 국가 차원에서 진행돼온 과학커뮤니케이션 활동에 큰 영향을 미쳐 향후 과학문화 패턴에 큰 변화를 가져올 것으로 예상하고 있다.

관련 논문은 미국 컴퓨터언어학협회에서 발간하는 국제학술지 ‘TACL(Transactions of the Association for Computational Linguistics)’ 최근호에 게재됐다.

과학 커뮤니케이션 활동에 큰 변화 예고 

처음서부터 과학저술 신경망을 개발하려 했던 것은 아니다.

연구진은 물리학 분야에서 발생하는 어려운 용어 해석 문제를 해결하기 위해 신경망을 개발하고 있던 중 이 알고리듬을 과학 전반에 적용할 수 있다고 판단했다.

연구를 이끈 MIT의 물리학자 마린 소랴 치치(Marin Soljačić) 교수는 “과학저술 신경망이 새로운 지식을 학습할 수 있는 인간 뇌를 닮았으며, 물리학뿐만 아니라 광범위한 분야에서 활용이 가능하다.”고 설명했다.

이 알고리듬은 어떤 개념에 대해 사람이 이해해나가는 것처럼 특정 언어에 대한 개념적 패턴 이해가 가능하다. 또한 다양한 개념들을 연결해 새로운 정보를 도출할 수 있다. 이는 어려운 용어가 다수 포함돼 있는 연구 논문을 쉽게 설명할 수 있는 기능이 있다는 것을 의미한다.

연구팀은 이 알고리듬을 ‘RUM(rotational unit of memory)’으로 호칭하고 있다.

치치 교수는 “과학저술 신경망을 개발하기 위해 순환 신경망의 일종인 양방향 LSTM(Long short-term memory), GRU(gated recurrent units) 등 첨단 알고리듬을 다양하게 적용했다.”고 밝혔다.

또한 행렬을 중복시키는 기존 방식 대신 각각의 단어를 다차원 공간에서 벡터(크기와 방향으로 정해지는 양) 처리하는 방식을 채택해 새로운 기능을 개발할 수 있었다고 말했다.

치치 교수는 ‘RUM’을 활용할 경우 두 가지 일을 병행할 수 있다고 말했다. “과학적 개념과 문장들을 포괄적으로 이해할 수 있으며, 이 기능을 활용해 이전의 입력된 정보들을 보다 더 상세하게 기억해낼 수 있다.”고 설명했다.

연구진은 과학정보를 자연어로 주고받을 수 있는 언어  처리 과정을 마쳤으며, 어려운 과학 기사를 설명하고, 또 요약할 수 있는 기능을 완성한 상태다.

예를 들어 ‘아메리카 너구리회충 증(Baylisascariasis)’이란 단어가 있다. 쥐들에게 치명적인 질병인데 눈을 멀게 하는 등 치명적인 증상을 가져온다.

‘RUM’을 적용할 경우 이 단어에 대한 다양한 설명어가 제시된다. 정도에 따라 더 간략하고 쉽게 단어에 대한 개념 설명을 확대해나갈 수 있다.

연구 논문 등을 의뢰할 때는 논문을 읽고 그 내용을 보다 더 쉽게 요약할 수 있다. 치치 교수는 “논문 초록(abstracts)이 아니라 전체 논문을 읽고 안에 있는 내용을 알기쉽게 요약하는 일이 가능하다.”고 말했다.

관계자들은 ‘RUM’의 등장으로 과학 커뮤니케이션 전반에 큰 영향을 미칠 것으로 보고 있다. 논문 작성자는 물론, 과학을 배우는 학생들, 더 나아가 과학적 기본 지식이 부족한 일반 대중에 이르기까지 과학을 이해하는데 큰 도움을 줄 수 있을 것으로 예상되고 있다.

(4861)

뉴스레터 구독신청
태그(Tag)

전체 댓글 (0)

과학백과사전