‘수포자’가 알려주는 ‘누구에게나 쉬운 머신러닝’

‘SW·AI 교육 파더’, 남호성 교수의 AI 학습법

“4차 산업혁명 시대라고 하는데 앞으로는 코딩은 필수예요. 이젠 문과생도 수학을 모르면 안 돼요.”

14일 ‘2021 소프트웨어(SW) 교육 페스티벌’의 AI 체험 강연자로 나선 남호성 고려대학교 영문학과 교수는 인공지능(AI)을 쉽게 이해하고 구현할 수 있는 방법을 알려주기 위해 무대에 섰다. (▶강연 바로 가기)

남 교수는 4차 산업혁명 시대가 도래하면서 코딩 등 컴퓨터를 공부하는 것은 필수라고 강조했다. 이를 위해서는 수학이 ‘기본’이다. 그런데 정작 본인은 자신을 ‘수·포·자(수학 포기자)’다. 그에 따르면 ‘수포자’도 수학을 잘할 수 있고 인공지능도 쉽게 배울 수 있다. ‘수포자’가 알려주는 인공지능 AI 공부법은 어떤 내용일까.

14일 ‘2021 소프트웨어(SW) 교육 페스티벌’ 행사에서 남호성 고려대 영문학과 교수는 누구나 쉽게 도전할 수 있는 AI 머신러닝 구현법을 강의했다. ⓒ SW 중심사회

이제는 누구나 쉽게 AI 머신러닝을 배울 수 있어

이날 AI 머신러닝 구현 방법을 알려주기 위해 ‘SW·AI 교육 파더’로 나선 남호성 교수는 학창 시절 수학을 지독히 싫어했던 ‘수포자’다. 수학을 피해 문과를 지망했고 대학 전공은 시험 성적에 맞춰 영문학을 선택했다. 하지만 수학을 피해만 다녔던 그가 스스로 코딩을 배우고 수학 공부를 기초부터 다시 시작했다. 대학원 때 전공했던 음성학에 매료됐기 때문이다.

음성학은 인공지능(AI) 기술의 기본 관문이다. AI 기술은 사람들에게 편리함을 주기 위해 개발됐다. 그러기 위해서는 기계가 자연어를 알아들을 수 있어야 하기 때문에 음성학은 인공지능 기술에 있어 매우 중요하다. 남 교수는 내친김에 세계적인 음성학 전문기관인 미국 예일대학교 해스킨스 연구소까지 가서 공부했다. (▶남호성 교수 인터뷰 바로 가기)

구글 티처블 머신(teachable machine). 인공지능과 머신러닝, 코딩 관련 사전 지식이 없어도 인공지능 머신러닝 모델을 배울 수 있다. ⓒ 구글 티처블 머신 웹페이지

사실 머신러닝 등 인공지능 기술은 공학자나 컴퓨터를 할 수 있는 전문가들의 전유물이라고 생각하기 쉽다. 하지만 그는 ‘수포자’ 출신답게 사전 지식이 없어도 누구나 간단하게 인공지능을 학습시킬 수 있는 머신러닝 구현 방법을 설명했다.

이때 사용된 장치는 구글 티처블 머신(teachable machine). 간단하게 컴퓨터 웹에 접속해 파일을 설정하고 실행하기만 하면 AI를 학습시키고 원하는 모델을 구현할 수 있다. 구글 티처블 머신은 이미지, 오디오, 동작(포즈) 등 세 가지 형태로 AI를 학습시킬 수 있다. 해당 학습할 파일은 자신의 컴퓨터 파일 혹은 구글 드라이브(Google Drive)에서 불러오기를 하면 된다. 웹 카메라로 바로 찍어도 된다. 이 머신의 장점은 코딩 지식이 없어도 PC만 있으면 AI 머신러닝 모델의 학습 과정을 이해하고 해당 모델을 쉽게 구현할 수 있다는 점에 있다.

이날 강연은 교육 페스티벌 홈페이지에서 미리 참가 신청을 받아 실시간 줌(zoom) 영상과 유튜브 영상을 통해 강연자와 참관객이 얼굴을 맞대고 소통하며 참관객들의 눈높이에 맞는 원격 수업으로 진행됐다. (사진= 남호성 교수가 직접 사진을 찍어 이미지를 업로드하고 있다)ⓒ SW 중심사회

기계가 학습하기 위해서는 먼저 많은 샘플 데이터가 필요하다. 첫 번째 학습 과정 중 이미지를 선택해보자. 사진을 업로드하고 학습 버튼을 눌러 전송한 샘플 이미지를 학습하도록 요청하면 된다. 두 번째는 음성 인식을 학습시키는 방법이다. 마이크를 켜고 소리를 녹음하면 된다. 이날 수업에서는 남 교수는 ‘아에이오우’를 직접 소리 내어 녹음했다. 이때 다양한 높낮이의 음성을 녹음하는 것이 필요하다. 다소 이상한 음성이 나와도 괜찮다.

남 교수는 “깨끗한 소리보다 노이즈 등 현실적인 소리가 포함된 것이 좋다”며 “음성의 높낮이, 성량, 주변 소음 등 다양한 소리가 수집돼야 보다 정확한 학습이 되기 때문”이라고 설명했다. 데이터도 마찬가지다. 좋은 학습 결과를 내기 위해서는 다양한 샘플 데이터 수집이 우선돼야 한다. 다 마치고 난 후에는 모델 학습시키기 버튼을 누른다. 모델 내보기와 업로드를 누르면 구글 서버에 올라가고 데이터를 공유할 수도 있다.

음성도 다양한 소리로 녹음해 머신러닝을 구현할 수 있다. ⓒ SW 중심사회

차근차근 머신러닝 구현법을 익히다 보니 기술과 창의력의 우선순위가 궁금해졌다. 기술과 창의력 어떤 것이 더 중요할까. 물론 두 가지 다 중요하지만, 더 중요한 건 창의력이 아닐까? 사실 우리는 지나치게 창의력을 강조하는 사회에 살고 있긴 하다.

남 교수는 “개인적으로 ‘창의’라는 단어를 좋아하지 않는다”는 의외의 답을 냈다. 그는 “창의력이란 가만히 있는데 저절로 생기는 것이 아니기 때문”이라고 덧붙였다. 이어 “기술과 내공을 쌓여 있어야 이에 맞는 아이디어도 생각할 수 있다”라고 설명했다.

하지만 그렇다고 너무 어릴 때부터 이러한 기술을 익힐 필요는 없다. 남 교수는 “초등학생보다는 중학생 때부터 시작해서 파이썬에서 자바까지 공부하는 것이 좋다”라고 조언했다.

남호성 교수는 “옛날에 나도 수포자였다”는 말을 강조했다. 그는 “수학을 끝까지 놓지 말고 앞으로 미래 핵심 기술인 인공지능의 ‘객’이 아닌 ‘주인’이 되길 바란다”고 당부했다.

다양한 소프트웨어 관련 콘텐츠가 펼쳐지는 ‘2021 소프트웨어(SW) 교육 페스티벌’은 오는 21일까지 온라인(▶http://festival.software.kr/)과 유튜브(▶SW 중심사회), 메타버스 앱 플랫폼 제페토(▶https://zepeto.me/) 등 언제 어디서나 쉽고 편리하게 접속해서 참가할 수 있다.

(2930)

태그(Tag)

전체 댓글 (1)

  • 신문선 2021년 11월 29일2:08 오후

    IT 관련 지망생입니다. 교수님의 강연 덕분에 크게 얻어 갑니다. 나도 그렇게 늦은 것이 아니구나 싶어 위안도 얻고, 새롭고 편한 서비스를 소개받을 수 있어 좋았습니다. 좋은 강연, 좋은 기사 감사합니다.

과학백과사전