처리단어량·기억력 대폭 높여…"인간 수준 아니지만 범용 AI 현실화 훨씬 앞당겨" 오픈AI "GPT-4 한국어능력, 챗GPT 영어능력보다 좋아"…네이버·카카오 ‘긴장’
생성형 인공지능(AI) 챗GPT를 개발해 세계적 돌풍을 일으킨 오픈AI가 챗GPT에 적용된 GPT-3.5의 업그레이드 버전인 GPT-4를 공개하면서 구체적으로 어떻게 성능이 향상됐는지 관심이 쏠린다.
16일 정보기술(IT) 업계에 따르면 오픈AI는 지난 14일 대규모 AI 언어 모델(LLM) GPT-4를 공개했다. 지난해 11월 챗GPT를 내놓은 지 약 4개월 만이다.
한때 GPT-4는 GPT-3의 매개 변수(파라미터) 규모인 1천750억개를 아득히 뛰어넘은 1조개 이상의 매개 변수를 갖출 것이라는 추정이 나왔지만, 오픈AI는 GPT-4 매개 변수 규모를 공개하지 않았다.
다만 업계에서는 확실히 ‘더 똑똑한 모델’이라는 평가가 나온다. 이미지를 보고 이해할 수 있게 됐고, 언어 구사 능력과 기억력이 높아진 것은 물론 영어 이외의 외국어 실력도 전반적으로 향상됐다는 점에서다.
오픈AI에 따르면 GPT-4는 기존 GPT-3.5와 달리 텍스트뿐 아니라 이미지까지 여러 데이터 형태를 인식하는 멀티모달(복합 정보 처리) 모델이다.
문자로만 대화할 수 있었던 데서 사진과 문자를 결합한 질문도 이해하고 답변할 수 있게 발전한 것이다. 계란과 밀가루, 버터, 우유 사진을 올리고 “이걸로 요리할 수 있는 게 뭐지?”라고 물으면 “팬케이크나 와플, 프렌치토스트 등등”이라고 답하는 식이다.
언어 능력 자체도 향상됐다. 처리할 수 있는 단어량은 2만 5천 단어로 챗GPT보다 약 8배 늘어났다. GPT-4는 미국 모의 변호사 시험에서 90번째, 대학 입학 자격시험인 SAT 읽기·수학 시험에서는 각각 93번째와 89번째의 백분위수를 기록했는데 이는 상위 10% 수준이라고 오픈AI는 설명했다.
대화 내용을 기억할 수 있는 능력도 대폭 늘어났다. 미국 정보기술(IT) 전문 매체 테크크런치는 “GPT 3.5는 책 4∼5페이지에 해당하는 4천96 토큰(메모리 단위)을 보유했는데, GPT-4는 최대 책 50페이지 수준인 3만2천768 토큰을 보유했다”면서 “희곡이나 단편 하나를 통째로 외울 수 있다는 의미”라고 소개했다.
특히 GPT-3.5의 고질적 문제였던 ‘할루시네이션(환각) 현상’도 크게 줄었다고 오픈 AI는 설명했다. 이는 AI가 틀린 정보나 무의미한 내용을 마치 환각을 보는 듯이 그럴듯하게 제시하는 현상이다.
오픈AI는 “GPT-4는 내부 사실성 평가에서 최신 GPT-3.5보다 40% 높은 점수를 받았다”고 했다.
한국어를 비롯한 비영어 언어 성능이 높아진 점도 주목된다. 오픈AI가 시험한 26개 언어 가운데 GPT-4는 한국어와 일본어, 프랑스어 등 24개 언어에서 GPT-3.5가 영어를 하는 수준보다 더 높은 성능을 보였다.
이는 국내에서 생성형 AI를 개발하는 네이버와 카카오[035720] 등을 가장 긴장하게 하는 지점이다. 두 회사는 GPT-4가 어떤 반향을 부를지 주목하면서 한국어 특화 대규모 언어모델 개발에 더 집중하겠다는 입장을 밝혔다.
네이버 관계자는 “진행 중인 하이퍼클로바X 프로젝트를 기반으로 초대규모 AI 생태계를 확대하고, 새로운 검색 경험인 서치GPT를 통해 AI 기술 경쟁력을 확보해 나갈 예정”이라고 말했다.
카카오 관계자는 “AI 자회사 카카오브레인을 통해 한국어 특화 언어모델 KoGPT(코지피티) 연구에 박차를 가할 것”이라면서 “복잡한 문맥과 뉘앙스 등도 철저히 연구해 한국어를 누구보다 더 잘하는 모델을 만들겠다”고 말했다.
GPT-4가 혁신적인 변화이기는 하지만, 아직 인간과 동일한 수준의 능력을 갖춘 것은 아니라 엉뚱한 답을 내놓을 수 있다는 한계가 지적된다.
AI 스타트업 업스테이지의 박은정 최고과학책임자(CSO)는 “GPT-4는 사람들이 많이 물어보지 않거나 온라인에 정보가 없는 ‘롱테일 질문’, 지식을 단순히 불러올 뿐 아니라 특정 연산을 통해 정보를 소화해야 하는 ‘추론형 질문’은 잘 답할 수 없다”고 말했다.
박 CSO는 “GPT-4가 범용 인공지능(AGI) 수준에 도달하지 못한 것은 맞지만 ‘머나먼 미래’였던 예전보다 훨씬 가까워졌다”면서 “검색 대상인 콘텐츠가 대부분 기계에 의해 만들어지며 인간이 만든 것과 구분하기 어려울 정도가 되면서 양질의 콘텐츠를 가려내는 게 또 다른 도전과제가 될 것”이라고 덧붙였다.
(1620)
로그인후 이용 가능합니다.
/ 과학기술정보통신부는 23일 올해 공공 분야의 소프트웨어·정보통신기술(ICT) 장비·정보보호 사업 규모가 작년보다 2.7% 증가한 6조2천239억원으로 집계됐다고 밝혔다. 소프트웨어 구축 사업 예산이 4조5천406억원으로 가장 많았고 상용 소프트웨어 구매에 3천605억원이 소요되는 것으로 조사됐다. 컴퓨팅, 네트워크, 방송 장비 등 ICT 장비 구매 비용은 1조 3천227억원으로 나타났다. (10)
/ 36개국이 한국에 모여 기후변화 대응을 위한 기술 협력방안 도출에 머리를 맞댄다. 과학기술정보통신부는 유엔기후변화협약 기술메커니즘 이사회가 24일 개막했다고 밝혔다. 이사회는 오는 29일까지 인천 송도에서 계속된다. 유엔기후변화협약은 온실가스 감축을 위해 1992년 설립된 협약이다. 총 198개국이 참여하는 규범으로, 매년 당사국총회를 열어 주요 사항을 결정한다. 기후메커니즘은 2010년 당사국총회에서 기후변화대응을 위한 과학기술 중요성에
/ 울산과학기술원(UNIST)은 혈관이 막혀 실명으로 이어질 수 있는 응급 질환인 망막혈관폐쇄질환을 치료할 수 있는 실마리를 발견했다고 23일 밝혔다. UNIST에 따르면 화학과 조재흥 교수팀은 서울아산병원 안과 이준엽 교수팀, 한국과학기술원(KAIST) 백무현 교수팀과 망막혈관폐쇄질환의 새로운 치료법을 찾기 위한 공동연구를 진행했다. 공동연구진은 폐쇄된 혈관을 확장해 효과적으로 흐름을 복구하는 ‘철-일산화질소 복합체’ 개발에 성공했다 일산화질소는
/ 충남 천안아산 KTX역세권 연구개발(R&D) 집적지구 1호 사업인 충남지식산업센터가 23일 준공됐다. 센터는 천안시 서북구 불당동 4천510㎡ 부지에 지하 1층·지상 6층 규모(연면적 1만2천471㎡)로 건립됐다. 입주대상은 지식산업, 정보통신, 제조업과 관련 지원시설 등이다. 반도체 장비 제조, 엔지니어링, 소프트웨어 개발, 산업용 필터 등 12개 기업이 이달 중 입주할 예정이다. 충남도는 지식산업센터를 통해 일자리
/ 한국과학기술원(KAIST) 부설 인공지능(AI) 바이오 영재고가 청주시 흥덕구 오송읍에 들어선다. 개교 목표 시기는 2027년 3월이다. 충북도는 23일 한국과학기술원이 희망하는 학교 부지요건 등에 대한 의견을 듣고 도교육청과 함께 숙고한 끝에 오송읍을 건립 부지로 결정했다고 밝혔다. 부지 선정의 결정적 요건은 향후 설립될 한국과학기술원 오송캠퍼스와의 접근성, 핵심인력 양성의 용이성 등이었다. 오송에는 첨단의료제품
/ 교육부는 교원의 인공지능(AI)·디지털 역량을 강화하기 위한 ‘2023년 아이에답(AIEDAP) 사업 착수보고회’를 23일 서울 중구 한국프레스센터에서 연다고 밝혔다. 아이에답은 민·관·학 디지털 전문가가 현직 교원과 예비 교원의 디지털 역량 강화를 지원하는 사업으로 지난해 시작됐다. 올해는 지역 여건에 맞는 사업을 추진할 수 있도록 권역별 사업지원단을 꾸리고, 교육 현장에서 디지털 기술을 바탕으로 수업을
/ 강원 양구군은 치매 환자, 독거노인 등 돌봄이 필요한 고령자를 대상으로 인공지능(AI) 말벗 인형 ‘천사친구 효돌·효순이’ 서비스를 제공한다고 23일 밝혔다. 군은 치매안심센터에 등록한 맞춤형 사례관리 대상자 중 우울 척도가 높은 10명에게 오는 12월까지 말벗 인형을 지원한다. 이는 정서·인지 정도가 다소 낮은 어르신을 돕는 인형 모양의 로봇이다. 일상 중 말벗이