처리단어량·기억력 대폭 높여…"인간 수준 아니지만 범용 AI 현실화 훨씬 앞당겨" 오픈AI "GPT-4 한국어능력, 챗GPT 영어능력보다 좋아"…네이버·카카오 ‘긴장’
생성형 인공지능(AI) 챗GPT를 개발해 세계적 돌풍을 일으킨 오픈AI가 챗GPT에 적용된 GPT-3.5의 업그레이드 버전인 GPT-4를 공개하면서 구체적으로 어떻게 성능이 향상됐는지 관심이 쏠린다.
16일 정보기술(IT) 업계에 따르면 오픈AI는 지난 14일 대규모 AI 언어 모델(LLM) GPT-4를 공개했다. 지난해 11월 챗GPT를 내놓은 지 약 4개월 만이다.
한때 GPT-4는 GPT-3의 매개 변수(파라미터) 규모인 1천750억개를 아득히 뛰어넘은 1조개 이상의 매개 변수를 갖출 것이라는 추정이 나왔지만, 오픈AI는 GPT-4 매개 변수 규모를 공개하지 않았다.
다만 업계에서는 확실히 ‘더 똑똑한 모델’이라는 평가가 나온다. 이미지를 보고 이해할 수 있게 됐고, 언어 구사 능력과 기억력이 높아진 것은 물론 영어 이외의 외국어 실력도 전반적으로 향상됐다는 점에서다.
오픈AI에 따르면 GPT-4는 기존 GPT-3.5와 달리 텍스트뿐 아니라 이미지까지 여러 데이터 형태를 인식하는 멀티모달(복합 정보 처리) 모델이다.
문자로만 대화할 수 있었던 데서 사진과 문자를 결합한 질문도 이해하고 답변할 수 있게 발전한 것이다. 계란과 밀가루, 버터, 우유 사진을 올리고 “이걸로 요리할 수 있는 게 뭐지?”라고 물으면 “팬케이크나 와플, 프렌치토스트 등등”이라고 답하는 식이다.
언어 능력 자체도 향상됐다. 처리할 수 있는 단어량은 2만 5천 단어로 챗GPT보다 약 8배 늘어났다. GPT-4는 미국 모의 변호사 시험에서 90번째, 대학 입학 자격시험인 SAT 읽기·수학 시험에서는 각각 93번째와 89번째의 백분위수를 기록했는데 이는 상위 10% 수준이라고 오픈AI는 설명했다.
대화 내용을 기억할 수 있는 능력도 대폭 늘어났다. 미국 정보기술(IT) 전문 매체 테크크런치는 “GPT 3.5는 책 4∼5페이지에 해당하는 4천96 토큰(메모리 단위)을 보유했는데, GPT-4는 최대 책 50페이지 수준인 3만2천768 토큰을 보유했다”면서 “희곡이나 단편 하나를 통째로 외울 수 있다는 의미”라고 소개했다.
특히 GPT-3.5의 고질적 문제였던 ‘할루시네이션(환각) 현상’도 크게 줄었다고 오픈 AI는 설명했다. 이는 AI가 틀린 정보나 무의미한 내용을 마치 환각을 보는 듯이 그럴듯하게 제시하는 현상이다.
오픈AI는 “GPT-4는 내부 사실성 평가에서 최신 GPT-3.5보다 40% 높은 점수를 받았다”고 했다.
한국어를 비롯한 비영어 언어 성능이 높아진 점도 주목된다. 오픈AI가 시험한 26개 언어 가운데 GPT-4는 한국어와 일본어, 프랑스어 등 24개 언어에서 GPT-3.5가 영어를 하는 수준보다 더 높은 성능을 보였다.
이는 국내에서 생성형 AI를 개발하는 네이버와 카카오[035720] 등을 가장 긴장하게 하는 지점이다. 두 회사는 GPT-4가 어떤 반향을 부를지 주목하면서 한국어 특화 대규모 언어모델 개발에 더 집중하겠다는 입장을 밝혔다.
네이버 관계자는 “진행 중인 하이퍼클로바X 프로젝트를 기반으로 초대규모 AI 생태계를 확대하고, 새로운 검색 경험인 서치GPT를 통해 AI 기술 경쟁력을 확보해 나갈 예정”이라고 말했다.
카카오 관계자는 “AI 자회사 카카오브레인을 통해 한국어 특화 언어모델 KoGPT(코지피티) 연구에 박차를 가할 것”이라면서 “복잡한 문맥과 뉘앙스 등도 철저히 연구해 한국어를 누구보다 더 잘하는 모델을 만들겠다”고 말했다.
GPT-4가 혁신적인 변화이기는 하지만, 아직 인간과 동일한 수준의 능력을 갖춘 것은 아니라 엉뚱한 답을 내놓을 수 있다는 한계가 지적된다.
AI 스타트업 업스테이지의 박은정 최고과학책임자(CSO)는 “GPT-4는 사람들이 많이 물어보지 않거나 온라인에 정보가 없는 ‘롱테일 질문’, 지식을 단순히 불러올 뿐 아니라 특정 연산을 통해 정보를 소화해야 하는 ‘추론형 질문’은 잘 답할 수 없다”고 말했다.
박 CSO는 “GPT-4가 범용 인공지능(AGI) 수준에 도달하지 못한 것은 맞지만 ‘머나먼 미래’였던 예전보다 훨씬 가까워졌다”면서 “검색 대상인 콘텐츠가 대부분 기계에 의해 만들어지며 인간이 만든 것과 구분하기 어려울 정도가 되면서 양질의 콘텐츠를 가려내는 게 또 다른 도전과제가 될 것”이라고 덧붙였다.
(1511)
로그인후 이용 가능합니다.
/ 정부가 2025년까지 자율주행차 국가표준(KS) 25건을 제정하고 국제표준 30건을 제안하는 목표를 세웠다. 산업통상자원부 국가기술표준원(국표원)은 22일 서울 강남구 역삼동 조선팰리스호텔에서 자율주행차의 산업 활성화와 표준화 추진 전략을 수립하기 위한 업계·관계기관 전문가 간담회를 개최했다면서 이같이 밝혔다. 그러면서 국내 관련 기업들의 사업화 안내를 위해 지난달 말 자율주행차 표준화 추진 전략 초안을 마련했다고 전했다. 국표원은
/ 약물 반응을 미리 알아볼 수 있는 인공신장이 국내 연구진에 의해 개발됐다. 포항공대(포스텍)는 기계공학과 조동우·장진아 교수 연구팀이 사구체 혈관세포와 지족세포층, 사구체기적막층을 포함한 사구체 미세혈관 칩(인공신장)을 개발했다고 22일 밝혔다. 신장은 체내 대사 과정에서 생긴 노폐물 등을 소변으로 배설함으로써 우리 몸의 항상성을 유지하는 기관이고 약물에 대한 독성을 가장 먼저 일으키는 기관이기도
/ 기초과학연구원(IBS)은 혈관연구단 고규영 단장(KAIST 의과학대학원 특훈교수) 연구팀이 콧속 혈관·림프관의 3차원 정밀지도를 완성했다고 22일 밝혔다. 코는 후각을 담당하는 동시에 외부 공기가 폐로 들어가는 첫 번째 관문으로, 외부 공기를 데우고 습도를 높여주는 역할을 한다. 특히 비강(鼻腔)의 점막은 외부 병원균·이물질을 막아주는 최초 면역 장벽 기능도 수행한다. 다만 비강 내 복잡한 구조 때문에
/ 국세청이 챗GPT와 같은 차세대 인공지능(AI) 기술을 기반으로 한 세무상담 서비스 도입을 추진한다. 국세청 대표 서비스인 홈택스를 ‘지능형 홈택스’로 고도화해 세금 신고·납부 과정에서의 납세자 편의성을 높이겠다는 계획이다. 국세청은 22일 서울지방국세청에서 2023년도 제1차 국세행정개혁위원회를 열고 이런 내용의 디지털 혁신, 복지세정, 국세행정 운영 방향 등을 논의했다. 국세행정개혁위원회는 모범 납세자와 각계 전문가
/ 이산화탄소를 고순도 기체로 포집하는 공정을 없애 경제성을 높인 새로운 탄소 포집·저장·활용(CCUS) 공정이 개발됐다. 한국과학기술연구원(KIST)은 이웅 청정에너지연구센터 책임연구원과 원다혜 선임연구원 공동연구팀은 액상 흡수제에 기체 이산화탄소를 포집한 후 바로 전기화학적으로 전환해 고부가가치 합성가스를 생산하는 공정을 개발했다고 22일 밝혔다. 기존 액상 흡수제를 활용하는 CCUS 공정은 이산화탄소를 포집한 다음 다시 고순도 기체로
/ 중국 정부가 지난해 12월 이래 3개월여만에 ‘블루 아카이브’를 비롯한 한국산 게임에 판호(版號·중국 내 게임 서비스 허가)를 발급했다. 21일 게임 업계에 따르면 중국 국가신문출판서는 전날 홈페이지를 통해 한국 게임을 포함한 27종의 외국산 게임 수입을 허가했다고 공지했다. 중국은 심의를 거친 자국 게임사 게임에 ‘내자판호’를, 해외 게임사 게임에는 ‘외자판호’를 발급해 서비스를
/ 애플의 근거리무선통신(NFC) 결제 서비스 ‘애플페이’가 마침내 한국에 상륙했다. 정보통신기술(ICT) 업계에 따르면 애플과 현대카드는 21일 오전부터 애플페이 국내 서비스를 시작했다. 아이폰과 현대카드를 보유한 이용자는 호환 단말기를 보유한 매장에서 카드 실물 없이 휴대전화로 간편결제를 이용할 수 있게 됐다. 당초 양사는 이달 초를 서비스 개시 목표일로 삼았으나 호환 단말기 보급 이슈