2023년 AI 분야에서 가장 큰 화두는 ‘AI 챗봇’의 열풍이다. (관련기사 바로 가기 – “챗GPT가 쓴 사이언스타임즈 뉴스”)
Open AI가 개발한 Chat-GPT는 출시 5일 만에 100만 유저를 확보했으며, 글로벌 AI 선두기업들이 다양한 인공지능 모델 출시를 예고하고 있다.
구글은 AI 챗봇 ‘어프렌티스 바드(Apprentice Bard)’ 출시를 앞두고 미국 시간 8일에 유튜브 라이브 이벤트를 진행했다. 이 분야 신규 강자로 부상하고 있는 중국의 바이두는 3월에 ‘원신이앤(Wenxinyiyan)’을 출시한다고 발표했다.
Chat-GPT를 비롯해 곧 출시되는 챗봇은 자연어 이해 수준이었던 초기 모델을 넘어 텍스트 간의 관계 이해 및 고차원적인 사고 회로를 갖게 될 것으로 보인다. 말 그대로 인간의 언어에 도달하기 시작했다.
2023년 AI 분야에서 가장 큰 화두는 ‘AI 챗봇’의 열풍이다. ⓒAdobestock
최근 온라인 커뮤니티를 중심으로 ‘한국어 암호’가 뚫렸다는 내용의 게시글들이 화제를 모았다.
‘한국어 암호’는 한글을 모국어로 사용하는 사람만 인식할 수 있는 비문을 말한다. 예컨대 “지처금럼 네짜글씩 순바서꿔 써돼도요. 한인국은 읽수을가 있거든요. 이역거시 번기역론 안 와나요. (지금처럼 네 글자씩 순서 바꿔써도 돼요. 한국인은 읽을 수가 있거든요. 번역기론 안 나와요.)” 식의 문장이다.
이것이 등장한 배경은 주로 해외 사이트나 여행 서비스에 대한 불편했던 진짜 경험을 후기로 남겨 오로지 한국 사람들과 공유하기 위한 목적이었다. 이제는 일종의 ‘밈(meme)’처럼 번지고 있는 한국어 난독화는 개인이 작성하기도 하지만, 일부 번역기를 통해 자동 생성되기도 한다.
그런데 최근 구글과 네이버 파파고가 ‘한국어 암호’를 영어로 번역하기 시작했다. 어절 단위 안에 음절의 순서가 바뀐 비문, 띄어쓰기와 어순 등 문법을 파괴한 비문에 대하여 본래 문장에 가깝게 영문장으로 번역한 것. 일부 번역 프로그램은 용어사전을 구축하여 줄임말이나 신조어 등도 비교적 정확하게 번역한다.
이러한 서비스는 Open AI의 GPT-n 시리즈 3세대 모델 이상으로 불과 2년 안팎의 기간에 자연어 인식 수준을 넘어섰다. 학습 분야가 넓어진 덕에 기본적인 텍스트 간의 관계와 문장의 이해능력이 비약적으로 상승했고, 인간의 언어 구조를 파악하기 시작한 것이다. 바꿔 말하면 AI 언어모델은 ‘한국어 암호’를 뚫는 데에서만 끝나지 않을 전망이다. 이제는 사람의 마음도 관통한 대화형 챗봇도 등장하며 ‘사람의 언어’에 가까워지고 있기 때문이다.
AI 번역 기술은 자연어 수준을 넘어 기본적인 텍스트 간의 관계와 문장의 이해능력이 비약적으로 상승했다. ⓒGettyImagesBank
세계는 지금 Chat GPT-4에 열광한다.
GPT(Generative Pre-trained Transformer)는 대표적인 텍스트 생성 딥러닝 AI 모델이다. AI 언어모델은 기본적으로 자연어 처리 과정을 기반으로 수많은 데이터를 학습하여 인간의 언어를 분석하는데, GPT는 다양한 질문과 답변이 가능한 대화형 AI 서비스를 제공한다.
2018년 GPT-1에 이어 일 년 만에 공개된 GPT-2는 약 15억 개 이상의 매개변수를 활용하여 800만 건의 텍스트 데이터를 학습한 것으로 알려진다. 당시 버전으로는 키워드를 입력하면 뉴스 기사, 에세이 등을 한 페이지 분량으로 작성할 수 있다.
이후 2020년에 공개된 GPT-3 버전은 문장 이해능력이 비약적으로 상승하여 사용자 요구에 보다 정확하게 답변하기 시작했다. 거의 인간이 사용하는 언어와 유사한 수준으로 알려진다. 실제로 지난해에 세계적 석학 유발 하라리가 GPT-3에 책과 논문을 학습시켜 출판 10주년 서문을 작성하게 했는데, 자신의 글 수준의 글을 써 내 충격을 안겼다. 이 사례는 AI 언어 모델이 얼마나 빠르게 발전하고 있는지를 보여주며 동시에 AI 출판의 미래를 전망하게 한다.
그리고 불과 3년 만에 GPT-4가 임박했다. 정확하게 4세대 버전 출시일은 알려지지 않았지만, 현재 튜링 테스트 중이다. 정확한 사양 또한 알 수 없지만, 챗 GPT(GPT-3.5)의 결과를 보면 사람의 언어에 근접할 것으로 기대를 모은다.
AI는 인간이 정보를 모으고 사고하는 방식과 거의 동일한 구조로 발전하고 있다. 이제는 이것을 어떻게 활용하느냐의 문제를 고민할 시기다. ⓒbyteteck
AI 전문가들은 이전까지의 모델을 뛰어넘는 발전을 거듭해 온 GPT가 4세대 버전에서는 약 100조 개의 파라미터가 구동될 것으로 예상한다. 또한, 시각·청각·동작 등의 복합적인 입력 정보를 시스템 기준에 따라 분류하고, 그 사이의 관계를 이해하여 응답하는 멀티모달 AI도 기대를 모은다.
이렇게 되면 AI는 인간이 정보를 모으고 사고하는 방식과 거의 동일한 구조를 갖게 된다. 즉 글로만 배워온 세상을 더 넓게 경험하고 이해하면서 대화를 할 수 있게 되는 것이다. 사용자의 의도를 정확하게 이해하고 대응하는 고차원 모델의 장점은 마이크로소프트(MS)가 간파한 분위기다. MS는 미국 시간으로 7일에 GPT 기반의 언어모델을 Bing 검색에 통합했다고 발표했다. ‘프로메테우스 모델’이라 이름 붙여진 Bing 새 버전은 검색 엔진에 지각변동을 예고한다.
앞으로 놀랍고도 흥미로운 이 모델이 얼마나 인간의 언어에 도달하게 될지 그리고 이 기술이 또 다른 사업에 어떤 영향을 미치게 될지 세계는 주목하고 있다.
(2109)
로그인후 이용 가능합니다.
구글 모회사 알파벳의 AI 조직 딥마인드(DeepMind)가 새 AI '알파데브'(AlphaDev)를 이용해 새로운 정렬 알고리즘(sorting algorithm)을 발견하고 이를 통해 컴퓨터 프로그래밍 언어 'C++'의 기능을 10년 만에 개선했다.
암컷 악어가 수컷 악어 없이 스스로 임신해 알을 낳은 자기복제 사례가 처음으로 확인됐다고 7일(현지시간) 영국 BBC가 보도했다. 이날 영국 왕립학회가 발행하는 '바이올로지 레터스'(Biology Letters)에 실린 연구 결과에 따르면 이 악어는 2018년 1월 중미 코스타리카 렙틸라니아 동물원에서 알을 낳았다. 부스 박사 분석 결과 죽은 새끼는 유전적으로 어미 악어와 99.9% 일치했으며, 어미를 임신시킨 수컷도 없는 것으로 확인됐다.
요즘은 생활 습관이 변화하면서 가족과 함께하는 식사가 줄고 이른바 '혼밥'이나 가족 이외 타인과의 식사가 늘고 있다. 이런 식습관 변화가 건강에는 어떤 영향을 미칠까. 동국대 일산병원 가정의학과 오상우 교수와 일산백병원 가정의학과 윤영숙 교수 공동 연구팀이 최근 이런 궁금증을 풀어줄 수 있는 연구 결과를 국제학술지(Nutrition Research and Practice) 최근호에 발표했다.
세계 각국 과학자들이 온실가스 배출량이 매년 사상 최고 기록을 경신하고 있으며 이로 인해 최근 10년간 지구 기온이 산업화 이전보다 이미 1.14℃ 상승하는 등 온난화가 전례 없이 빠르게 진행되고 있다고 경고했다.
물을 전기 분해해 수소를 만드는 '그린 수소'의 생산 효율을 높이는 촉매 구조 제어 기술이 개발됐다. 한국과학기술연구원(KIST)은 물질구조제어연구센터 이성수 선임연구원과 성균관대학교 에너지과학과 윤원섭 교수, 화학공학·고분자공학부 유필진 교수 공동연구팀이 수소와 산소를 분리하는 성능을 높이도록 촉매소재 표면을 제어하는 기술을 개발했다고 8일 밝혔다. 연구팀은 이를 대신해 금속 나노입자를 기체 상태로 반응시키면서 높은 산화수를 갖는 흑연 탄소 껍질로 둘러싸는 촉매 구조를 만드는 기술을 개발했다.
집고양이나 길고양이 개체수를 조절하기 위해 외과적 불임 수술을 하는 대신 암고양이에게 한 번 주사하는 것으로 장기 불임을 유도할 수 있는 유전자 요법이 개발됐다.
암에 걸렸거나 걸렸던 사람이 하루 30분을 걷거나 요가를 하면 신체의 피로도가 줄어 암세포의 확산이나 암의 재발 위험을 줄일 수 있다는 연구 결과가 나왔다.