사이언스타임즈

AI 에이전트의 주요 특성과 인프라 시사점 ⓒ한국과학기술원(KAIST) 제공

인공지능(AI)이 스스로 생각하고 행동하는 'AI 에이전트'는 기존 생성형 AI보다 질문 한 건당 최대 136.5배 많은 에너지를 사용하는 것으로 나타났다.

5일 한국과학기술원(KAIST)에 따르면 전기및전자공학부 유민수 석좌교수 연구팀은 AI 에이전트가 실제 서비스 환경에서 얼마나 많은 계산 자원과 전력을 사용하는지를 체계적으로 분석했다.

연구팀은 AI 에이전트를 단순한 프로그램이 아니라 데이터센터의 서버와 GPU(대규모 AI 계산을 수행하는 고성능 반도체)가 지속해 처리해야 하는 새로운 형태의 작업인 워크로드(컴퓨터가 수행해야 하는 전체 계산 작업)로 정의하고, 실제 실행 과정에서 발생하는 계산량과 에너지 소비를 분석했다.

분석 결과, AI 에이전트는 기존의 단계별 추론(CoT·AI가 사람처럼 생각 과정을 하나씩 전개하며 답을 찾는 방식)과 달리 반복적으로 여러 차례 대형 언어 모델 호출(AI가 언어 모델에 새로운 판단이나 답변 생성을 요청하는 계산 과정)을 수행하는 것으로 나타났다.

언어 모델을 반복적으로 호출하면서 응답 시간은 증가했다.

AI 에이전트의 답변 시간은 최대 153.7배 늘어났으며, 외부 도구가 작업을 수행하는 동안 GPU는 전체 실행 시간의 최대 54.5%를 아무 계산도 하지 못한 채 대기하는 것으로 분석됐다.

즉, AI가 더 복잡한 일을 수행할수록 고가의 GPU를 충분히 활용하지 못하는 새로운 비효율이 발생하는 것이다.

연구팀은 AI 에이전트가 사용하는 전력도 분석했다.

현재 상용 AI 서비스 수준인 700억 개의 매개변수(파라미터·AI가 학습한 지식과 능력을 저장하는 값)를 가진 대형 언어 모델을 사용하는 AI 에이전트는 질문 한 건을 처리하는 데 평균 348.41와트시(Wh)의 전력을 소비했다. 이는 기존 생성형 AI의 단순 질의응답 방식보다 136.5배 높은 수준이다.

하루 137억건의 AI 에이전트 요청이 발생하는 미래 환경을 가정해 분석한 결과, 데이터센터 전력 수요는 약 198.9기가와트(GW)에 이를 것으로 추정됐다.

이는 현재 세계 각국이 추진 중인 수 기가와트(GW) 규모의 AI 데이터센터를 뛰어넘는 수준이며, 미국 전체 평균 전력 소비량의 약 절반에 해당하는 규모라고 연구팀은 설명했다.

이번 연구는 AI시대의 경쟁력이 '더 똑똑한 AI'에서 '더 효율적인 AI'로 옮겨가고 있음을 보여준다고 연구팀은 설명했다.

앞으로는 AI 모델만 발전시키는 것이 아니라 AI 반도체, 데이터센터, 전력 인프라를 함께 최적화하는 '공동 설계'가 필수 전략이 될 것이라고 연구팀은 덧붙였다.

유민수 석좌교수는 "이번 연구는 단순히 AI가 더 똑똑해지는 것을 넘어, 그 지능을 구현하고 유지하기 위해 얼마나 많은 전력과 비용이 필요한지를 정량적으로 제시한 사례"라며 "향후 AI 에이전트가 보편화되는 시대에는 AI 데이터센터 인프라뿐만 아니라 AI 에이전트 모델과 전력 인프라까지 통합적으로 공동 설계해 최적화하는 접근이 더욱 중요해질 것"이라고 말했다.