주요 AI 기업들이 '생각하는 AI'의 핵심 추론모델(Inference model) 개발에 속속 뛰어들고 있다.
AI 추론모델은 학습을 마친 AI가 실제 입력을 받아 결과를 도출하는 과정을 담당하는 모델이다. 답변을 생성하고 설명을 출력하는 일련의 과정을 모두 수행하며, 생성형 AI의 핵심 성능과 직결된다. 단순히 학습된 정보를 재현하는 것을 넘어, 새로운 답변을 창조해낼 수 있다는 점에서 그 중요성이 크다.
23일 <메트로경제> 취재에 따르면 LG AI연구원이 국내 첫 AI 추론모델 '엑사원 딥(EXAONE Deep)'을 공개한 데 이어 네이버는 하이퍼클로바X 고도화를, 업스테이지 등이 추론형 AI 모델 개발에 착수했다. 메트로경제>
LG는 지난 18일 국내 첫 추론모델 엑사원 딥을 공개한 후 오픈소스 AI플랫폼인 허깅페이스에 성능평가 결과를 올렸다. LG에 따르면 엑사원 딥은 매개변수 규모가 320억 개로 딥시크 R1(6710억 개 매개변수)의 5% 수준이나 수학 문제 해결 등에서 딥시크 R1을 앞서거나 비슷한 수준을 보인다.
네이버도 지난 20일 대규모 모델 업데이트를 업데이트를 진행하면서 "추론 능력 고도화로 사용자가 요청한 작업을 체계적이고 종합적으로 수행할 수 있는 기술을 개발 중"이라고 설명했다.
우리나라 AI 스타트업인 업스테이지 등도 최근 추론형 AI 개발에 착수했다. 이미 업스테이지는 기존 AI 모델 '솔라'를 바탕으로 한 기업 AI 에이전트 서비스를 제공했다. 새로 착수한 추론형 AI 모델은 학습 데이터 범위 밖의 답까지 내놓을 수 있을 전망이다.
업스테이지 관계자는 "최근 추론형 AI 모델의 추세는 크기를 작게 만드는 것"이라며 "(업스테이지 추론 모델의) 파라미터(매개변수)가 정해지진 않았지만 400억개 미만일 것으로 예상된다"고 설명했다.
최근 AI 개발에 있어 추론형 AI 개발이 주요 과제로 떠오른 것은 '스푸트니크 쇼크' 딥시크가 시발점이다. 딥시크 이전까지 전세계 AI 기업들은 추론형 모델 개발에 막대한 비용이 소요돼 투자 한계가 있는 중소형 기업은 개발이 어렵다고 봤다. 그러나 딥시크가 최신형 AI 반도체와 수많은 인력, 투자비용 없이 추론모델 'R1'을 공개하면서 분위기가 반전됐다. 알려진 바에 따르면 약 2개월의 시간 동안 558만 달러의 비용으로 학습했다. 메타의 최신 AI 모델이자 엔비디아의 H100으로 훈련한 라마(Llama)3 모델의 훈련 비용 대비 1/10 수준에 그친다. 그러나 성능은 아키텍처 혁신을 통해 2024년 AIME(미국 수학경시대회) 벤치마크에서 오픈AI의 추론모델 o1을 근소한 차이로 따돌리며 우수한 성적을 보였다.
추론모델은 기존의 대형 언어모델(LLM)이 단순히 방대한 데이터를 학습하고 기억하는 데 초점을 맞췄다면, '생각하는 능력'을 덧붙인 형태다. LLM이 주어진 문장을 바탕으로 가장 가능성 높은 단어를 예측해 문장을 이어가는 방식이라면, 추론모델은 복잡한 질문에 대해 상황을 구조화하고, 논리적인 판단을 거쳐 스스로 답변을 구성한다.
가령 '4명이 피자를 3조각씩 먹었다면 총 몇 조각인가' 같은 질문에서 기존 LLM은 맥락상 그럴듯한 답을 제시하는 데 머물 수 있지만, 추론모델은 문제를 단계별로 분석해 정확한 수학적 사고를 거친 후 정답을 제시한다.
저비용으로 경량화한 추론모델은 AI 기술의 가능성도 훨씬 넓힌다. 가령 서비스 특화형 sLLM 추론모델을 챗봇 등에 탑재하면, 추론모델인 만큼 학습한 데이터를 조합한 새로운 형태의 추론형 응답이 가능해져 단순한 응대 이상의 서비스가 가능해진다. 뿐만 아니라 개인화 한 맞춤형 응답 생성 또한 더욱 정교해질 수 있다. 추론모델은 단순한 기억과 예측을 넘어, 문제 해결을 위한 연쇄적 사고(chain-of-thought)와 다중 조건 판단(multi-hop reasoning)까지 가능해실사용 환경에서 훨씬 정밀하고 유연한 대응이 가능하기 때문이다.
IT 관계자는 "딥시크 이후 추론모델 개발에 대한 한계가 깨진 것"이라고 설명했다.
Copyright ⓒ Metro. All rights reserved. (주)메트로미디어의 모든 기사 또는 컨텐츠에 대한 무단 전재ㆍ복사ㆍ배포를 금합니다.
주식회사 메트로미디어 · 서울특별시 종로구 자하문로17길 18 ㅣ Tel : 02. 721. 9800 / Fax : 02. 730. 2882
문의메일 : webmaster@metroseoul.co.kr ㅣ 대표이사 · 발행인 · 편집인 : 이장규 ㅣ 신문사업 등록번호 : 서울, 가00206
인터넷신문 등록번호 : 서울, 아02546 ㅣ 등록일 : 2013년 3월 20일 ㅣ 제호 : 메트로신문
사업자등록번호 : 242-88-00131 ISSN : 2635-9219 ㅣ 청소년 보호책임자 및 고충처리인 : 안대성