인공지능(AI) 챗봇 '클로드'를 운영하는 앤트로픽이 중급 주력 모델인 '소네트'의 업그레이드 버전을 공개했다. 지난 5일 최상위 모델 '오퍼스 4.6'을 선보인 지 약 2주 만이다.
앤트로픽은 17일(현지시간) 신규 AI 모델 '클로드 소네트 4.6'을 출시했다고 밝혔다. 회사 측은 소네트 4.6이 전작 대비 코딩, 컴퓨터 활용, 추론, 에이전트 등 전반적인 AI 역량에서 성능이 개선됐다고 설명했다.
벤치마크 평가에서도 소네트 4.6은 상당수 항목에서 오퍼스 4.6에 근접한 성능을 보였으며, 일부 지표에서는 오히려 더 높은 점수를 기록했다. 코딩 능력을 평가하는 'SWE-벤치 베리파이드'에서는 오퍼스 4.6의 80.8%에 가까운 79.6%를 기록했고, 컴퓨터 제어 기반 AI 에이전트 성능을 측정하는 'OS월드-베리파이드'에서도 오퍼스 4.6(72.7%)와 유사한 72.5%를 받았다.
재무 분석 역량을 평가하는 '파이낸셜 에이전트 v1.1' 지표에서는 소네트 4.6이 63.3%를 기록해 오퍼스 4.6(60.1%)를 웃돌았으며, 사무 업무 수행 능력을 나타내는 'GDPval-AA Elo' 점수 역시 오퍼스 4.6의 1606점보다 높은 1633점을 기록했다.
앤트로픽은 소네트 4.6이 한 번에 처리할 수 있는 정보량을 100만 토큰으로 확장했다고 밝혔다. 기업 고객용 사용 요금은 기존과 동일하게 100만 토큰당 3~15달러로 유지했다. 토큰은 AI가 문장을 처리하기 위해 텍스트를 의미 단위로 쪼갠 최소 처리 단위로, 단어 하나 또는 단어의 일부에 해당한다.
소네트 4.6 출시를 계기로 일각에서는 앤트로픽발(發) '사스포칼립스(SaaS + Apocalypse)' 우려가 다시 부각되고 있다. 앞서 앤트로픽은 지난 3일 코워크(CoWork)에 법률·금융 등 전문 영역을 겨냥한 11개 플러그인을 추가로 공개한 바 있다. 해당 플러그인들은 법률 문서 분석, 금융 데이터 정리, 리서치 요약 등 그간 고가의 전문 소프트웨어나 다수의 인력이 필요했던 업무를 대체할 수 있다는 평가를 받았다.
여기에 이번 소네트 4.6이 기존에는 오퍼스급 모델에서만 가능했던 업무 영역까지 소화할 수 있게 되면서, 전문 소프트웨어 시장 전반에 미칠 영향에 대한 우려가 한층 커질 것이라는 전망이 나온다.
Copyright ⓒ 메트로신문 & metroseoul.co.kr
Copyright ⓒ Metro. All rights reserved. (주)메트로미디어의 모든 기사 또는 컨텐츠에 대한 무단 전재ㆍ복사ㆍ배포를 금합니다.
주식회사 메트로미디어 · 서울특별시 종로구 자하문로17길 18 ㅣ Tel : 02. 721. 9800 / Fax : 02. 730. 2882
문의메일 : webmaster@metroseoul.co.kr ㅣ 대표이사 · 발행인 · 편집인 : 이장규 ㅣ 신문사업 등록번호 : 서울, 가00206
인터넷신문 등록번호 : 서울, 아02546 ㅣ 등록일 : 2013년 3월 20일 ㅣ 제호 : 메트로신문
사업자등록번호 : 242-88-00131 ISSN : 2635-9219 ㅣ 청소년 보호책임자 및 고충처리인 : 안대성