메트로人 머니 산업 IT·과학 정치&정책 생활경제 사회 에듀&JOB 기획연재 오피니언 라이프 CEO와칭 플러스
글로벌 메트로신문
로그인
회원가입

    머니

  • 증권
  • 은행
  • 보험
  • 카드
  • 부동산
  • 경제일반

    산업

  • 재계
  • 자동차
  • 전기전자
  • 물류항공
  • 산업일반

    IT·과학

  • 인터넷
  • 게임
  • 방송통신
  • IT·과학일반

    사회

  • 지방행정
  • 국제
  • 사회일반

    플러스

  • 한줄뉴스
  • 포토
  • 영상
  • 운세/사주
IT/과학>IT/인터넷

중급 모델이 최상위급 위협…앤트로픽 ‘소네트 4.6’ 공개

앤트로픽 CI.

인공지능(AI) 챗봇 '클로드'를 운영하는 앤트로픽이 중급 주력 모델인 '소네트'의 업그레이드 버전을 공개했다. 지난 5일 최상위 모델 '오퍼스 4.6'을 선보인 지 약 2주 만이다.

 

앤트로픽은 17일(현지시간) 신규 AI 모델 '클로드 소네트 4.6'을 출시했다고 밝혔다. 회사 측은 소네트 4.6이 전작 대비 코딩, 컴퓨터 활용, 추론, 에이전트 등 전반적인 AI 역량에서 성능이 개선됐다고 설명했다.

 

벤치마크 평가에서도 소네트 4.6은 상당수 항목에서 오퍼스 4.6에 근접한 성능을 보였으며, 일부 지표에서는 오히려 더 높은 점수를 기록했다. 코딩 능력을 평가하는 'SWE-벤치 베리파이드'에서는 오퍼스 4.6의 80.8%에 가까운 79.6%를 기록했고, 컴퓨터 제어 기반 AI 에이전트 성능을 측정하는 'OS월드-베리파이드'에서도 오퍼스 4.6(72.7%)와 유사한 72.5%를 받았다.

 

재무 분석 역량을 평가하는 '파이낸셜 에이전트 v1.1' 지표에서는 소네트 4.6이 63.3%를 기록해 오퍼스 4.6(60.1%)를 웃돌았으며, 사무 업무 수행 능력을 나타내는 'GDPval-AA Elo' 점수 역시 오퍼스 4.6의 1606점보다 높은 1633점을 기록했다.

 

앤트로픽은 소네트 4.6이 한 번에 처리할 수 있는 정보량을 100만 토큰으로 확장했다고 밝혔다. 기업 고객용 사용 요금은 기존과 동일하게 100만 토큰당 3~15달러로 유지했다. 토큰은 AI가 문장을 처리하기 위해 텍스트를 의미 단위로 쪼갠 최소 처리 단위로, 단어 하나 또는 단어의 일부에 해당한다.

 

소네트 4.6 출시를 계기로 일각에서는 앤트로픽발(發) '사스포칼립스(SaaS + Apocalypse)' 우려가 다시 부각되고 있다. 앞서 앤트로픽은 지난 3일 코워크(CoWork)에 법률·금융 등 전문 영역을 겨냥한 11개 플러그인을 추가로 공개한 바 있다. 해당 플러그인들은 법률 문서 분석, 금융 데이터 정리, 리서치 요약 등 그간 고가의 전문 소프트웨어나 다수의 인력이 필요했던 업무를 대체할 수 있다는 평가를 받았다.

 

여기에 이번 소네트 4.6이 기존에는 오퍼스급 모델에서만 가능했던 업무 영역까지 소화할 수 있게 되면서, 전문 소프트웨어 시장 전반에 미칠 영향에 대한 우려가 한층 커질 것이라는 전망이 나온다.

트위터 페이스북 카카오스토리 Copyright ⓒ 메트로신문 & metroseoul.co.kr