카카오엔터프라이즈가 기업용 인공지능(AI) 음성 인식-변환 모델 '커스텀 STT(Custom Speech-to-Text)'를 공개했다.
STT는 AI를 활용해 음성을 텍스트로 변환해주는 기능으로, AI 스피커, 음성 검색, 내비게이션 등 다양한 용도로 활용되고 있다.
카카오엔터프라이즈가 공개한 커스텀 STT는 각 기업의 고객과 산업 특성에 맞는 모델을 쉽고 빠르게 구축해 음성 인식-변환의 정확도를 높일 수 있다. 고객사가 직접 단어와 패턴을 추가하면, 가장 적합한 AI 모델을 빠른 시간 내 자동으로 만들어준다. 고유명사나 길고 복잡한 단어 처리도 가능하다. 실제 내부 실험 결과, 음성인식 오류율이 기존 대비 30% 이상 개선돼 음성인식(STT) 성능이 대폭 향상된 것을 확인할 수 있었다. 클라우드 기반의 '서비스형 AI(AIaaS)'로 기업의 서비스 관리 시간과 비용 부담을 해소할 수 있다는 점도 장점이다.
기존 STT 서비스를 수정/개발 하려면 고객사가 직접 요청사항을 정리해 개발사에 전달하고, 개발사가 해당 모델을 재개발해야 하는 과정을 거쳐야 한다. 이에 비해 커스텀 STT 모델은 고객사가 직접 클라우드에 접속해 제품명, 신기능, 요청 사항 등 새로운 내용을 직접 실시간으로 입력하고 커스터마이즈할 수 있어 시간과 비용을 대폭 절감할 수 있다.
예를 들어 내비게이션 음성 인식 서비스는 새로운 지명이나 주소가 미리 학습돼 있지 않다면 해당 음성을 인식하지 못한다. 하지만 커스텀 STT를 활용하면 내비게이션 운영사가 클라우드에서 직접 새로운 지명이나 주소를 추가할 수 있고, 내비게이션에 즉각 반영된다. 또한 AI 고객센터에 커스텀 STT를 적용하면, 사용자의 최근 주요 요청 사항이나 신제품 출시, 신규 이벤트 등 새로운 정보를 실시간 업데이트해 신속하게 알릴 수 있다.
카카오엔터프라이즈는 올 상반기 오픈 할 '카카오 i 커넥트 센터(AICC)'의 문의응대나 상담 업무 등에도 커스텀 STT를 적용할 예정이다. 향후에는 음성인식(STT) 뿐만 아니라 문자인식(OCR), 음성합성(TTS) 분야의 보유 기술도 커스텀이 가능한 서비스형 AI(AIaaS) 모델로 순차적으로 공개할 예정이다.
카카오엔터프라이즈 최동진 AI Lab장은 "커스텀 STT는 고객사가 직접 데이터를 쉽게 추가해 자동 학습을 진행하고 커스텀 모델을 만들기 때문에 AI 재학습과 업데이트 소요시간을 크게 단축할 수 있다"며 "기업들은 신속하게 데이터를 변경/추가해 사용자들에게 새로운 정보를 빠르게 전달하고 더 편리한 경험을 제공할 수 있을 것"이라고 밝혔다.
Copyright ⓒ Metro. All rights reserved. (주)메트로미디어의 모든 기사 또는 컨텐츠에 대한 무단 전재ㆍ복사ㆍ배포를 금합니다.
주식회사 메트로미디어 · 서울특별시 종로구 자하문로17길 18 ㅣ Tel : 02. 721. 9800 / Fax : 02. 730. 2882
문의메일 : webmaster@metroseoul.co.kr ㅣ 대표이사 · 발행인 · 편집인 : 이장규 ㅣ 신문사업 등록번호 : 서울, 가00206
인터넷신문 등록번호 : 서울, 아02546 ㅣ 등록일 : 2013년 3월 20일 ㅣ 제호 : 메트로신문
사업자등록번호 : 242-88-00131 ISSN : 2635-9219 ㅣ 청소년 보호책임자 및 고충처리인 : 안대성