말 알아듣는 스마트폰 쓰임새 다양해져...다음 음성인식 API 최초 공개

메트로신문 박성훈 기자 ㅣ2014-02-03 10:36:24

말을 알아듣는 스마트폰의 쓰임새가 더욱 다양해진다.

응용프로그램개발인터페이스포털 다음은 국내 최초로 모바일 음성 인식 API(응용프로그램 개발 인터페이스)를 공개한다고 3일 밝혔다.

음성 인식 API는 스마트폰에서 한국어 음성을 인식한 후 텍스트로 자동 변환하는 기능으로, 앱 개발자들이 모바일 앱에서 이를 활용해 다양한 서비스를 제공할 수 있다.

다음의 음성 인식 API는 2012년말 다음이 인수한 음성인식 전문기업 '다이알로이드'의 기술로 제작됐다. 이 기술은 단순한 키워드 인식을 넘어 연속 문장에 있어서도 높은 음성 인식률을 자랑한다.

이 기술은 현재 KT의 음성인식 큐레이션 서비스인 '매직보이스'와 다음앱에서 음성으로 간편하게 뉴스 댓글을 남길 수 있는 '음성댓글' 서비스에 적용돼 있다.

그리고 이 API는 모바일 라이브러리 형태로 지원돼 안드로이드 및 iOS용 SDK(소프트웨어 개발 키트)를 제공해 안드로이드 및 아이폰 앱 개발자 모두 사용할 수 있다.

특히 iOS용 한국어 음성 인식 SDK는 현재 구글에서 제공하지 않고 있어 음성인식 API 공개 기술로는 세계 최초 사례다.

이 API는 네 가지 종류의 음성 인식 기능을 제공한다. 단어 기반의 웹 검색을 위한 '키워드형', 지도상의 위치 설명 문장을 더 빠르게 인식하는 '지도형'이 있다.

그리고 일반적인 문장과 대화에 유리한 '연속형'과 단어 집합 단위로 음성 인식을 수행하는 '단어인식형'중 원하는 기능을 선택해서 음성 인식을 수행하는 차별점도 갖추고 있다.

여기서 '단어인식형'이란 사용자가 인식되기를 원하는 단어들의 집합을 미리 정해 그 범위 안에서 음성 인식을 수행하는 다음 음성 인식 API만의 기법이다.

메트로人

머니

산업

IT·과학

정치＆정책

생활경제

사회

에듀＆JOB

기획연재

오피니언

라이프

플러스

독자서비스

포럼＆컨퍼런스

말 알아듣는 스마트폰 쓰임새 다양해져...다음 음성인식 API 최초 공개