메트로人 머니 산업 IT·과학 정치&정책 생활경제 사회 에듀&JOB 기획연재 오피니언 라이프 AI영상 CEO와칭 플러스
글로벌 메트로신문
로그인
회원가입

    머니

  • 증권
  • 은행
  • 보험
  • 카드
  • 부동산
  • 경제일반

    산업

  • 재계
  • 자동차
  • 전기전자
  • 물류항공
  • 산업일반

    IT·과학

  • 인터넷
  • 게임
  • 방송통신
  • IT·과학일반

    사회

  • 지방행정
  • 국제
  • 사회일반

    플러스

  • 한줄뉴스
  • 포토
  • 영상
  • 운세/사주
IT/과학>IT/인터넷

"네이버 음성인식이 다음으로 할 일은 화자를 인식하는 것"

한익상 네이버 음성인식 기술 리더. /구서윤 기자



네이버 음성인식이 '화자 인식' 기술에 집중하고 있다.

한익상 네이버 음성인식 기술 리더는 서울 강남구 역삼동 'D2 스타트업 팩토리'에서 열린 기술 포럼에서 "아직까지 국내에서 화자 인식에 대해 진보를 보인 곳이 없다"며 "네이버 음성인식이 다음으로 할 일은 화자를 인식하는 것"이라고 밝혔다. 화자 인식은 누가 말하는지 혹은 등록된 사용자가 말했는지 인식하는 기술이다.

한 리더는 이와 관련해 "라인의 메시지를 읽어주는 형태로 서비스가 구성될 것으로 예상한다"고 말했다. 가정에서 사용할 경우 아버지가 "메시지 읽어줘"라고 말하면 다른 가족의 메시지가 아닌 화자인 아버지에게 온 메시지를 읽어주는 것이다. 이 같은 화자 인식이 구현되면 말하는 사람의 취향에 맞춰 개인별로 다른 콘텐츠를 제공할 수 있을 것으로 보인다.

이어 "장기적인 관점에선 맥락을 이해하는 기술을 발전시켜 대화가 지속되도록 해 친구와 대화하듯 편하게 사용할 수 있도록 하는 게 목표"라고 밝혔다. 현재는 사용자가 "오늘 날씨 어때?"라고 물으면 그에 대한 답만 하고 끝나는 방식이 주를 이룬다.

또 네이버는 자사의 지식 공유 플랫폼 지식iN을 활용해 음성 인식을 더욱 똑똑하게 만든다는 계획이다. 사용자가 "아랫배가 아픈데 어떻게 하죠?"라는 질문을 하면 그에 맞는 지식인 답변을 찾아 읽어주는 방식이다.

강인호 언어처리(자연어처리) 기술 리더. /구서윤 기자



강인호 언어처리(자연어처리) 기술 리더는 "2500만건의 지식인 문서로부터 사용자의 언어 표현 행동을 습득하고 동의어, 오타교정 등 다양한 언어 현상을 이해하는 분석 모델 개발했다"고 말했다.

김재민 음성합성 기술 리더. /구서윤 기자



기계가 특정인의 목소리를 그대로 흉내 낼 수 있는 음성합성에 필요한 음성 녹음 시간은 획기적으로 줄였다. 김재민 음성합성 기술 리더는 "보통은 최소 40시간 분량의 음성이 있어야 음성합성 서비스가 가능하고 최대 100시간까지도 녹음하는데 네이버는 이를 4시간으로 줄였다"며 "서비스도 곧 나올 예정"이라고 밝혔다.
트위터 페이스북 카카오스토리 Copyright ⓒ 메트로신문 & metroseoul.co.kr