음소 통계를 활용한 고유명사 인식 정확도 향상 기법

Alternative Title
Kyuseok Kim
Author(s)
김규석
Alternative Author(s)
Kyuseok Kim
Advisor
노병희
Department
정보통신대학원 정보통신
Publisher
The Graduate School, Ajou University
Publication Year
2019-08
Language
kor
Abstract
4차 산업혁명 시대에 음성인식 인터페이스는 기기조작 분야와 전화걸기, 위치찾기, 날씨확인 등의 정보검색 분야에서 널리 활용되고 있다. 현재 음성인식 인터페이스는 딥러닝, 머신러닝과 같은 데이터 축적 기술을 기반으로 한 기계학습 기술을 이용해 억양과 발음을 학습하고 참조데이터를 활용하기도 하여 인식의 정확도를 높이고 있다. 그러나 새로운 사물은 계속해서 생성되는 만큼 고유명사의 수 또한 계속해서 증가하고 있다. 또한, 한국어와 같은 언어의 경우에는 중국어나 영어에 비해서 사용인구가 적은 만큼 학습량도 적은 상황이다. 따라서, 고유명사의 음성인식 정확도를 높이기 위해 딥러닝과 같은 데이터 축적을 통한 기계학습에 의존하지 않고 음향학적 음성인식 기술과 후보정 기술 등을 개선해야 할 필요가 있다. 본 논문에서는 1개 이상의 음성인식 N-best 결과물에 대한 음소들의 TF 통계를 내어 참조데이터가 미존재시, 최고 통계치의 결과물을 선택하고, 참조데이터가 존재시, 결과물과 일치하는 데이터를 선택한다. 만약, 참조데이터에 일치하는 데이터가 없는 경우 LED(Levenshtein Edit Distance) 값을 기준으로 결과물을 선택한다. 제안하는 알고리즘을 검증하기 위해 Google Voice를 활용하여 Index별 TF 최고값들을 조합한 새로운 단어를 생성해 내는 기법을 사용한다. 데이터 축적을 통한 기계학습 빈도가 낮은 고유명사를 활용하여 제안하는 방법을 실험한 결과, 고유명사의 음성인식 정확도가 향상됨을 확인하였다.
URI
https://dspace.ajou.ac.kr/handle/2018.oak/15555
Fulltext

Appears in Collections:
ETC > ETC
Files in This Item:
There are no files associated with this item.
Export
RIS (EndNote)
XLS (Excel)
XML

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.

Browse