AJOU Central Library Repository: 음소 통계를 활용한 고유명사 인식 정확도 향상 기법

BROWSE

ETC ETC

음소 통계를 활용한 고유명사 인식 정확도 향상 기법

Alternative Title: Kyuseok Kim

Author(s): 김규석

Alternative Author(s): Kyuseok Kim

Advisor: 노병희

Department: 정보통신대학원 정보통신

Publisher: The Graduate School, Ajou University

Publication Year: 2019-08

Language: kor

Abstract: 4차 산업혁명 시대에 음성인식 인터페이스는 기기조작 분야와 전화걸기, 위치찾기, 날씨확인 등의 정보검색 분야에서 널리 활용되고 있다. 현재 음성인식 인터페이스는 딥러닝, 머신러닝과 같은 데이터 축적 기술을 기반으로 한 기계학습 기술을 이용해 억양과 발음을 학습하고 참조데이터를 활용하기도 하여 인식의 정확도를 높이고 있다. 그러나 새로운 사물은 계속해서 생성되는 만큼 고유명사의 수 또한 계속해서 증가하고 있다. 또한, 한국어와 같은 언어의 경우에는 중국어나 영어에 비해서 사용인구가 적은 만큼 학습량도 적은 상황이다. 따라서, 고유명사의 음성인식 정확도를 높이기 위해 딥러닝과 같은 데이터 축적을 통한 기계학습에 의존하지 않고 음향학적 음성인식 기술과 후보정 기술 등을 개선해야 할 필요가 있다. 본 논문에서는 1개 이상의 음성인식 N-best 결과물에 대한 음소들의 TF 통계를 내어 참조데이터가 미존재시, 최고 통계치의 결과물을 선택하고, 참조데이터가 존재시, 결과물과 일치하는 데이터를 선택한다. 만약, 참조데이터에 일치하는 데이터가 없는 경우 LED(Levenshtein Edit Distance) 값을 기준으로 결과물을 선택한다. 제안하는 알고리즘을 검증하기 위해 Google Voice를 활용하여 Index별 TF 최고값들을 조합한 새로운 단어를 생성해 내는 기법을 사용한다. 데이터 축적을 통한 기계학습 빈도가 낮은 고유명사를 활용하여 제안하는 방법을 실험한 결과, 고유명사의 음성인식 정확도가 향상됨을 확인하였다.

URI: https://dspace.ajou.ac.kr/handle/2018.oak/15555

Fulltext

Appears in Collections:: ETC > ETC

Files in This Item:: There are no files associated with this item.

Export: RIS (EndNote); XLS (Excel); XML

Show full item record

qrcode

트윗하기

License

STATISTICS: Total Visit :4,352,420; Total Download :2,019; Today View :2,634

AJOU Central Library Repository는 국립중앙도서관 OAK 보급사업으로 구축되었습니다.

BROWSE

Browse