어휘 의미망 기반의 질의어 확장을 통한 검색 결과의 모호성 개선

Alternative Title
Kwak Sangmin
Author(s)
곽상민
Alternative Author(s)
Kwak Sangmin
Advisor
김민구
Department
정보통신전문대학원 정보통신공학과
Publisher
The Graduate School, Ajou University
Publication Year
2009-02
Language
kor
Abstract
인터넷의 발달과 보급으로 인해 인터넷상의 정보들은 갈수록 방대해지고 있다. 이로 인해 대량의 인터넷 문서들로부터 사용자가 필요로 하는 정보를 정확하게 추출하는 기술이 더욱 중요해지고 있다. 웹 정보검색 시스템은 사용자가 어떤 질의어를 입력하는지에 따라 검색 결과가 달라진다. 문제는 질의어를 선택하고 입력하는 것이 전적으로 사용자의 책임으로 남아있다는 것이다. 때문에 사용자가 입력한 질의어가 적절하지 못할 경우 원치 않는 검색 결과를 얻게 될 것이다. 특히 질의어가 동형이의어나 다의어 같은 모호한 개념을 포함하고 있을 때, 사용자가 의도한 의미와는 다른 의미로 해석될 여지가 있다. 이는 사용자가 의도한 질의어의 의미가 아니라, 어휘 자체의 형태에 따라 검색을 시도하기 때문이다. 이러한 문제점을 개선하기 위해 본 논문에서는 어휘 의미망을 사용한 질의어의 확장을 제안한다. 본 논문에서 사용한 사용자 어휘 지능망(U-WIN)은 특정 관련성에 의해 수집된 부류의 집합 구조형태인 분류적 상하관계가 아닌, 엄밀한 의미에서의 상하관계를 중심으로 한국어의 인지 체계에 맞는 개념화 과정을 통해 형성된 계층적 상하관계이기 때문에, 상위어가 질의어의 모호성을 해결하는 유용한 정보로 사용될 수 있다. 또한 동의관계가 세분화되어 있는 특징을 이용하여, 동의관계 중에서 일반 동의관계와 준말본말관계를 제외한 순화어관계, 오용어관계, 방언관계, 북한어관계, 옛말관계를 사용하여 질의어의 잘못된 표현을 바로 잡을 수 있다. 이는 표준어가 아닌 어휘가 입력되었을 경우 표준어를 질의어의 확장에 사용하는 효과가 있으며, 동의 관계의 방향성을 이용하므로 표준어를 입력하였을 경우에는 반대 방향으로는 확장하지 않는다. 따라서 사용 빈도가 낮은 어휘를 확장하는, 잘못된 확장을 막을 수 있다. 일반 동의관계와 준말본말관계의 경우 잘못된 확장인지를 구별할 수 없기 때문에 질의어의 확장 대상에서 제외한다. 이렇게 확장된 질의어는 사용자가 의도한 질의어의 의미를 보다 정확히 반영하고, 검색 결과의 범위를 제한하기 때문에 불필요한 검색 결과를 제거하는 효과를 기대할 수 있다. 또한 사용자가 부정확한 질의어를 입력한 경우에도, 어휘 의미망에 존재하는 어휘라면 보다 자주 사용되는 어휘로 질의어를 확장함으로써 보다 나은 검색 결과를 기대할 수 있다.
URI
https://dspace.ajou.ac.kr/handle/2018.oak/17453
Fulltext

Appears in Collections:
Special Graduate Schools > Graduate School of Information and Communication Technology > Department of Information and Communication > 3. Theses(Master)
Files in This Item:
There are no files associated with this item.
Export
RIS (EndNote)
XLS (Excel)
XML

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.

Browse