일반화된 패턴을 이용한 관계 추출 시스템

Alternative Title
Relation Extraction System Using Generalized Patterns
Author(s)
김혜민
Alternative Author(s)
Kim, Hyemin
Advisor
박승규, 김민구
Department
정보통신전문대학원 정보통신공학과
Publisher
The Graduate School, Ajou University
Publication Year
2005-08
Language
kor
Abstract
텍스트 형태의 문서에는 많은 종류의 가치 있는 정보가 포함되어 있다. 특히, 단어와 단어간의 관계 정보는 QA(Question and Answer)시스템에서 정확한 정보를 제공해 줄 수 있으며[7] 시멘틱 웹의 기반을 형성하는 온톨로지를 구성하는 데에 사용될 수 있다[16]. 따라서 문서에서 이러한 관계를 찾는 방법에 대한 연구가 활발하게 진행되고 있다. 그러나 문서의 양과 단어간의 관계가 많기 때문에 모든 관계를 사람이 찾아낼 수는 없다. 따라서 사람의 참여를 최소한으로 하는 자동 패턴 추출에 대한 연구가 필수적이다. 자동으로 관계를 찾는 대부분의 시스템이 패턴을 이용하고 있다. 패턴은 자동으로 관계를 찾는 시스템의 핵심으로 실제 문서에서 관계를 추출할 때 쓰이게 된다. 패턴은 관계가 실제 문서에서 실현되는 모습을 말한다. 예를 들어, “X 는 Y이다.”라는 문장에서 “~는 ~이다.”라는 것은 is-a관계를 나타내는 패턴이다. Is-a즉, 상·하위 관계가 문장에서 “~이다”를 통해 표현된 것이다. 관계 추출 시스템은 이러한 패턴을 이용하여 문서에 존재하는 관계를 자동으로 추출할 수 있다. 시스템에서 사용하는 패턴이 정확할수록 추출된 관계 정보도 정확해진다. 그러나 정확한 패턴을 생성하는 데에는 많은 어려움이 따른다. 본 논문에서는 문서상에 존재하는 많은 관계들을 찾기 위해 자동으로 패턴을 찾는 시스템과 다양한 형태의 패턴을 수용하기 위해 단순화된 패턴을 적용하는 방법을 제안한다. 본 연구에서는 자동으로 패턴을 찾는 기존의 시스템과 제안한 방법을 근거로 한 시스템을 구현하여 상, 하위 관계에 있는 단어들을 찾고, 각각의 성능을 비교 평가할 것이며 실험을 통해 발견된 문제점에 대해서도 분석하고 해결책을 제시한다.
URI
https://dspace.ajou.ac.kr/handle/2018.oak/16614
Fulltext

Appears in Collections:
Special Graduate Schools > Graduate School of Information and Communication Technology > Department of Information and Communication > 3. Theses(Master)
Files in This Item:
There are no files associated with this item.
Export
RIS (EndNote)
XLS (Excel)
XML

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.

Browse