적합성 피드백 방법은 사용자 질의어와 검색 성능을 향상시키기 위해 사용자로부터 이전 검색된 문서 집합에 대한 적합성 판단 정보를 이용하는 전반적인 모든 방법을 의미한다. 일반적으로 모델에따라 다르지만 적합성 피드백 방법은 질의어에 새로운 단어를 추가하여 질의어 확장하는 것과 질의어에 존재하는 단어의 가중치를 조정하는 것 또는 둘다를 포함하는 것으로 생각할 수 있다. 그러나 확장 불리언 검색 모델에서 적합성 피드백은 이것들 뿐만 아니라 질의어에 있는 단어들을 적절하게 불리언 연산자(AND/OR)로 연결시켜야 한다. 많은 연구가들이 이러한 문제를 해결하고자 노력하여 몇가지 방법을 제안하였다. 하지만 대부분 방법들은 불리언 모델에 기반하여 질의어를 확장하여 확장 불리언 모델에는 적합하지 않을 수 있다. Salton과 그의 동료들은 확장 불리언 모델을 위한 DNF(disjunctive normal form) 방법이라 불리는 적합성 피드백 방법을 제안하였다. 그렇지만 이 방법도 다른 방법과 비슷하게 질의어를 확장하는데 중점을 두었을 뿐 질의어에 포함된 용어의 가중치를 조정하는 것에 대하여 소홀하였다. 또한 질의어를 확장할 때 몇가지 문제를 갖고 있다. 이 논문에서는 기존 불리언 적합성 피드백 방법의 문제점들을 극복하기 위해 계층적 클러스터링 기법을 이용한 적합성 피드백 방법을 제안한다. 또한 확장 불리언 모델에서 신경망을 기반으로 질의어의 용어 가중치를 조정하는 방법을 제안한다. 그리고 두개의 실험 데이터 집합인 TREC 1의 DOE 컬렉션과 Web TREC 10 컬렉션을 이용하여 제안한 방법의 성능을 평가하겠다.
Alternative Abstract
The relevance feedback process uses information obtained from a user about a set of initially retrieved documents to improve subsequent search formulations and retrieval performance. In extended Boolean models, the relevance feedback implies not only that new query terms must be identified and re-weighted, but also that the terms must be connected with Boolean And/Or operators properly. Salton et al. proposed a relevance feedback method, called DNF (disjunctive normal form) method, for a well established extended Boolean model. However, this method mainly focuses on generating Boolean queries but does not concern about re-weighting query terms. Also, this method has some problems in generating reformulated Boolean queries. In this paper, we investigate the problems of the DNF method and propose a relevance feedback method using hierarchical clustering techniques to solve those problems. We also propose a neural network model in which the term weights used in extended Boolean queries can be adjusted by the users' relevance feedbacks.