거대 XML의 효과적인 동적 Labeling을 위한 질의 기법

Alternative Title
Hyunsu Ju
Author(s)
주현수
Alternative Author(s)
Hyunsu Ju
Advisor
오상윤
Department
일반대학원 컴퓨터공학과
Publisher
The Graduate School, Ajou University
Publication Year
2020-02
Language
kor
Keyword
XML데이터거대XML Query파티션기법
Abstract
오늘날 XML은 높은 상호운용성과 확장성으로 de-facto 데이터 표현법으로 사용되고 있다. XML의 높은 확장성은 거대 데이터를 표현 및 저장하기 위한 방법으로도 사용이 되고 있으며, 이에 따라 저장된 거대 XML 데이터에 대해 질의(query)를 하기 위한 질의의 분산 처리에 관해서도 많은 연구가 이루어져 왔다. 그러나 기존 거대 XML의 분산 query 환경에 동적 labeling을 적용함에 있어 query가 갖는 특정한 엘리먼트를 가리키는 표현적 특징 때문에 하나의 노드에서 query로 찾고자 하는 엘리먼트 수보다 사용되는 데이터의 수가 많아 처리 시간 지연 문제를 가진다. 이러한 처리 시간의 지연은 끝내 동적 labeling 성능을 저하하는 문제를 유발하기 때문에 효율적인 동적 labeling을 위한 query 방법이 필요하다. 본 논문에서는 동적 labeling을 위한 query 처리 시간의 단축을 위해 prefix 기반의 XML labeling이 적용된 label을 이용하여 ad-hoc query 방법과 XML 데이터의 분할 방법 및 데이터 관리 테이블을 제안한다. 이때 본 논문은 동적 labeling을 위한 query를 특정하여 처리하는 방법을 제안하기 때문에 “특별한 목적을 위해”라는 의미의 ad-hoc이라는 형용사를 사용하여 본 제안 방법을 표현한다. 제안하는 ad-hoc query 방법은 찾고자 하는 엘리먼트의 label을 이용하여 해당 엘리먼트의 부모 및 조상 엘리먼트를 검증하며, 위 과정을 통해 query에 사용된 데이터양만큼의 연산 횟수를 갖는다. 또한 ad-hoc query 과정에서 사용되는 데이터 관리 테이블은 query 처리에 필요한 데이터를 전체 노드에서 찾지 않고 찾고자 하는 엘리먼트를 저장한 노드 내에서 찾을 수 있도록 한다. 이와 같은 방법을 통해 동적 labeling을 위한 query를 처리할 때 기존의 XML query 분산 처리 방법보다 적은 비교 연산 횟수로 처리 시간을 단축시킬 수 있다. 제안 방안의 효과를 검증하기 위해 실험을 진행하였다. 그 결과 같은 연산 횟수를 갖는 상황에서 본 제안 방법이 기존 방법보다 30% 더 긴 처리 시간을 보였지만, 본 제안 방법의 ad-hoc query 방법과 데이터 관리 table 인한 비교 연산 횟수 감소를 통해 평균 78.87% 더 짧은 처리 시간을 보였다. 그러나 제안 방법은 일반적인 query 처리할 때 비교 연산 횟수가 증가하여 매우 큰 처리 시간을 보이는 한계점이 있다.
URI
https://dspace.ajou.ac.kr/handle/2018.oak/19544
Fulltext

Appears in Collections:
Graduate School of Ajou University > Department of Computer Engineering > 3. Theses(Master)
Files in This Item:
There are no files associated with this item.
Export
RIS (EndNote)
XLS (Excel)
XML

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.

Browse