방대한 양의 가공되지 않은 시계열 데이터는 연속적이고 반복적인 특징을 가지고 있다. 따라서, 적절한 데이터 관리가 이루어지지 않을 경우, 시각화된 정보 제공을 위한 사용자에게로의 데이터 전달 과정에서 대역폭 낭비와 과도한 네트워크 지연이 발생할 수 있다. 이러한 문제를 해결하기 위해 M4와 같은 기존의 연구에서는 데이터 병합 기법을 통해 획기적으로 데이터 량을 감소시키면서도, 동시에 시각화된 결과물의 무결성을 보장하는 방법을 제안하고 있다. 그러나 M4와 같은 기존의 연구들은 사용자가 쉽게 접근 할 수 있는 웹 서버 기반에서의 실험과 같이, 보다 현실적인 환경에서의 성능 검증을 고려하지 않고 있다.
본 논문에서는 M4를 향상한 IGM4(inter-pixel gradient-based M4)를 제안하여, 시각화된 그래프 결과를 왜곡시키지 않으면서 동시에 데이터 량과 지연을 더욱 감소시키기 위한 연구를 진행한다. 사용자 친화적인 웹 기반 시스템을 구축하여 데이터 처리 기법들을 다루고, 보다 실증적인 환경에서의 실험을 수행한다. 마지막으로 다양한 시계열 데이터와 해상도를 반영하여, 원본 데이터와 M4, IGM4 간의 비교 분석 실험을 통한 성능 검증 결과를 제시한다.
Alternative Abstract
Time-series data are vast volumes of raw data that are continuous and repetitive. Therefore, in the process of delivering data to users for data visualization, time-series data can cause bandwidth wastage and extensive network delays if there is no efficient data management. Existing work such as M4 aim to solve this problem by providing high data reduction rates through data aggregation and guaranteeing the reliability of visualization results at the same time. However, current work on M4 does not consider verification in a more practical environment; for example experimentation on web-based servers that are openly accessible by users.
In this paper, we propose IGM4(intel-pixel gradient-based M4) for improving the M4, and conduct a study to reduce the amount of data and delay without distorting the results of visualized graph. We build user-friendly web-based system to dealing with the data processing technique, and perform test on the empirical environment. Finally, we present the results of performance evaluation through comparison among the original data, M4, and IGM4 reflecting the various kinds of time-series data and resolutions.