다차원 프레셰 거리 기반 종단자료 군집분석

Alternative Title
Clustering for Longitudinal Data Based on Multidimensional Fréchet Distance
Author(s)
허성보
Advisor
권순선
Department
일반대학원 인공지능·데이터사이언스학과
Publisher
The Graduate School, Ajou University
Publication Year
2021-02
Language
kor
Keyword
False cluster-combinationFréchet distanceK-means clusteringK-평균 군집분석Longitudinal dataMulti variable거짓 군집조합다변수종단자료프레셰 거리
Abstract
각 개체가 궤적의 형태를 이루는 종단자료에 대한 K-평균 군집분석에서는 궤적 간 유사성을 측정할 수 있는 궤적 거리함수가 필요하다. 기존 K-평균 종단자료 군집분석 알고리즘들은 자체 거리함수 구조 등의 제약으로 현실의 다양한 종단자료를 분석하는 데 한계가 있었다. 특히, 한정된 차원의 궤적만 취급할 수 있다는 것이 대표적이었다. 이에 본 논문에서는 다변수 종단자료로부터 그려지는 다차원 궤적도 다룰 수 있는 새로운 K-평균 종단자료 군집분석 알고리즘을 제안하였다. 이는 궤적 간 유사성을 타당하게 측정한다고 알려진 프레셰 거리(Fréchet distance) 함수를 다변수로 구성된 종단자료도 처리할 수 있는 구조로 K-평균 군집분석 알고리즘에 도입한 것이 특징이다. 이를 통해 궤적 차원의 제약뿐만 아니라 궤적 간 시점 통일 제약 등 기존 알고리즘들이 가지고 있던 여러 가지 한계점을 해결할 수 있었다. 가상의 3차원 궤적에 대한 군집분석 시뮬레이션과 실제 임상 데이터에서의 군집분석 결과를 활용한 검증 과정에서도 본 논문에서 제안한 신규 알고리즘이 기존 알고리즘들에 비해 종합적으로 우수한 성능을 보임을 확인할 수 있었다.
Alternative Abstract
A K-means clustering for longitudinal data in which each object forms the form of a trajectory requires a trajectory distance function to measure similarity between the trajectories. The existing K-means clustering for longitudinal algorithms had limitations for analyzing various longitudinal data in reality due to restrictions such as their own distance function structure and etc. In particular, it was typical that only a limited dimension of trajectory could be handled. Thus, in this paper, a new K-means clustering for longitudinal data algorithm that can also deal with multidimensional trajectory drawn from multi variable longitudinal data was proposed. This algorithm is characterized by introducing the ‘Fréchet distance’ function, known to measure the similarity between trajectories, into the K-means clustering algorithm with a structure that can also handle multi-dimensional trajectories. Through this, it was possible to solve various limitations of existing algorithms, such as constraints like time-unification between trajectories, as well as the dimensional constraints. The verification process by clustering simulation on virtual 3-dimensional trajectories and utilizing the results of clustering in actual clinical data also confirmed that the new algorithm proposed in this paper showed overall superior performance compared to the existing algorithms.
URI
https://dspace.ajou.ac.kr/handle/2018.oak/20117
Fulltext

Appears in Collections:
Graduate School of Ajou University > Department of Artificial Intelligence and Data Science > 3. Theses(Master)
Files in This Item:
There are no files associated with this item.
Export
RIS (EndNote)
XLS (Excel)
XML

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.

Browse