시간적, 사회적 제약으로 인해 사람들의 이동 경로가 제한된다는 사실로 미루어봤을 때, 사용자의 위치 정보는 보다 구체적으로 사용자의 성향을 표현하고, 행동 패턴을 관찰할 수 있는 중요한 자료가 된다.
본 논문에서는 위치 기반 데이터를 활용하여 유의미한 정보를 분석하기 위하여 두 가지 관점에서 위치 데이터 분석을 진행하였다.
먼저, SNS인 인스타그램 텍스트 데이터를 활용하여 여행 트렌드를 분석하였다. 시간대 별 여행자의 이동 패턴을 파악해 특정 시간대에 방문횟수가 많은 장소를 알아내어 의미 있는 패턴 정보를 파악하였다. 패턴을 분석하기 위한 방법으로 LDA를 활용하였는데, 분석 결과 일반 태그 분석에 비해 상관관계가 더 높은 해시태그들이 군집화 되어 지역을 구분하고 지역과 관련된 키워드를 잘 뽑아내는 데 더 효과적이다 는 것을 확인할 수 있었다.
다음으로 통신사의 통화량 데이터를 토대로 지역별 업종 이용 현황 파악을 진행하였다. 시계열 데이터를 수집하여 HMM 알고리즘을 적용한 결과, 시간의 흐름에 따라 각 업종이 어떤 경향을 보이는 지를 파악하였고, 입력 데이터의 차원을 높여, 나타날 수 있는 관찰 값의 경우의 수를 늘리는 새로운 방법을 시도해보았다. 또한 지역구 별로 분류된 모델을 활용하여, 4차원의 새로운 데이터가 나타났을 때, n=15를 적용하여 80%의 분류 정확도를 이끌어낼 수 있었다.
본 연구를 통해 텍스트 기반의 위치 정보 및 시계열 데이터를 가공하여 지역 별로 나타난 패턴을 탐색하고, 이러한 패턴이 타당성을 가지고 있는지 거리 비교 및 분류를 통해 검증한다. 이를 통해 특정 지역에서 관찰 가능한 경향성에 대한 타당성을 입증하며 지역에 관한 패턴을 정리한다.