기대수명의 상승으로 인구가 고령화되고 만성질환자가 증가하면서 건강한 삶, 건강 관리의 중요성이 높아지는 한편 정보통신기술(ICT : Information and Communication Technologies)의 발전, 스마트폰과 웨어러블 기기의 보급 확대로 인하여 모바일 헬스 서비스에 대한 관심과 니즈가 증가하며 시장이 크게 성장하고 있다. 관계를 끊으려는 사용자의 경향으로 정의되는 ‘이탈’은 모든 기업이 부딪치게 되는 중요한 문제 중 하나이다. 사용자 이탈은 매출을 감소시키고 신규 사용자 유치의 필요성을 증가시키는데 신규 사용자의 확보에는 기존 사용자의 유지에 필요한 비용보다 약 5배 이상의 비용이 소요되는 부담이 있다.
본 논문의 목적은 급성장하고 있는 모바일 헬스 서비스 영역에서 사용자의 이탈 및 유지에 대하여 유의한 영향을 미치는 요인들을 탐구하고, 이탈을 예측할 수 있는 모델을 제안하는 것이다. 이를 위하여 모바일 헬스 서비스 사용행태 정보를 수집하고 로지스틱 회귀분석, Extreme Gradient Boost, LightGBM, CatBoost 머신러닝 알고리즘을 적용한 네 가지 모델을 개발하여 평가, 검증하였으며 최적 모델로서 CatBoost 모델을 선정하고 모델의 순열 특성 중요도를 측정하여 이탈 요인을 도출하였다.
본 논문은 급성장하고 있는 모바일 헬스 산업에서 찾기 어려웠던 사용자 이탈 예측 모델을 제시하였으며, 이탈의 요인, 특히 모바일 헬스 서비스 사용자의 미래 행동을 예측하기 위하여는 사용자의 기본정보 데이터보다 실제 과거의 행태정보가 더 유의미하다는 사실을 구체적으로 확인하였다. 이후의 연구에서는 이탈 방지 Action Plan을 연구하고 이를 실행함으로써 이탈이 예방된 효과를 실질적으로 분석하고자 한다. 이러한 연구가 모바일 헬스 산업의 활성화에 도움이 될 것으로 기대한다.