2013년도 질병관리본부의 국민건강통계에 따르면 30세 이상의 성인 중 3.9%가 만성 신질환(chronic kidney disease)을 가지고 있으며, 65세 이상에서는 16.5%로 유병률이 매우 높은 질환이다. 특히 발병 과정에서 신부전증으로 인해 여러 가지 합병증들이 유발되는데, 해당 질병들이 악화되면서 많은 환자들을 사망에 이르게 만든다. 그럼에도 불구하고 초기 증상이 뚜렷하지 않아 환자가 신장 이상을 느끼고 병원에 내원하는 경우는 드문 실정이다. 이러한 만성 신질환을 조기에 예측하고자 전자의무기록(electronic health record, EHR)을 이용한 연구들이 선행되고 있다.
최근 딥러닝의 기술이 급속하게 발전하면서 의료 분야에서도 활발한 연구가 진행되고 있으며 기존의 전통적인 기계학습(Machine Learning)보다 좋은 성능을 보이고 있다. 또한, 딥러닝 분야에서 다양한 모델 구조 실험들이 이루어지고 있으며 구조에 따라 성능이 달라지는 연구 사례들이 있었다. 그러나 의료분야에서 다양한 딥러닝 모델 구조를 실험하고 만성 신질환 예측을 위한 연구 사례는 비교적 적었다.
이에 본 논문에서는 이에이치알(EHR) 데이터 중 진단과 처방 정보를 활용한 만성 신질환 위험도를 예측하였으며 여러 가지 구조의 딥러닝 모델에 따른 성능을 비교 평가하였다. 학습된 데이터의 가중치를 추출하여 만성 신질환 예측에 높은 수치를 가진 시점들의 정보들을 확인하여 정성적인 평가를 하였다.
실험 결과 국민건강보험공단 표본연구 DB에 대하여 정확도(accuracy) 81.09%, 에이유알오씨(The Area under the Receiver Operating Characteristics Curve, AUROC) 87.75%, 에이유피알씨(The Area under the Precision-Recall Curve, AUPRC) 52.72%, 웨이티드 에프원 스코어(Weighted F1-score) 83.03%를 나타냈고, 아주대학교병원 데이터베이스에 대해서 정확도 82.07%, 에이유알오씨 88.24%, 에이유피알씨 63.61%, 웨이티드 에프원 스코어 82.93%를 나타냈다. 이에 기반하여 본 연구에서 제안된 모델이 만성 신질환의 조기 발견과 지연 및 유병률을 감소시키는 데 효과적으로 기여하리라 기대한다.