EHR 데이터의 패턴 정보를 활용한 딥러닝 기반 만성 신질환 위험도 예측 연구
DC Field | Value | Language |
---|---|---|
dc.contributor.advisor | 박래웅 | - |
dc.contributor.author | 이유림 | - |
dc.date.accessioned | 2019-04-01T16:41:06Z | - |
dc.date.available | 2019-04-01T16:41:06Z | - |
dc.date.issued | 2019--2 | - |
dc.identifier.other | 28811 | - |
dc.identifier.uri | https://dspace.ajou.ac.kr/handle/2018.oak/15006 | - |
dc.description | 학위논문(석사)--아주대학교 일반대학원 :의학과,2019. 2 | - |
dc.description.abstract | 2013년도 질병관리본부의 국민건강통계에 따르면 30세 이상의 성인 중 3.9%가 만성 신질환(chronic kidney disease)을 가지고 있으며, 65세 이상에서는 16.5%로 유병률이 매우 높은 질환이다. 특히 발병 과정에서 신부전증으로 인해 여러 가지 합병증들이 유발되는데, 해당 질병들이 악화되면서 많은 환자들을 사망에 이르게 만든다. 그럼에도 불구하고 초기 증상이 뚜렷하지 않아 환자가 신장 이상을 느끼고 병원에 내원하는 경우는 드문 실정이다. 이러한 만성 신질환을 조기에 예측하고자 전자의무기록(electronic health record, EHR)을 이용한 연구들이 선행되고 있다. 최근 딥러닝의 기술이 급속하게 발전하면서 의료 분야에서도 활발한 연구가 진행되고 있으며 기존의 전통적인 기계학습(Machine Learning)보다 좋은 성능을 보이고 있다. 또한, 딥러닝 분야에서 다양한 모델 구조 실험들이 이루어지고 있으며 구조에 따라 성능이 달라지는 연구 사례들이 있었다. 그러나 의료분야에서 다양한 딥러닝 모델 구조를 실험하고 만성 신질환 예측을 위한 연구 사례는 비교적 적었다. 이에 본 논문에서는 이에이치알(EHR) 데이터 중 진단과 처방 정보를 활용한 만성 신질환 위험도를 예측하였으며 여러 가지 구조의 딥러닝 모델에 따른 성능을 비교 평가하였다. 학습된 데이터의 가중치를 추출하여 만성 신질환 예측에 높은 수치를 가진 시점들의 정보들을 확인하여 정성적인 평가를 하였다. 실험 결과 국민건강보험공단 표본연구 DB에 대하여 정확도(accuracy) 81.09%, 에이유알오씨(The Area under the Receiver Operating Characteristics Curve, AUROC) 87.75%, 에이유피알씨(The Area under the Precision-Recall Curve, AUPRC) 52.72%, 웨이티드 에프원 스코어(Weighted F1-score) 83.03%를 나타냈고, 아주대학교병원 데이터베이스에 대해서 정확도 82.07%, 에이유알오씨 88.24%, 에이유피알씨 63.61%, 웨이티드 에프원 스코어 82.93%를 나타냈다. 이에 기반하여 본 연구에서 제안된 모델이 만성 신질환의 조기 발견과 지연 및 유병률을 감소시키는 데 효과적으로 기여하리라 기대한다. | - |
dc.description.tableofcontents | Ⅰ. 서론 1 A. 연구 배경 및 필요성 1 B. 연구 목적 4 Ⅱ. 이론적 배경 5 A. 합성곱 신경망(Convolutional neural network, CNN) 5 B. 순환 신경망(Recurrent Neural Network, RNN) 7 1. 장단기 메모리(Long Short-Term Memory, LSTM) 9 2. 게이트 순환 유닛(Gated Recurrent Unit, GRU) 11 3. 양방향 순환 신경망(Bidirectional recurrent neural network, BRNN) 13 4. 어텐션 메커니즘(Attention mechanism) 15 C. 임베딩(embedding) 17 1. 워드투벡(Word2Vec) 17 2. 메드투벡(Med2Vec) 19 Ⅲ. 연구대상 및 방법 20 A. 분석 대상 데이터 20 1. 오몹 시디엠(OMOP-CDM) 22 2. 국민건강보험공단 표본연구 DB 23 3. 아주대학교병원 데이터베이스 24 B. 데이터 전처리 25 C. 실험 설계 28 D. 딥러닝 기반의 만성 신질환 위험도 예측 모델 30 1. 입력 계층(Input layer) 32 2. 임베딩 계층(Embedding layer) 34 3. 다양한 구조 계층(Various structure layer) 36 4. 예측 계층(Prediction layer) 41 E. 개발 환경 42 F. 평가 척도 44 1. 정확도(Accuracy) 45 2. 에이유알오씨(The Area under the Receiver Operating Characteristics Curve, AUROC) 46 3. 에이유피알씨(The Area under the Precision-Recall Curve, AUPRC) 47 4. 에프원 스코어(F1-score) 48 Ⅳ. 실험 결과 49 A. 예측 모델별 성능 49 B. 어텐션 메커니즘을 이용한 가중치 추출 결과 53 Ⅴ. 고찰 57 Ⅵ. 결론 60 참고문헌 61 부록 66 ABSTRACT 72 | - |
dc.language.iso | kor | - |
dc.publisher | The Graduate School, Ajou University | - |
dc.rights | 아주대학교 논문은 저작권에 의해 보호받습니다. | - |
dc.title | EHR 데이터의 패턴 정보를 활용한 딥러닝 기반 만성 신질환 위험도 예측 연구 | - |
dc.type | Thesis | - |
dc.contributor.affiliation | 아주대학교 일반대학원 | - |
dc.contributor.department | 일반대학원 의학과 | - |
dc.date.awarded | 2019. 2 | - |
dc.description.degree | Master | - |
dc.identifier.localId | 905252 | - |
dc.identifier.uci | I804:41038-000000028811 | - |
dc.identifier.url | http://dcoll.ajou.ac.kr:9080/dcollection/common/orgView/000000028811 | - |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.