파형 생체신호 이상치 탐색을 위한 딥러닝 방법 연구

Alternative Title
Research of deep learning methods for waveform bio-signal outlier detection
Author(s)
박태준
Alternative Author(s)
TaeJun Park
Advisor
박래웅, 윤덕용
Department
일반대학원 의생명과학과
Publisher
The Graduate School, Ajou University
Publication Year
2022-02
Language
kor
Keyword
딥러닝비지도학습전이학습지도학습파형 생체신호
Abstract
의학 연구에 다양한 딥러닝 방법이 소개됨에 따라 환자로부터 수집된 파형 생체 신호의 활용 사례가 늘어나고 있다. 파형 생체 신호에는 대표적으로 심전도(Electrocardiogram), 광혈류측정(Photoplethysmo-graphy), 혈압(Arterial blood pressure)등이 있으며 이를 활용하기 위한 딥러닝 방법으로는 일차원 합성곱 신경망(1-dimensional Convolutional Neural Network)이 주목받고 있다. 다양한 딥러닝 방법들이 연구되고 있는 만큼 모델에 입력될 파형 데이터의 질과 그에 따른 정제 방법 또한 연구되고 있다. 편향되지 않은 연구 결과를 얻기 위해서는 연구자들에게 보다 정확한 잡음(noise) 또는 누락 탐지 및 정제가 요구된다. 본 연구는 광혈류, 혈압, 호흡 파형의 잡음을 탐지하기 위한 딥러닝 모델을 개발하고 분석하였다. 비교를 위해 지도학습 모델(1dCNN)과 비지도학습 모델(GAAL)을 각각의 파형에서 학습하고 내부 및 외부 데이터를 활용해 평가하였다. 지도학습 모델은 기본적인 CNN의 구조를 참고하여 구성하였고, 비지도학습 모델은 적대적 생성네트워크-(Generative Adversarial Network, GAN)을 액티브 러닝(Active learning)의 형태로 구성하였다(Generative Adversarial Active Learning, GAAL). 모델의 학습 및 내부평가를 위해 오픈 데이터 베이스인 MIMIC3 waveform matched subset 데이터를 활용하였으며, 외부평가를 위해 Fantasia database를 활용했다. 데이터의 노이즈 유무는 데이터 엔지니어 2명에 의해 수동적으로 진행되었으며 훈련셋(train set)과 검증&평가셋(validation & test set)을 각자 라벨링하였다. 모델의 학습에는 MIMIC3 데이터의 80%인 훈련셋이 사용되었으며, 검증셋(10%)에서 모델의 세부설정을 조정(Hyper-parameter tuning)하였다. 모델의 과적합을 막기 위해 검증셋에서 가장 높은 AUROC를 기록한 모델을 추출하였고, 모델 학습의 무작위성을 고려해 위의 과정을 각 학습방법마다 30회 반복하였다. 마지막으로 학습한 30개 모델은 평가셋(10%)에서 평가되었으며 지도학습 모델과 비지도학습 모델이 기록한 AUROC와 AUPRC값의 평균과 표준편차를 계산하였다. 내부검증 이후, 혈압과 호흡 파형에 대해 외부검증 데이터에서도 동일한 평가가 이루어졌으며 마찬가지로 AUROC, AUPRC의 평균과 표준편차를 계산하여 비교하였다. 추가로 비지도학습 모델의 전이학습 성능을 평가하고자 Fantasia data의 훈련셋(80%)에서 비지도 전이학습을 수행했고, 동일한 외부검증 평가셋(10%)에서 기존의 모델들과 분류 성능을 비교했다. 내부 검증 결과, 지도학습 모델이 광혈류 파형(1dCNN 평균 AUROC = 0.97[0.0]; GAAL 평균 AUROC = 0.9[0.04])과 혈압 파형(1dCNN 평균 AUROC = 0.9 [0.04]; GAAL 평균 AUROC = 0.84[0.03])의 노이즈 분류에 비지도학습 모델에 비해 높은 성능을 보인 반면 호흡 파형(1dCNN 평균 AUROC = 0.73 [0.04]; GAAL 평균 AUROC = 0.75[0.03])에서는 뚜렷한 차이를 보이지 않았다. 외부검증 결과, 지도학습 모델과 비지도학습 모델 모두 호흡 파형(1dCNN 평균 AUROC = 0.39 [0.01]; GAAL 평균 AUROC = 0.4[0.07])에서 급격한 성능 저하를 보였지만, 전이학습 이후 비지도학습 모델은 호흡파형(Transfer 평균 AUROC = 0.62[0.04])에서 성능 향상을 보였다. 본 연구는 다양한 파형 생체신호(Pleth, ABP, RESP)에서 지도학습과 비지도학습 모델의 노이즈 탐지 학습 성능을 확인 및 분석했다는 의의를 갖는다. 보다 일반적인 비교를 위해 30개 모델의 평균 AUROC와 AUPRC를 내부 및 외부 데이터에서 비교하였으며, 비지도 전이학습을 통해 비지도학습 방법이 갖는 장점 또한 살펴보았다. 또한, GAAL 알고리즘을 활용한 고도화된 연구 가능성을 보았으며 몇몇 연구의 단점에 대한 분석을 통해 추후에 더욱 세밀하고 정교한 추후 연구의 필요성을 살펴보았다.
Alternative Abstract
As various deep learning methods are introduced in medical research, the use cases of waveform bio-signals collected from patients are increasing. Waveform bio-signals include electrocardiogram, photoplethysmography, and arterial blood pressure. As a deep learning method to utilize them, 1-dimensional convolutional neural network is used. Various deep learning methods are being studied, as well as the quality of waveform data to be input to the model and processing methods. To obtain unbiased study results, more accurate noise detection and processing are required for researchers. In this study, a deep learning model was developed and analyzed to detect noise in the photoplethysmography (Pleth), arterial blood pressure (ABP), and respiratory (Resp) waveforms. For comparison, a supervised learning model(1dCNN) and an unsupervised learning model (GAAL) were trained on each waveform and evaluated using internal and external data. The supervised learning model was constructed with reference to the basic CNN structure, and the unsupervised learning model was composed of a generative adversarial network (GAN) in the form of active learning (GAAL). For model learning and internal evaluation, MIMIC3 waveform matched subset data, an open database, was used, and Fantasia database was used for external evaluation. The label of the noise in the data was manually conducted by two data engineers, and the training set and validation & test set were individually labelled. The training set, which is 80% of the MIMIC3 data, was used for model learning, and the detailed settings of the model were adjusted (hyper-parameter tuning) in the validation set (10%). To prevent model overfitting, the model with the highest AUROC was extracted from the validation set, and the process was repeated 30 times for each learning method considering the randomness of model learning. Trained models were evaluated in the test set (10%), and the mean and standard deviation of the AUROC and AUPRC values calculated. After the internal validation, the same evaluation was performed on the external validation data for blood pressure and respiratory waveforms, and the mean and standard deviation of AUROC and AUPRC were calculated and compared. In addition, to evaluate the transfer learning performance of the unsupervised learning model, unsupervised transfer learning was performed on the training set (80%) of Fantasia data, and the classification performance was compared with the existing models in the same external test set (10%). As a result of the internal validation, the supervised learning model showed that classification of the pleth waveform (1dCNN mean AUROC = 0.97[0.0]; GAAL mean AUROC = 0.9[0.04]) and ABP waveform (1dCNN mean AUROC = 0.9 [0.04]; GAAL mean AUROC = 0.84[0.03]) showed higher performance compared to the unsupervised learning model, but there was no significant difference in the respiratory waveform (1dCNN mean AUROC = 0.73 [0.04]; GAAL mean AUROC = 0.75[0.03]). As a result of external validation, both the supervised learning model and the unsupervised learning model showed performance degradation in the respiratory waveform (1dCNN mean AUROC = 0.39 [0.01]; GAAL mean AUROC = 0.4[0.07]), but after transfer learning, the unsupervised learning model showed a sharp decrease in performance. In the waveform (Transfer mean AUROC = 0.62[0.04]), the performance was improved. This study has the significance of confirming and analyzing the noise detection learning performance of supervised and unsupervised learning models in various waveform bio-signals (Pleth, ABP, Resp). For a more general comparison, the average AUROC and AUPRC of 30 models were compared in internal and external data, and the advantages of unsupervised transfer learning were also examined. In addition, we saw the possibility of advanced research using the GAAL algorithm, and the need for more detailed and sophisticated future research was examined through the analysis of the shortcomings of the study.
URI
https://dspace.ajou.ac.kr/handle/2018.oak/20821
Fulltext

Appears in Collections:
Graduate School of Ajou University > Department of Biomedical Sciences > 3. Theses(Master)
Files in This Item:
There are no files associated with this item.
Export
RIS (EndNote)
XLS (Excel)
XML

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.

Browse