허혈성 심장질환 진단을 위한 기계 학습 알고리즘 비교 연구

DC Field Value Language
dc.contributor.advisor이석원-
dc.contributor.author박평우-
dc.date.accessioned2018-11-08T08:27:46Z-
dc.date.available2018-11-08T08:27:46Z-
dc.date.issued2018-02-
dc.identifier.other26987-
dc.identifier.urihttps://dspace.ajou.ac.kr/handle/2018.oak/13981-
dc.description학위논문(석사)--아주대학교 일반대학원 :컴퓨터공학과,2018. 2-
dc.description.abstract최근, 딥 러닝 기술과 함께 인공지능에 대한 연구가 활발히 진행되고 있고, 현세대의 인간은 그 본연의 능력을 넘어서는 수준의 데이터를 활용하고 있으며, 인공지능 기술을 통한 정확하고 효율적인 의사결정이 가능해지고 있다. 이에 따라, 인공지능 기술은 앞으로 인간의 편의와 안전을 위하여 모든 영역에 범용적으로 확산될 전망이다. 또한, 의료정보 분야에서는 점차 의료 지식 및 관련 데이터의 축적이 가속화되고 있고, 의료 빅데이터에 대한 통계적 또는 수학적 접근 방식이 활성화되고 있으며, 인공지능 기술을 통한 질환 진단 및 처방에 대한 연구가 활발히 진행되고 있다. 본 연구에서는 대표적인 심혈관 질환인 허혈성 심장질환을 연구 도메인으로 설정하고, 해당 질환의 진단을 위한 의료 전문가 시스템 내 활용 가능한 알고리즘과 효율적인 접근 방식을 비교 및 분석하여 제안한다. 구체적인 연구의 목적은, 기존 환자의 초진기록 데이터를 바탕으로 의료 전문가 및 의사를 보조하는 것으로, 허혈성 심장질환에 대한 인과 관계 설명에 도움을 주고, 불필요한 관련 검사를 최소화한다는 데에 그 의미가 있다. 또한, 실험 데이터를 구성하여 의료 전문가 및 의사는 학습용 모델로 활용하면서, 이를 통해 경험과 지식을 효율적으로 극대화할 수 있다. 연구 실험은, 아주대학교 병원 심혈관센터에 내원한 환자의 전자의무기록 중 초진기록을 추출하여 다양한 데이터 마이닝 알고리즘 및 기법을 적용하고, 그 과정에서 검증된 데이터 마이닝 연구 방법론과 지식 및 데이터 기반의 접근 방식을 결합하여 진행한다. 이후, 본격적인 연구 실험을 통해 활용 가능한 양질의 데이터 세트를 생성하였고, 초진기록에 대한 접근 방향을 제시하였으며, 기계 학습 분류기를 비교 및 선별하였다. 추가로, 특징 선택 알고리즘을 통해 질환 인과 관계에 대한 속성도 파악하고 분석하였다. 그 결과로, 결측 값에 대한 의미를 부여한 데이터 세트에 다층 퍼셉트론 분류기를 적용한 경우 확진 환자를 진단하는 데에 좋은 성능을 보인다는 것을 알 수 있었고, 비확진 환자의 정확한 진단은 나이브 베이지안 및 서포트 벡터 머신 분류기가 효율적이라는 것을 알 수 있었다. 연구의 의의는 실제 병원의 전자의무기록 내 초진기록 데이터에 대하여 데이터 마이닝 연구 방법론을 적용하여 연구하였다는 것과, 지식 및 데이터 기반 접근을 통해 허혈성 심장질환 확진 지표 및 지침 중 약 33%에 불과한 초진기록 속성을 통해 확진 환자를 86% 정확도로 질환 확진을 예측하였다는 것이다. 이를 통하여, 추후 고도화된 의료 서비스의 발전과 함께 복합적으로 활용되어 사람들의 삶의 질을 향상시킬 수 있고, 질환 진단의 객관적인 보조 역할을 담당할 수 있으며, 정확도 및 신뢰도 높은 지능화된 부가 서비스를 창출할 수 있다.-
dc.description.tableofcontents제 1 장 서 론 1 제 1 절 연구 배경 1 제 2 절 연구 필요성 3 제 3 절 연구 목적 6 제 4 절 연구 구조 7 제 5 절 연구 전략 9 제 6 절 연구 기대 효과 10 제 7 절 논문 구성 10 제 2 장 본 론 12 제 1 절 배경 지식 12 제 1 관 허혈성 심장질환 12 제 2 관 전자의무기록 14 제 3 관 기계 학습 15 제 4 관 기계 학습 알고리즘 및 모델 16 제 1 조 지도 학습 16 제 2 조 나이브 베이즈 17 제 3 조 서포트 벡터 머신 18 제 4 조 다층 퍼셉트론 19 제 5 조 특징 선택 21 제 6 조 정보 이득 알고리즘 21 제 7 조 유전 탐색 알고리즘 22 제 8 조 금기 탐색 알고리즘 23 제 2 절 관련 연구 24 제 1 관 의료 전문가 시스템 24 제 1 조 렉스메드 24 제 2 조 왓슨 포 온콜로지 24 제 2 관 허혈성 심장질환 연구 25 제 3 관 기존 연구 29 제 1 조 K-최근접 이웃 알고리즘을 활용한 심장병 진단 및 예측 29 제 2 조 심장병 진단 및 예측에 대한 결측 값 대체 방식 알고리즘 비교에 관한 연구 30 제 3 절 연구 실험 31 제 1 관 연구 실험 방법 및 절차 31 제 2 관 데이터 세트 수집 및 분석 34 제 3 관 데이터 세트 전처리 46 제 1 조 속성 언어 재구성 48 제 2 조 값 언어 재구성 49 제 3 조 이상점 처리 50 제 4 조 데이터 세트 분할 및 선택 52 제 5 조 표준 데이터 세트 생성 54 제 1 항 K-최근접 이웃 결측 값 대체 알고리즘 적용 56 제 2 항 결측 값 의미 부여 59 제 3 항 정보 이득 특징 선택 알고리즘 적용 59 제 4 항 금기 탐색 특징 선택 알고리즘 적용 61 제 5 항 유전 탐색 특징 선택 알고리즘 적용 62 제 4 관 기계 학습 알고리즘 적용 63 제 5 관 알고리즘 적용 결과 63 제 6 관 연구 실험 결과 분석 및 비교 69 제 7 관 연구 실험 결과 토의 72 제 3 장 결 론 84 제 1 절 연구 결론 84 제 2 절 연구 의의 85 제 1 관 연구 성과 85 제 2 관 전문가 평가 85 제 3 절 연구 한계점 86 제 4 절 향후 연구 86 참 고 문 헌 88 ABSTRACT 94-
dc.language.isokor-
dc.publisherThe Graduate School, Ajou University-
dc.rights아주대학교 논문은 저작권에 의해 보호받습니다.-
dc.title허혈성 심장질환 진단을 위한 기계 학습 알고리즘 비교 연구-
dc.title.alternativeA Comparative Study between Machine Learning Algorithms for Diagnosis of Ischemic Heart Disease-
dc.typeThesis-
dc.contributor.affiliation아주대학교 일반대학원-
dc.contributor.alternativeNamePark, Pyoung Woo-
dc.contributor.department일반대학원 컴퓨터공학과-
dc.date.awarded2018. 2-
dc.description.degreeMaster-
dc.identifier.localId800808-
dc.identifier.urlhttp://dcoll.ajou.ac.kr:9080/dcollection/jsp/common/DcLoOrgPer.jsp?sItemId=000000026987-
dc.subject.keyword인공지능-
dc.subject.keyword의료공학-
dc.subject.keyword데이터 마이닝-
dc.subject.keyword허혈성 심장질환-
dc.subject.keyword전문가 시스템-
dc.description.alternativeAbstractIn recent years, studies on artificial intelligence have been actively conducted along with deep learning technology, and human beings of today's generation utilize data at levels exceeding their inherent capabilities. Also, artificial intelligence technology supports accurate and efficient decision making for mankind. Accordingly, artificial intelligence technology is expected to spread widely in all areas for human convenience and safety in the future. In the field of medical information, the accumulation of medical knowledge and related data is accelerating, statistical or mathematical approach to medical big data is being activated, and studies on diagnosis and prescription of diseases through artificial intelligence technology are being carried out briskly. In this study, I set up a representative cardiovascular disease, specifically ischemic heart disease, as a research domain, and analyzed the available algorithms comparing effective approaches in the medical expert system for the diagnosis of the disease. Concretely, the purpose of the study is to assist medical experts and physicians based on the initial patient record data, help them to explain the causal relationship of ischemic heart disease, and minimize unnecessary related tests. In addition, the experimental data can be configured so that medical professionals and physicians can utilize them as learning models, thereby maximizing their experience and knowledge efficiently. The research experiment was carried out by extracting the first records among the electronic medical records of the patients who visited Ajou University Hospital Cardiovascular Center, applying various data mining algorithms and techniques, and using the data mining research methodology with knowledge-based approach and data-based approach. After that, I created a high-quality data set that can be utilized through full-scale research experiments, presented the approach direction with the first reports, and compared and selected machine learning classifiers. In addition, I analyzed the critical attributes of the causal relationship through feature selection algorithms. As a result, it was found that the application of Multi-Layer Perceptron classifier to the data set given the meaning of the missing values showed good performance in diagnosing the contracted patient, and the accurate diagnosis for the unconfirmed patient was made by Naïve Bayesian and Support Vector Machine. The significance of this study is that data mining research methodology was applied to the first recorded data in the electronic medical records of the actual hospital, and that with only the initial records taking just 33% of the real guideline indicators knowledge-based approach and data-based approach were used, obtaining 86% accuracy. Through this much performance, it will be possible to improve the quality of life for people by taking advantage of it with the development in advanced medical services complexly, to serve as an objective supporting system for diagnosis of the disease, and to create intelligent and highly reliable additional services as well.-
Appears in Collections:
Graduate School of Ajou University > Department of Computer Engineering > 3. Theses(Master)
Files in This Item:
There are no files associated with this item.

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.

Browse