결측치 추정을 위한 상관 그래프 기반 준지도학습

DC Field Value Language
dc.contributor.advisor신현준, 신현정-
dc.contributor.author신유경-
dc.date.accessioned2019-04-01T16:40:47Z-
dc.date.available2019-04-01T16:40:47Z-
dc.date.issued2019-02-
dc.identifier.other28756-
dc.identifier.urihttps://dspace.ajou.ac.kr/handle/2018.oak/14946-
dc.description학위논문(석사)--아주대학교 일반대학원 :데이터사이언스학과,2019. 2-
dc.description.abstract데이터의 레코드 중에 하나 이상의 속성값이 없는 경우는 비일비재하다. 의외로 많은 경우에 있어서 데이터의 수 대비 결측치가 없는 완전레코드의 수의 비율이 적다. 이에 대하여 평균값, 최빈값, 그리고 중앙값 등으로 대체하는 통계적 방법이 가장 보편적으로 쓰이고 있다. 또한, 기계학습에서도 K-최근접이웃 탐색이나 의사결정나무 등을 활용한 결측치 추정방법들이 자주 활용된다. 전자는 각 속성의 대표값으로 대체하는 전역적인 방법인데 반해 후자는 해당 레코드의 유사한 레코드들의 속성값으로 대체하는 지역적인 방법이라 할 수 있다. 그러나 한 속성의 값이 대부분 결측된 경우라면 두 방법 모두 한계가 있어 활용하기에 적절치 않다. 이러한 한계를 극복하기 위하여 본 연구에서는 결측치의 속성과 상관성이 큰 이웃 속성들로부터 값을 추정하는 방법을 제안한다. 제안 방법은 속성 간 상관성을 기반으로 하기 때문에 한 속성의 대부분의 값이 결측이 되더라도 활용할 수 있다. 방법론으로는 속성들 간의 상관계수로 이루어진 상관 그래프를 만들고 그래프 기반 준지도학습을 적용한다. 결측치는 다른 속성들로부터 상관계수에 비례하여 전파되어 추정된다. 비교 실험 결과, 제안 방법이 기존 방법들보다 우수함을 보였다.-
dc.description.tableofcontents제 1장 서론 1 제 2장 정의 및 연구 배경 4 2.1 결측에 따른 데이터 구조 4 2.2 결측치 종류 및 처리 방법 8 2.3 결측치 대체 10 제 3장 선행 연구 11 제 4장 제안 방법론 16 4.1 그래프 이론 및 준지도학습 16 4.2 상관 속성 네트워크 구성 19 4.3 혼합 그래프 기반 준지도학습 32 4.4 결측치 대체 모델 35 제 5장 실험 36 5.1 토이 실험 36 5.2 실험 설정 39 5.3 실험 결과 42 제 6장 결론 47 참고문헌 50-
dc.language.isokor-
dc.publisherThe Graduate School, Ajou University-
dc.rights아주대학교 논문은 저작권에 의해 보호받습니다.-
dc.title결측치 추정을 위한 상관 그래프 기반 준지도학습-
dc.title.alternativeYukyung Shin-
dc.typeThesis-
dc.contributor.affiliation아주대학교 일반대학원-
dc.contributor.alternativeNameYukyung Shin-
dc.contributor.department일반대학원 데이터사이언스학과-
dc.date.awarded2019. 2-
dc.description.degreeMaster-
dc.identifier.localId905337-
dc.identifier.uciI804:41038-000000028756-
dc.identifier.urlhttp://dcoll.ajou.ac.kr:9080/dcollection/common/orgView/000000028756-
Appears in Collections:
Graduate School of Ajou University > Department of Data Science > 3. Theses(Master)
Files in This Item:
There are no files associated with this item.

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.

Browse