데이터 마이닝 앙상블 모델을 이용한 교통사고 분석
DC Field | Value | Language |
---|---|---|
dc.contributor.advisor | 이재식 | - |
dc.contributor.author | 이은정 | - |
dc.date.accessioned | 2018-11-08T07:55:52Z | - |
dc.date.available | 2018-11-08T07:55:52Z | - |
dc.date.issued | 2010-02 | - |
dc.identifier.other | 10614 | - |
dc.identifier.uri | https://dspace.ajou.ac.kr/handle/2018.oak/8507 | - |
dc.description | 학위논문(석사)--아주대학교 일반대학원 :경영정보학과,2010. 2 | - |
dc.description.abstract | 데이터 마이닝은 대용량의 데이터 속에서 의미 있는 패턴이나 규칙을 찾아내어 유용한 지식으로 활용하기 위하여 데이터를 탐색하고 분석하는 과정이다. 본 연구에서는 데이터 마이닝 기법들을 활용하여 교통사고 피해자의 상해 심각도 수준을 예측하는 모델을 구축 하였다. 상해 심각도는 ‘상해 없음’, ‘상해 가능’, ‘불구 없음’, ‘불구 있음’, ‘치명적 상해’, ‘알 수 없음’ 등의 6 단계의 수준으로 구분되는데, ‘상해 없음’은 전체 데이터의 70% 정도를 차지하지만, ‘치명적 상해’는 전체 데이터의 1% 정도밖에 차지하지 않는 등 상해 심각도가 심한 불균형 분포를 보이고 있다. 이러한 불균형 데이터에 대해서 데이터 마이닝 기술을 단순하게 한 번 적용하여 모델을 구축하고 예측을 수행하는 것은 모델의 적중률 면에서 신뢰성을 확보할 수가 없다. 그러므로 본 연구에서는 상해 심각도의 수준에 따라 데이터 마이닝 기법을 맞춤식으로 적용하여 상해 심각도 수준을 예측하는 앙상블 모델을 구축 하였다. 본 연구에서 구축한 앙상블 모델을 미국 NASS의 GES 2008년 교통사고 데이터에 적용하여 성능을 평가하였는데, 불균형 데이터임에도 불구하고 각 상해 심각도 수준별로 적중률이 비교적 균형을 이루는 결과를 보였다. | - |
dc.description.tableofcontents | <목 차> 제 1 장 서 론 제 1 절 연구의 배경 ..................................................... 1 제 2 절 연구의 목적 및 방법 .......................................... 2 제 3 절 논문의 구성 ..................................................... 3 제 2 장 이론적 배경 제 1 절 기존 문헌 연구 ................................................. 4 제 2 절 의사결정나무 ................................................ 14 제 3 절 인공신경망 .................................................... 17 제 4 절 불균형 데이터 (Imbalanced Data) ..................... 23 제 5 절 ROC 곡선 ...................................................... 24 제 3 장 예측 모델 구축 제 1 절 사용 데이터 및 속성 선정 ................................. 27 제 2 절 모델 데이터 집합의 구성 .................................. 29 제 3 절 기본 모델 ...................................................... 30 제 4 절 앙상블 모델 ................................................... 31 제 5 절 Threshold를 조정한 앙상블 모델 ....................... 37 제 6 절 Undersampling을 적용한 앙상블 모델 ................ 41 제 4 장 모델 성능평가 제 1 절 Evaluation Data Set 적용 ................................. 50 제 2 절 성능 해석 ...................................................... 51 제 5 장 결론 및 향후 연구 과제 제 1 절 연구 결과 및 의의 ........................................... 54 제 2 절 연구의 한계점과 향후 연구 방향 ........................ 55 [참고문헌] ................................................................. 57 | - |
dc.language.iso | kor | - |
dc.publisher | The Graduate School, Ajou University | - |
dc.rights | 아주대학교 논문은 저작권에 의해 보호받습니다. | - |
dc.title | 데이터 마이닝 앙상블 모델을 이용한 교통사고 분석 | - |
dc.title.alternative | Analysis of Traffic Accidents using Data Mining Ensemble Model | - |
dc.type | Thesis | - |
dc.contributor.affiliation | 아주대학교 일반대학원 | - |
dc.contributor.alternativeName | Lee Eun Jeong | - |
dc.contributor.department | 일반대학원 경영정보학과 | - |
dc.date.awarded | 2010. 2 | - |
dc.description.degree | Master | - |
dc.identifier.localId | 568605 | - |
dc.identifier.url | http://dcoll.ajou.ac.kr:9080/dcollection/jsp/common/DcLoOrgPer.jsp?sItemId=000000010614 | - |
dc.subject.keyword | 교통사고 예측 | - |
dc.subject.keyword | 앙상블 모델 | - |
dc.subject.keyword | 데이터 마이닝 | - |
dc.subject.keyword | ROC 곡선 | - |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.