오토인코더 이상 탐지 알고리즘의 성능 비교

Alternative Title
A Comparative Evaluation of AutoEncoder Anomaly Detection Algorithms
Author(s)
유상철
Alternative Author(s)
SangChul Yoo
Advisor
왕지남
Department
일반대학원 산업공학과
Publisher
The Graduate School, Ajou University
Publication Year
2023-02
Language
kor
Keyword
데이터 불균형디노이징 오코인코더비지도 이상 탐지오토인코더이상 탐지
Abstract
본 논문의 목적은 비지도 학습을 주장하는 기존의 이상 탐지 방법들의 주요 가정인 정상 데이터로만 학습 데이터셋을 구성하는 것이, 개별 데이터의 라벨 정보를 활용할 수 없다는 근본적인 비지도 학습의 가정과 모순됨을 지적하고 학습 데이터셋에 포함된 소수의 비정상 데이터가 모델 학습에 끼치는 영향을 비교, 분석하여 실제 비지도 학습 환경에서 적용할 수 있는 오토인코더 기반의 이상 탐지 방법을 제시하는 것이다. <br> <br>이를 위해 본 연구에서는 범용 데이터셋을 이용하여 정상 데이터만 학습 데이터에 포함되는 준지도 학습 환경과 라벨 정보를 활용할 수 없어 정상 데이터와 비정상 데이터가 혼재된 비지도 학습 환경을 구성하였다. 이후 학습 데이터에 포함된 비정상 데이터의 비율에 따른 오토인코더 기반의 이상 탐지 모델의 성능을 비교하는 실험을 진행하였으며 또한, 오토인코더 기반의 이상 탐지 모델의 학습 과정에서 정상 데이터와 비정상 데이터 학습 차이를 비교하는 실험을 진행하였다. <br> <br>본 연구에서는 데이터의 구조적 특성에 맞는 인공 신경망, 데이터의 일반적인 특징을 학습할 수 있는 제약과 정상 데이터와 비정상 데이터의 학습 속도 차이를 이용하면 비지도 이상 탐지 모델이 준지도 학습 방식의 이상 탐지 모델에 준하는 성능을 가질 수 있음을 밝혀냈다.
Alternative Abstract
The purpose of this paper is to point out that constructing a training dataset with only normal data, which is the main assumption of existing anomaly detection methods claiming unsupervised learning, contradicts the fundamental assumption of unsupervised learning that label information of individual data cannot be utilized. It is to present an autoencoder based anomaly detection method that can be applied in an actual unsupervised learning environment by comparing and analyzing the effect of a small number of abnormal data included in the training dataset on model learning. <br> <br>To this end, in this study, a semi-supervised learning environment in which only normal data is included in the training data and an unsupervised learning environment in which normal data and abnormal data are mixed because label information cannot be used are used by using universal datasets such as the MNIST dataset and the ECG dataset. was composed. Afterwards, an experiment was conducted to compare the performance of the autoencoder based anomaly detection model according to the ratio of abnormal data included in the training data. In addition, during the learning process of the autoencoder based anomaly detection model, the learning difference between normal data and abnormal data was compared. An experiment was conducted. <br> <br>In this study, an unsupervised anomaly detection model can be compared to a semi-supervised anomaly detection model by using an artificial neural network suitable for the structural characteristics of data, constraints that can learn general characteristics of data, and the difference in learning speed between normal and abnormal data. It was found that similar performance can be obtained.
URI
https://dspace.ajou.ac.kr/handle/2018.oak/24527
Fulltext

Appears in Collections:
Graduate School of Ajou University > Department of Industrial Engineering > 3. Theses(Master)
Files in This Item:
There are no files associated with this item.
Export
RIS (EndNote)
XLS (Excel)
XML

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.

Browse