반도체, LCD 공정에서 이상 탐지 및 분류에 대한 연구는 활발히 진행 중이며 특히나 공정 상황에 맞는 이상 탐지가 중요하고 이를 집중적으로 연구되고 있다.
그 중에서 공정 단계에서 반복적인 패턴을 이루는 데이터의 이상 탐지의 경우 일반적인 이상 탐지로 발견하기 어렵고 해당 공정에 특성에 맞는 이상 탐지 기법이 제공되어야 한다.
이에 실제 LCD 특정 공정의 설비 데이터를 이용하여 주기 신호를 이루며 패턴을 이루는 공정을 대상으로 위와 같은 문제점에 대해서 해결 방안을 제시하고 이상 점에 대한 분석과 정상과 이상의 기준이 명확하지 않는 패턴을 이루는 공정에 대해 이상 탐지를 하기 위한 방법론을 제시하고 검증한다.
첫 번째로 관리 상한선에 단점을 보완하기 위해 이상 치 감지 기법을 적용한다. 관리 상한선으로 이상 감지 시에는 데이터 분포에 따라 관리 상한선을 제한할 수밖에 없으며 임계 치의 범위에 따라 이상 탐지 결과가 많이 바뀌게 된다. 이를 해결하기 위해 tree 기반에 이상 탐지 기법인 isolation forest을 이용한다.
두 번째로 정상과 이상에 대한 판별 값이 없기 때문에 이를 규정할 수 있는 정보를 계층적 밀도기반 군집화(HDBSCAN)을 통해 정보를 도출한다. 이 과정에서 공정이 시작되고 끝날 때 반복적인 주기 패턴 형성하게 되고 이러한 패턴을 이용한다. 정상과 이상을 구분하는 방법은 일반적으로 정상 데이터가 이상 데이터에 비해서 많은 부분을 활용하고 정상과 이상 패턴 간의 차이를 통해 이상유형에 대해서 지정한다.
세 번째로 다음 공정에서 생성된 패턴을 예측하기 위한 분류 모델을 구성한다. 사전에 군집 데이터의 데이터를 성능이 좋은 잔차 신경망 네트워크 모델(deep reisidual network)에 학습하여 다음 공정이 시작되었을 시 패턴에 대해서 예측하도록 한다.
실제 LCD 공정 설비 데이터를 이용하여 이상점을 확인하고 계층적 밀도기반 군집을 통하여 공정 구간 패턴에 사전 오류 정보가 없을 때, 제시된 데이터에서 이상 탐지 및 분류 기법을 통하여 이상 패턴에 대한 전문가 판단의 비용을 줄여 실제 생산 공정에 적용 가능함을 확인하였다.
Alternative Abstract
Research on abnormality detection and classification in semiconductor and LCD processes is actively underway, and detection of anomalies suitable for process conditions is particularly important and is being studied intensively.
Among them, in the case of anomaly detection of data forming a repetitive pattern in a process step, it is difficult to detect anomaly with general anomaly detection, and an anomaly detection technique suitable for the characteristics of the process should be provided.
Therefore, by using the equipment data of a specific LCD process, a periodic signal is used and a solution to the above problems is presented for the process of forming a pattern, and an analysis of anomalies and a process in which the normal and abnormal criteria are not clear We present and verify a methodology to detect anomalies for.
First, an outlier detection technique is applied to compensate for the shortcomings in the upper management limit. When an abnormality is detected as the upper management limit, the upper management limit is limited according to the data distribution, and the abnormality detection result changes greatly depending on the range of the threshold. To solve this, we use isolation forest, which is a tree-based anomaly detection technique.
Second, since there is no discrimination value for normal or abnormal, information that can be defined is derived through hierarchical density-based clustering (HDBSCAN). In this process, a repetitive periodic pattern is formed at the beginning and end of the process, and this pattern is used. As for the method of distinguishing between normal and abnormal, in general, normal data utilizes more parts than abnormal data, and abnormal types are designated through the difference between normal and abnormal patterns.
Third, a classification model is constructed to predict the pattern generated in the next process. In advance, the data of the cluster data is learned in a deep residual network model with good performance, and the pattern is predicted at the start of the next process.
When anomalies are identified using actual LCD process equipment data and there is no prior error information in the process section pattern through hierarchical density-based clustering, the cost of expert judgment on anomaly patterns through anomaly detection and classification techniques in the presented data It was confirmed that it can be applied to the actual production process.