LDA를 이용한 얼굴 인식에서 발생하는 small sample size 문제를 해결하기 위해서 regularization method를 주로 사용한다. 이 방법을 사용하게 되면 클래스 내 분산행렬의 특이성을 없앨 수 있지만, 클래스 내 분산행렬과 단위행렬에 를 곱한 값을 더하는 과정에서 의 값을 임의적으로 정해주어야 되고 이 값에 따라 인식률이 개선되지 않을 수 있다는 문제점이 발생한다.
Resampling 개념을 이용하여 학습 데이터의 수를 늘리게 되면 regularization method 보다 개선된 인식률을 얻을 수 있다. 또한 경험적으로 값을 정해 주어야 하고, 값에 따라 인식률의 변동이 생길 수 있는 단점이 개선되는 효과를 얻을 수 있다. 주어진 얼굴 영상의 데이터가 n 장 존재하고 각 영상이 m 픽셀로 구성되어 있다고 했을 때, n 장의 얼굴 영상을 resampling 방법을 통해 수를 늘리게 되면 n은 증가하고, m이 줄어드는 결과를 낳게 된다. 이러한 방식을 사용하게 되면 입력 샘플의 차원이 입력 샘플의 수보다 크게 되어 발생하는 small sample size문제가 해결될 수 있다.
이는 resampling 과정을 통해 원 영상과는 동일하지는 않지만 유사한 영상들이 만들어 지게 되고 따라서 클래스내 분산 행렬의 특이성을 없애주는 효과를 얻을 수 있다. 이러한 방법으로 특이성을 없애주게 되면, 무작위로 발생한 랜덤 노이즈를 더해 주는 과정을 통해 클래스내 분산 행렬의 특이성을 없애주는 regularization method에 비해 향상된 인식률을 얻을 수 있다. Regularization method는 행렬의 대각성분만을 고려하여 특이성을 없애주게 되지만, resampling방법은 행렬의 대각성분 뿐 아니라 그 외의 행렬 성분을 고려하여 특이성을 없애주는 방법이기 때문이다.
Alternative Abstract
In many face recognition problems, the number of available images is limited compared to the dimension of the input space which is usually equal to the number of pixels. This problem is called as the ‘small sample size’ problem and regularization methods are typically used to solve this problem in feature extraction methods such as LDA.
By using regularization methods, the modified within class matrix becomes nonsingular and LDA can be performed in its original form. However, in the process of adding a scaled version of the identity matrix to the original within scatter matrix, the scale factor should be set heuristically and the performance of the recognition system depends on highly the value of scalar factor.
By using the proposed resampling method, we can generate a set of images similar to but slightly different from the original image. With the increased number of images, the small sample size problem is alleviated and the classification performance increases. Unlike regularization method, the resampling method does not suffer from the heuristic setting of the parameter producing better performance.