최근 딥러닝 기반의 컴퓨터 비전 기법들이 여러 분야에서 좋은 성능을 보여줌에 따라 비디오 이상탐지와 관련된 딥러닝 기반의 이상탐지 연구가 활발히 진행되고 있다.
본 연구에서는 시계열 데이터에 특화된 기존의 LSTM 기법이 반영할 수 없었던 비디오 시퀀스의 공간적 정보를 반영하는 convolutional LSTM기반의 딥러닝 이상탐지 기법을 제안한다. 이 이상탐지 모델은 비디오에서 발생할 수 있는 이상상황에 대한 효율적인 분석을 위하여 인접한 두 프레임의 옵티컬 플로우를 이용한 주의집중 블록을 사용하고 있으며 학습과정에서 잔차 학습을 이용하여 학습의 수렴속도 및 성능을 향상시킨다.
우리가 제시한 모델은 여러 비디오 이상탐지와 관련된 데이터셋에 대하여 학습과 테스트가 진행되었으며 Avenue, Subway_Exit 데이터셋에 대해서 사전 논문들에 비하여 최고 성능을 보이는 것을 보였다. 또한 비디오 이상탐지의 성능 향상을 위해 설계한 주의집중 블록 및 잔차 학습의 효율성을 실험을 통해 입증하였다.