최근 몇 년 동안 다양한 산업에서 지속적으로 데이터 유출이 발생되고 있으며, 기업 내 데이터 유출 사고가 일어날 경우 금전적 피해와 신뢰도 하락, 기억의 이미지 실추 등 막대한 피해를 입을 수 있다. 특히, 내부자는 기업의 정보나 시스템에 접근 가능한 방법 및 권한을 가지고 있기 때문에 악의적인 목적을 가지게 될 경우 심각한 위협이 될 수 있다. 따라서 머신러닝을 이용한 내부자 데이터 유출 징후 탐지 방법에 대한 연구가 활발히 진행되고 있으나, 다양한 탐지 지표를 활용하는 연구가 미비했다.
본 논문에서는 데이터 유출 징후 탐지에 적합한 알고리즘인 LSTM Autoencoder를 통해 구현한 탐지모델에 내부자의 직급과 5가지 성격 특성 요소를 탐지 지표로 적용한 내부자에 의한 데이터 유출 징후 탐지 모델을 제안하여 내부자에 의한 데이터 유출 징후를 효과적으로 탐지하고자 한다.
실험 결과 내부자의 직급과 5가지 성격 특성 요소를 패널티로 적용하여 내부자의 데이터 유출 징후를 탐지하였을 때 탐지율 측면에서 약 6% 향상되었으나, 정밀도 부분에서 약16% 하락하였다.
향후 연구로 기업별 파일의 중요도, 내부자가 어떤 웹사이트에 접속하여 어떤 행위를 하는지에 대한 데이터 등 탐지 지표를 더욱 구체화하여 더 높은 성능을 나타내는 모델과 패널티 적용에 의한 정밀도 하락을 방지할 수 있는 방법을 연구할 계획이다.