사이버 공격은 DDoS, 홈페이지 위·변조, 악성코드 유포 공격 등 다양하게 이루어지고 있다. 그 중 악성코드 유포 공격은 집단 규모가 커지고 점차 조직화 되고 있으며 PC, 스마트폰 등에 대한 사이버 공격 피해 사례가 늘어나고 있다. 또한, 악성코드 유포 속도에 비해 탐지 속도가 뒤처지고 있어 효과적인 대응이 이루어지지 못하는 실정이다. 이에 따라 다양한 분야에서 악성코드 탐지를 위한 딥러닝 및 머신러닝 기법을 이용한 연구가 활발히 진행되고 있다. 그 중 CNN(Convolutional Neural Network)를 이용한 악성코드 분류의 정확도는 기존의 분류방법보다 정확도가 높은 것을 알 수 있다.
본 논문에서는 수집한 악성코드를 대상으로 CNN을 이용하여 바이트 코드 전체를 입력데이터로 하는 방법과 중요 섹션만을 추출하여 입력데이터로 사용한 방법을 실험을 통해 비교한 결과 중요 섹션만을 추출한 유형 분류의 정확도가 더 향상된 것을 확인하였다.