전 세계적으로 도시지역에서 교통 혼잡이 일상이 되었으며, 교통 혼잡으로 인한 사회적 비용은 매년 증가하고 있는 추세이다. 특히 교통 혼잡의 원인으로 차량의 증가와 신호 운영 효율로 볼 수 있으며, 현재 도시부에서는 도로 건설 등 인프라 확보를 통해 도로 용량을 증대하기 어려운 상황이다. 이를 해결하기 위해서는 최근 전 세계적으로 주목 받고 있는 인공지능(Artificial Intelligence, AI) 기술을 이용하여 해결책을 모색하는 방법이 있다. 본 연구에서는 AI 기술인 강화학습을 이용하여 교통신호 제어 모형을 개발하였다. 교통신호 제어 모형은 독립교차로 교통신호 제어 모형과 연동교차로 교통신호 제어 모형 두 가지를 개발하였다. 독립교차로 교통신호 제어 모형은 교통상황에 대응하는 신호시간계획을 제공하도록 개발하였으며, 연동교차로 교통신호 제어 모형은 교통상황에 대응하는 옵셋(offset)을 제공하도록 개발하였다. 교통신호 제어 모형을 개발하기 위해 강화학습 알고리즘 중 우수한 성능을 지닌 DQN(Deep Q Network)를 이용하였으며, 환경과 상호작용할 수 있는 상황을 구현하기 위해 미시교통시뮬레이션 모형인 Vissim을 시뮬레이션 환경 프레임워크로 구축하고 DQN과 연동하여 학습하였다. 학습된 모형을 평가하기 위해 Synchro 모형을 이용하여 최적 신호시간계획과 최적 옵셋을 산출하여 구축된 시나리오에서 평가 및 검증하였다. 평가 결과, 독립교차로에서는 Synchro를 이용하여 최적화된 신호시간계획의 성능보다 우수한 결과를 내었다. 연동교차로에서도 Synchro를 이용하여 최적화된 옵셋의 결과보다 우수한 성능을 내는 것으로 나타났다. 하지만 다양한 도로 환경 및 교통 환경을 고려하지 못한 한계와 교통 감응신호 및 COSMOS 등 실시간 교통신호 제어 시스템과의 성능 비교 및 평가 등이 수행되지 못한 점 등이 존재하므로 추가적 연구가 필요한 부분은 향후 연구과제로 제시하였다.