최근 다양한 뉴럴 네트워크 응용프로그램을 사물인터넷과 같은 자원제약이 심한 임베디드 시스템에서 직접 동작시키려는 시도가 증가하고 있다. 하지만 임베디드 시스템은 연산 속도와 메모리가 매우 제한적이기 때문에 동작시킬 수 있는 뉴럴 네트워크 모델의 크기가 제약되고 실시간성을 만족하지 못 할 수 있다. 이를 위해 본 학위 논문에서는 주어진 뉴럴 네트워크 모델을 메모리와 수행시간 요구사항을 만족 할 수 있도록 자동으로 경량화하고 타겟 내장형 시스템에서 수행 가능한 코드를 자동으로 생성하는 프레임워크를 제안한다. 그 후 다수의 디바이스를 활용하여 고성능의 뉴럴 네트워크를 구동시키는 분산 뉴럴 네트워크에 대해 소개하고 통신 실패에 강인하고 통신량이 적은 분산 알고리즘을 제안한다. 제안하는 자동 경량화 프레임워크를 활용하여, 다양한 수행시간과 메모리 요구사항을 만족할 수 있도록 뉴럴 네트워크 모델을 실제 임베디드 시스템에 맞게 경량화 하였다. 또한 초해상도 이미지 복원과 객체 탐지와 같은 회귀 모델에서도 최적화를 적용하여 다양한 뉴럴 네트워크 어플리케이션에서 최적화가 효과적임을 검증하였다.