복합 질환과 관련된 SNP 데이터에서 질병에 영향을 주는 SNP을 찾아내는 방법은 회귀분석, 신경망, MDR과 같은 다양한 방법이 존재한다. 그러나, 대량의 SNP을 분석해야 하는 경우에는 계산시간이 매우 오래 걸려 데이터를 분석할 수 없는 문제점이 있다. 그러므로 전처리 과정을 거쳐 중요 SNP을 선정하고 이 선정된 SNP을 이용하여 분석을 하는 이 단계 접근이 유용하다. 본 논문에서는 전처리 단계로 의사결정규칙을 이용하여 중요 SNP을 선정하고, 이 선정된 SNP에 SVM을 사용하여 예측 모델을 구성하는 방법을 제안한다. 대표적인 복합 질환인 천식에 대한 SNP 데이터를 이용하여 제안된 방법을 실험하였으며, 전체 SNP 중 일부 SNP만을 사용해도 정확도, 정확률, 재현율 면에서 동등하거나 더 우수한 성능을 나타내는 것을 보였다.
Alternative Abstract
Complex diseases are affected by genetic information such as SNPs. So far, many classification methods which are finding SNPs associated with complex diseases have developed, but as the size of SNPs grows, the complexity of computation grows exponentially also. Therefore two-stage approach is useful method to analyze large number of SNPs. In this study, we find that decision rules could be useful preprocessor. We also evaluated the suggested method using SVM and asthma data. In our results, a half or less number of SNPs could be same or more efficiency comparing to whole number of SNPs.