C.elegans에서 RNAi에 의한 유전자 조절의 예측을 위한 생물정보학적 접근

A Bioinformatic Approach for the Prediction of Gene Regulation by RNAi in C.elegans
일반대학원 분자과학기술학과
The Graduate School, Ajou University
RNAi는 in vivo에서 유전자 발현조절에 관한 매우 중요한 원리이다. 유전자발현을 위해 siRNA는 in vitro에서 화학적으로 합성되거나 생성된다. 따라서, in vivo시스템에서 RNAi에 의한 유전자 발현 조절이 얼마나 많은 유전자에서 일어나는지, 어떤 유전자에서 주로 일어나는지에 대한 사실은 아직 알려져 있지 않다. 우리가 구축한 리눅스 클러스터 시스템인 “CAMELLEON”은 100Mbps속도의 Fast-Ethernet으로 연결되어 있고 유전자 수준에서 siRNA에 의한 유전자 발현 조절을 검색하는데 최적화 되어 있다. 시스템은 Caenorhabditis elegans에서 알려진 EST(Expres- sed Sequence Taqs)와 dsRNA유전자간의 대량의 서열정렬을 하기 위해 리눅스 기반의 고성능 ClustalW-MPI프로그램을 설치하였다. C.elegans의 EST와 dsRNA유전자 서열간의 서열정렬 결과 전체 9.0x10^(7)개 쌍 가운데 0.15%만이 100%의 상동성을 나타냈고, 3.3%인 6308개의 쌍이 mRNA의 번역기능을 상실시킬 수 있는 80%이상의 상동성을 나타냈다. 이것은 in vivo에서 siRNA에 의한 유전자 발현 조절현상의 거의 드물게 나타날 수 있다는 것을 나타내고, siRNA에 의한 유전자 발현 조절현상은 주로 structural molecular activity와 binding 기능을 가진 유전자에서 일어난다.
RNAi is central mechanism for the regulation of gene expression in vivo. To regulate the gene expression, siRNA have been chemically synthesized and created in vitro. However, it has been unknown how many genes and what kinds of genes are regulated by RNAi in vivo. We constructed linux cluster system named “CAMELLEON” by adapting Fast-Ethernet(100Mbps) network to be powerful to search the potential gene regulation by siRNA on the genome scale. The machine was applied to a Linuxbased high performance ClustalW-MPI which aligns huge sequences of Caenorhabditis elegans EST (Expressed Sequence Taqs) and dsRNA genes. Our pair-alignment results showed that only few pairs (0.15%) out of 9.0x10^(7) pairs of C.elegans EST and dsRNA gene sequences have the potential to be subject to gene regulation by RNAi. In C.elegans about 6308 ESTs(3.3%) were matched with dsRNA, indicating relatively small fractions of proteins are regulated by siRNA in vivo. and the proteins regulated by siRNA were mainly involved in structural molecular activity and binding function. Finally the implemented system was powerful to perform the complicated, huge calculation demanding bioinformatic process.

