최근 몇 년 동안 차세대 염기서열 분석(NGS)기술의 급속한 발전으로 여러 복잡한 생물학적 시스템에 있어 많은 통찰력을 제공해 주었다. 특히 암의 연구에서 유전체학, 전사체학, 후성유전체학 등의 연구는 세포의 상태 변화로 인한 종양으로의 발전 기전에 대한 중요한 단서를 제공하였다. 그럼에도 불구하고 악성 종양 조직 내의 세포 이질성은 암 치료 및 연구에서 주요한 제한 요소로 작용한다. 이러한 한계를 극복하기 위한 단일 세포 RNA-시퀀싱(single cell RNA sequencing)의 등장은 특정 조직의 세포 단위로 시퀀싱을 진행하는 혁신적인 기술로 조직 내의 이질성뿐만 아니라 현재까지 밝혀지지 않은 새로운 세포 유형의 식별이나 정상 세포와 암세포 사이의 유전적 차이 프로파일링을 통하여 보다 정교하고 정확한 진단 및 치료의 가능성을 확인할 수 있게 하였다. 최근 단일 세포 RNA-시퀀싱을 통한 다양한 연구들이 활발히 진행되고 있다.
본 연구에서는 간암 환자로부터 생성된 단일 세포 RNA-시퀀싱을 하여 생산된 데이터를 이용하여 전반적인 분석을 진행하였다. 55명의 간암 환자로부터 얻은 184,068개 세포에 대한 전사체 데이터로부터 데이터 품질관리, 정규화, 배치 편향 제거, 차원 축소, 군집화 및 세포 유형 분류를 진행하였으며, 이를 통해 단일 세포 RNA-시퀀싱 데이터의 전반적인 분석 과정과 결과를 제시하였다.
결과적으로, 본 연구를 통해 제시된 전체적인 분석은 단일 세포 RNA-시퀀싱 데이터 분석의 각 핵심단계로써, 세포 유형간 상호작용 및 궤도 분석 등의 후속 분석에서 질적으로 향상된 경과 및 해석을 산출할 수 있을 것으로 기대할 수 있다.
Alternative Abstract
The rapid development of next-generation sequencing (NGS) technologies in
recent years has provided many insights in several complex biological systems. In
particular, studies such as genomics, transcriptomics, and epigenomics in the study
of cancer have provided important clues about the mechanism of development into
tumors due to changes in cell state. Nevertheless, cell heterogeneity within
malignant tumor tissue acts as a major limiting factor in cancer treatment and
research. The advent of single-cell RNA-seq to overcome these limitations has
allowed for more sophisticated and accurate diagnosis and treatment through
identification of new cell types or genetic differences between normal and cancer
cells. Recently, various studies have been actively conducted through single-cell
RNA-seq. However, to date, the development of standardized analytical pipelines
of quality control, data preprocessing, and normalization of data is insufficient.
In this study, sought to build an analytical pipeline using each single-cell RNAseq data by performing single-cell RNA-seq generated from liver cancer patients.
We conducted data quality control, normalization, batch effect correction,
dimension reduction, clustering, and cell type classification from 184,068 cells
obtained from 55 liver cancer patients, present an overall analysis method for
single-cell RNA-seq data processing. The pipeline presented in this work is a key
step in the analysis of single-cell transcriptome data, is expected to yield
qualitatively improved progress and interpretation in subsequent analyses such as
intercellular interactions and trajectory analysis.