수혈을 요구하는 출혈은 혈액량의 손실을 함께 동반하며 주요 조직과 장기에 저관류와 관련된 손상을 일으키고, 의식 저하 및 사망으로 이어질 수 있는 심각한 임상 사건이다. 특히 중환자실에서 출혈이 발생한 환자는 사망 위험이 더 높고 재원기간이 길다. 중증도가 높은 환자에게 치명적인 출혈은 비가역적인 결과를 초래할 수 있으며 이를 예방하기 위해 적시에 출혈을 확인하고 치료하는 것이 필요하다.
최근에는 많은 병원에 전자 의무기록 인프라가 구축되어 있고, 이러한 기반은 병원에서 생성되는 대량의 임상 데이터의 수집 및 관리를 용이하게 하고 다양한 이차적인 분석이 가능한 환경을 제공하였다. 중환자실은 중증도가 높은 환자를 집중관리하는 파트로 병원 내에서 가장 많은 의료 자원이 투입되고 그만큼 많은 양의 데이터가 생성된다. 여기에 머신러닝 기술을 적용하면 방대한 양의 데이터를 사람보다 빠른 속도로 처리하여 대량의 데이터로부터 학습한 예측 결과를 도출할 수 있다.
본 연구의 목표는 실제 중환자실 임상 데이터를 활용하여 연속적으로 변화하는 환자 데이터의 패턴을 학습하는 출혈 예측 모델을 개발하는 것이다. 이를 통해 중환자실에서 출혈이 발생할 고위험군을 미리 식별하고 선제적인 대응을 할 수 있도록 하여 환자 안전을 더욱 높이고, 혈액 공급 관리의 효율성을 확보할 것으로 기대한다.
미국 보스턴에 있는 3차 의료기관의 실제 중환자실 입실을 포함하는 오픈 관계형 데이터베이스인 MIMIC(Medical Information Mart for Intensive Care)을 사용하였다. 과거 데이터인 MIMIC-III로 훈련하고 그 이후에 수집된 MIMIC-IV로 내부 검증을 하였다. 출혈 발생 여부에 따라 대상자들을 라벨링하고 출혈 발생 이전 12시간의 환자 데이터를 순차적인 입력의 형태로 넣어 출혈 발생 3시간 이전에 예측 결과가 도출되도록 순환 신경망 모델을 구축하였다. 입력 변수의 수를 늘려가면서 복잡성 수준이 증가하는 3개의 모델을 개발하고 성능을 비교하였다. 또한 가장 성능이 높은 모델을 기반으로 eICU(eICU Collaborative Research Database) 데이터베이스에서 추출한 하위 집단의 데이터로 외부 검증을 수행하였다.
MIMIC-III 데이터셋에서 총 3150건의 중환자실 입실(630건 출혈 발생, 2,520건 출혈 발생 안함) 이 훈련에 사용되었고, MIMIC-IV의 2,520건의 중환자실 입실(504건 출혈 발생, 2,016건 출혈 발생 안함)이 평가되었다. 모델 1은 기본적인 환자 정보와 활력 징후를 포함한 12개의 변수, 모델 2는 환자 의식사정과 일반 혈액 검사 항목을 추가한 19개의 변수, 모델 3에는 추출한 변수를 모두 포함하여 총 28개의 변수를 사용하였다. 가장 많은 입력 변수를 사용한 모델 3에서 가장 높은 성능을 보였다. 모델 3의 결과는 0.91의 AUROC, 0.68의 정밀도, 0.78의 민감도를 달성하였다. eICU 데이터베이스에서 수행한 외부 검증 성능은 0.73의 AUROC 결과를 보였다.
본 연구에서는 중환자실 환자 임상 데이터를 학습하여 출혈 발생을 예측하는 모델을 구축하고, 이를 검증하였으며 입력 변수의 수가 증가하면서 성능이 향상되는 결과를 확인하였다. 광범위한 중증 환자를 대상으로 출혈 고위험에 해당하는 환자를 조기에 식별할 수 있었고, 이를 통해 심각한 출혈이 발생할 환자에게 미리 의료진이 주의를 기울일 수 있도록 의료자원 분배를 효율화에 기여할 수 있을 것이다.
Alternative Abstract
Hemorrhage with blood loss requiring transfusion is a serious clinical event that causes hypoperfusion-related damage to major tissues and organs, and could lead to coma and death. In particular, patients who had bleeding in ICU(Intensive Care Unit) have a higher risk of mortality and morbidities. Ealry detection of hemorrhage enables timely intervention and could reduce the risk of irreversible outcomes.
Recently, EMR(Electronic Medical Record) systems have been established in many hospitals, which facilitated management of clinical big data generated in hospitals and secondary analyses. Machine learning and artificial intelligence are especially useful in departments where signals and data are generated at a faster rate than the medical provider can interpret. Intensive care unit is allocated most medical resources and generates massive amounts of data, and is therefore an optimal target for applying machine learning techniques for supporting clinical decision making. The goal of this study is to develop a machine learning model for prediction of hemorrhage that learns the patterns of continuously changing patient data using real-world clinical data.
In this retrospective study, we used data from the MIMIC-III & IV(Medical Information Mart for Intensive Care) which was a relational database containing real hospital stays for patients admitted to a tertiary medical center in Boston, MA, USA. We used recurrent neural network methods to predict severe hemorrhage in ICU. We developed three deep neural network models that increase the number of input features and increase the level of complexity. MIMIC-III dataset was used for model training and MIMIC-IV dataset was splited for internal validation. In addition, based on the model with the highest performance, external verification was performed with data of a subgroup extracted from the eICU(eICU Collaborative Research Database) database.
We included unique 5,670 intensive care admissions, with 3,150 in the training set and 2,520 in the internal test set. The AUROC for the test set was 0.69 for model 1, 0.84 for model 2, and 0.91 for model 3. We showed that there is a positive correlation between model complexity and performance. In the subgroup of the eICU database, external validation performance was observed as 0.73 AUROC.
In this study, we developed prediction models for hemorrhage, based on deep neural networks and demonstrated that high risk groups for bleeding can be reliably identified in intensive care unit. It will be encouraging for improvement in critical care settings to direct the medical provider's attention towards patients at risk of adverse events. Our findings indicate that machine learning models using real clinical data were supportive for patient monitoring.