임상 시계열 결측 데이터 모델링: RNN 기반 접근법
본 논문은 소아 중환자실에서 수집된 다변량 임상 시계열 데이터를 대상으로, 결측값을 단순히 보간하는 대신 결측 패턴 자체를 특징으로 활용하는 방법을 제안한다. 이진 결측 지표를 RNN에 입력함으로써 기존 임퓨테이션 방식보다 진단 예측 성능을 크게 향상시켰으며, 선형 모델에서도 손쉽게 적용 가능한 손수 만든 결측 특성을 설계하였다.
저자: Zachary C. Lipton, David C. Kale, R
본 논문은 소아 중환자실(PICU)에서 수집된 10,401개의 환자 에피소드를 대상으로, 다변량 임상 시계열 데이터의 결측 문제를 새로운 방식으로 해결하고자 한다. 기존 연구에서는 결측값을 평균, 선형 보간, 혹은 복잡한 베이지안 모델 등으로 채워 넣는 것이 일반적이었다. 그러나 임상 현장에서 측정이 이루어지는 빈도와 시점은 환자 상태와 의료진의 판단에 크게 좌우되며, 따라서 결측 자체가 중요한 정보를 담고 있다는 점을 저자들은 강조한다.
데이터는 13개의 주요 변수(혈압, 심박수, 호흡수, 체온, 혈당, pH 등)로 구성되며, 1시간 간격으로 이산화하였다. 이 과정에서 측정이 이루어지지 않은 시점은 ‘결측’으로 표시되며, 변수마다 측정 빈도가 크게 다르다(예: 심박수는 매시간, 혈당은 하루에 한 번 정도). 결측을 처리하기 위해 두 가지 기본 임퓨테이션 방식을 사용한다. 첫 번째는 ‘제로-필링’으로, 결측값을 0으로 대체한다. 두 번째는 ‘포워드-필링’으로, 이전에 관측된 값이 있으면 그 값을 그대로 복사하고, 전혀 관측되지 않은 경우에는 전체 훈련 데이터의 중앙값으로 대체한다.
핵심 아이디어는 이진 결측 마스크(m(t)_i)를 각 변수에 대해 추가 입력 피처로 활용하는 것이다. 마스크는 해당 시점에 값이 실제 측정되었는지(0) 혹은 임퓨테이션된 값인지(1)를 나타낸다. LSTM 기반 RNN은 이러한 마스크와 실제 값(또는 임퓨테이션된 값)을 동시에 입력받아, 시계열 내에서 결측 패턴과 측정값 사이의 복합적인 상호작용을 학습한다. 저자들은 LSTM이 비선형 함수를 자유롭게 학습할 수 있기 때문에, 동일한 변수라도 결측 상황에 따라 서로 다른 의미(예: 환자 이동, 급성 악화, 혹은 단순 검사의 연속 수행)를 구분할 수 있음을 실험적으로 확인한다.
반면, 선형 모델(로지스틱 회귀)과 다층 퍼셉트론(MLP)은 마스크 자체만으로는 충분히 복잡한 관계를 포착하기 어렵다. 이를 보완하기 위해 저자들은 결측 마스크의 통계적 요약 8가지를 설계하였다. (1) 변수 전체가 한 번도 측정되지 않았는지 여부, (2) 결측 마스크의 평균(측정 빈도), (3) 표준편차(측정 빈도의 변동성), (4) 인접 시점 간 결측↔측정 전환 횟수, (5) 첫 번째 측정 시점 비율, (6) 마지막 측정 시점 비율, (7) 측정 시작·종료 시점 간 시간 비율, (8) 전체 시계열 길이에 대한 상대적 위치. 이러한 특성은 선형 모델이 비선형 상호작용 없이도 결측 패턴의 전반적인 ‘형태’를 반영하도록 돕는다.
실험은 80% 훈련, 10% 검증, 10% 테스트로 데이터를 분할하고, 동일한 데이터 분할을 모든 모델에 적용하였다. LSTM은 2층, 각 128셀 구조에 비재귀 드롭아웃(0.5)과 L2 정규화(λ=10⁻²)를 적용했으며, 100 epoch 동안 학습 후 검증 손실이 가장 낮은 에포크의 파라미터를 선택했다. 로지스틱 회귀는 L2 정규화, MLP은 3층(각 500노드) ReLU 활성화와 0.5 드롭아웃을 사용하였다. 입력 피처는 (① 원시 시계열 12시간 구간 3개를 연결한 936차원, (② 손수 만든 측정값 요약, (③ 결측 요약) 등)으로 구성했으며, 각각 ‘측정값만’, ‘마스크만’, ‘측정값+마스크’ 조합을 시험했다.
평가 지표는 다중 라벨 문제에 적합한 마이크로·매크로 AUC, F1 스코어, 그리고 환자당 평균 진단 수(2.238)를 고려한 Precision@10을 사용하였다. 결과는 다음과 같다. (1) LSTM에 결측 마스크를 포함했을 때 마이크로 AUC가 0.87, 매크로 AUC가 0.84로, 마스크 없이 단순 임퓨테이션만 사용한 경우보다 각각 약 4~5%p 상승했다. (2) 로지스틱 회귀와 MLP도 마스크 요약 특성을 추가했을 때 AUC가 평균 3~6%p 개선되었다. (3) 특히 ‘마스크만’ 입력으로 학습한 모델이 일부 라벨(예: 감염, 급성 호흡기 질환)에서 전체 모델과 비슷한 수준의 AUC를 기록했으며, 이는 ‘어떤 검사가 시행되었는가’ 자체가 강력한 진단 신호임을 시사한다.
논문은 또한 실무적·윤리적 고려사항을 논의한다. 모델이 결측 패턴에 과도히 의존하면, 실제 임상에서 모델이 제안하는 검사를 기반으로 의료진이 검사를 선택·제외함에 따라 데이터 분포가 변하고, 이는 모델 성능 저하와 피드백 루프 문제를 야기할 수 있다. 따라서 모델 개발 단계에서 이러한 ‘데이터 누수’를 인식하고, 배포 후에는 임상 프로토콜과의 정합성을 지속적으로 모니터링해야 함을 강조한다.
결론적으로, 본 연구는 임상 시계열 데이터에서 결측을 단순히 보정하는 것이 아니라, 결측 자체를 의미 있는 피처로 전환함으로써 딥러닝 및 전통적 머신러닝 모델 모두에서 예측 성능을 크게 향상시킬 수 있음을 실증한다. 이는 조기 위험 예측, 실시간 경보 시스템, 그리고 의료 데이터 자동 전처리 파이프라인 설계에 중요한 시사점을 제공한다.
원본 논문
고화질 논문을 불러오는 중입니다...
댓글 및 학술 토론
Loading comments...
의견 남기기