웨어러블 기반 건강 모니터링을 위한 내재적 해석 가능 구성 요소 기반 XAI
초록
본 논문은 착용형 센서에서 수집된 시계열 데이터를 대상으로, 모델 성능을 유지하면서도 직관적인 설명을 제공하는 새로운 XAI 프레임워크를 제안한다. 핵심 아이디어는 ‘내재적 해석 가능 구성 요소(IIC)’라는 도메인‑특화 개념을 설명 공간에 직접 매핑하고, 가중치 최적화를 통해 불필요한 구성 요소를 제거함으로써 로컬·글로벌 설명을 생성하는 것이다. 저자들은 자율신경계(ANS) 모니터링을 위한 IIC 집합을 정의하고, 실제 웨어러블 데이터(상태 평가 및 간질 발작 탐지)에서 LSTM·Transformer 모델에 적용해 성능 저하 없이 해석 가능성을 입증하였다.
상세 분석
이 연구는 시계열 기반 의료 AI에서 설명 가능성의 두 가지 주요 난제—시간적 의존성으로 인한 해석의 복잡성 및 설명을 위한 특징 선택이 모델 성능을 저하시킬 위험—를 동시에 해결하려는 시도로 평가할 수 있다. 기존의 saliency 기반 방법은 입력 시점별 중요도를 부여하지만, 시계열 데이터에서는 중요한 패턴이 특정 시점에 국한되지 않고 주파수·주기·통계적 특성 등 복합적인 형태로 나타난다. 반면, 개념 기반 XAI는 인간이 이해하기 쉬운 고수준 개념을 활용하지만, 사전 정의된 개념 라벨이 필요하고, 개념을 모델에 강제 삽입하면 원시 시계열의 풍부한 정보를 충분히 활용하지 못해 정확도가 떨어진다.
논문은 이러한 한계를 극복하기 위해 ‘설명 공간(Explanation Space)’ 개념을 확장한다. 먼저, 가역 변환 F와 그 역변환 F⁻¹을 정의하여 원시 시계열 x를 d개의 해석 가능한 구성 요소 Cₓ={cₓ,₁,…,cₓ,₈} 로 분해한다. 여기서 각 구성 요소는 도메인 전문가가 직관적으로 이해할 수 있는 ANS 관련 지표(예: 심박 변동성, 호흡‑심박 동조, 피부 전도도 등)로 설계되었다. 중요한 점은 F가 가역적이므로, Cₓ에 가중치 w를 적용한 후 F⁻¹(Cₓ·w) 로 재구성된 신호 x′가 원본 모델 M에 그대로 입력될 수 있다는 것이다. 따라서 모델을 재학습할 필요 없이 기존 블랙박스 M을 그대로 활용한다.
가중치 최적화는 두 개의 손실 함수를 결합한다. 첫 번째 L_weights는 전체 가중치의 평균을 최소화해 가능한 한 많은 구성 요소를 ‘제거’하도록 유도한다. 두 번째 L_degradation은 재구성된 신호 x′가 원본 출력 M(x)와 크게 차이나지 않도록 제한한다. 구체적으로, 출력 차이(degradation)=|M(F⁻¹(Cₓ·w))−M(x)| 가 사전에 정의된 허용 오차 max_deg 를 초과하면 패널티 p가 부과된다. 이 두 손실을 동시에 최소화함으로써, 모델 예측에 실질적으로 기여하지 않는 구성 요소는 w_i≈0 로 수렴하고, 중요한 구성 요소만 w_i>0 로 남는다.
또한 데이터 분포와의 불일치를 방지하기 위해 평균 기반 ‘베이스라인(b)’ 구성 요소를 도입한다. b는 모든 샘플에 대해 동일하게 유지되며, 최적화 과정에서 가중치가 할당되지 않는다. 이는 완전한 제로 신호가 모델에 입력되는 상황을 방지하고, 실제 센서 데이터의 통계적 특성을 보존한다.
실험에서는 두 개의 공개 웨어러블 데이터셋을 사용하였다. 첫 번째는 다양한 일상 상태(휴식, 활동, 스트레스 등)를 라벨링한 멀티모달 ANS 데이터이며, 두 번째는 간질 환자의 발작 전후 데이터를 포함한 고해상도 ECG·EDA·가속도계 신호이다. 각각 LSTM과 Transformer 기반 모델에 IIC‑확장 파이프라인을 적용했으며, 주요 성능 지표(AUC, F1)에서 기존 모델과 차이가 없음을 확인했다. 동시에, 도출된 가중치 벡터를 통해 각 상태·발작에 기여하는 주요 ANS 지표를 명확히 제시함으로써, 임상의가 모델 결정을 검증하고 치료 전략을 보완할 수 있는 근거를 제공한다.
이 방법의 장점은 (1) 모델 재학습 없이 기존 블랙박스에 적용 가능, (2) 설명 공간이 도메인 전문가에게 직관적이며, (3) 로컬 설명을 쉽게 전역(코호트 수준) 규칙으로 집계할 수 있다는 점이다. 한계로는 IIC 설계에 도메인 지식이 필요하고, 복잡한 비선형 상호작용을 완전히 포착하기 위해서는 구성 요소 수를 적절히 조절해야 한다는 점이 있다. 향후 연구에서는 자동화된 IIC 추출 및 다중 센서 융합을 통한 설명 공간 확장이 기대된다.
댓글 및 학술 토론
Loading comments...
의견 남기기