자기주의 기반 BiLSTM CNN 모델을 이용한 허혈성 및 비허혈성 심근병증 예측
초록
본 연구는 조직병리학 이미지에서 허혈성 심근병증과 비허혈성 심근병증을 구분하기 위해 Inception‑V3 기반 CNN과 양방향 LSTM(BiLSTM)을 결합하고, BiLSTM의 은닉 상태에 자기주의(self‑attention) 메커니즘을 적용한 통합 모델을 제안한다. 제안 모델은 특징 추출 단계에서 CNN이 이미지의 공간적 패턴을 학습하고, 시퀀스 모델링 단계에서 BiLSTM이 시간적(또는 순차적) 의존성을 포착한다. 자기주의는 BiLSTM 출력 중 중요한 시점에 가중치를 부여해 정보 손실을 최소화한다. 실험 결과, 기존 CNN‑LSTM 혹은 단일 CNN 대비 정확도·민감도·특이도가 현저히 향상되어 심부전 원인 진단 보조 도구로서의 가능성을 확인하였다.
상세 분석
제안된 아키텍처는 크게 세 부분으로 구성된다. 첫 번째는 사전학습된 Inception‑V3 모델을 활용한 이미지 특징 추출 단계이다. Inception‑V3는 다중 스케일 필터와 효율적인 파라미터 공유 구조를 통해 복잡한 조직학적 패턴을 고해상도 특징 맵으로 변환한다. 여기서 얻어진 특징 맵은 2차원 형태이지만, 이후 BiLSTM에 입력하기 위해 1차원 시퀀스로 재구성된다. 두 번째 단계는 양방향 LSTM이다. BiLSTM은 순방향과 역방향 두 개의 LSTM 셀을 병렬로 운영함으로써, 현재 시점뿐 아니라 앞뒤 모든 시점의 정보를 동시에 고려한다. 이는 조직학 이미지에서 세포 배열, 섬유화 정도, 혈관 분포 등 비대칭적인 구조적 정보를 포착하는 데 유리하다. 세 번째이자 핵심인 자기주의 메커니즘은 BiLSTM 출력 시퀀스에 가중치 행렬을 학습시켜, 각 타임스텝이 전체 시퀀스에서 차지하는 중요도를 동적으로 평가한다. 구체적으로, Query‑Key‑Value 방식을 차용해 각 은닉 상태 간의 유사도를 계산하고, Softmax 정규화를 통해 가중치를 부여한다. 이렇게 얻어진 가중합은 최종 분류기(fully‑connected 레이어)로 전달되어 허혈성·비허혈성 두 클래스로 예측한다.
모델 학습 과정에서는 교차 엔트로피 손실과 Adam 옵티마이저를 사용했으며, 클래스 불균형을 완화하기 위해 가중치가 부여된 손실 함수를 적용하였다. 또한, 데이터 증강(회전, 확대, 색상 변형)으로 학습 데이터의 다양성을 확보하고, 과적합 방지를 위해 Dropout과 Early‑Stopping을 도입했다. 실험 결과, 제안 모델은 정확도 94.2%, 민감도 93.5%, 특이도 95.0%를 기록했으며, 기존 CNN‑LSTM(≈88%) 및 단일 Inception‑V3(≈81%) 대비 성능이 크게 향상되었다. 특히, 자기주의가 적용된 BiLSTM은 중요한 조직학적 특징(예: 섬유화 영역, 혈관 폐색 부위)에 높은 가중치를 할당함을 시각화 결과를 통해 확인할 수 있었다. 이는 모델이 인간 병리학자의 판단 근거와 유사한 방식으로 정보를 선택한다는 점에서 임상 적용 가능성을 높인다. 전체적으로 본 연구는 고해상도 조직학 이미지에서 시공간적 패턴을 효과적으로 통합하고, 중요한 영역에 집중하는 자기주의 메커니즘을 통해 심근병증 유형을 정밀히 구분하는 새로운 패러다임을 제시한다.
댓글 및 학술 토론
Loading comments...
의견 남기기