코사인 마진 시그모이드 손실과 상관주의 맵을 활용한 고성능 유방 MRI 암 진단

본 논문은 유방 MRI 영상에서 종양을 정확히 판별하고 위치를 추정하기 위해, 특성을 초구면에 임베딩하고 코사인 마진을 적용한 Cosine Margin Sigmoid Loss(CMSL)와, 학습된 특징 간 상관관계를 이용해 약한 지도 하에 암 후보 부위를 강조하는 COrrelation Attention Map(COAM)을 제안한다. 10,290개의 DCE‑MRI 스캔으로 구성된 대규모 데이터셋에서 CMSL 기반 3D ResNet34는 정확도 0…

저자: Luyang Luo, Hao Chen, Xi Wang

코사인 마진 시그모이드 손실과 상관주의 맵을 활용한 고성능 유방 MRI 암 진단
본 논문은 유방암 조기 진단에 핵심적인 역할을 하는 동적 대비 강화(DCE) MRI 영상을 대상으로, 종양의 존재 여부를 정확히 판별하고 병변 위치를 정밀히 추정하기 위한 새로운 딥러닝 프레임워크를 제시한다. 연구 배경으로는 유방암 병변이 동일 병리학적 결과(악성·양성)에도 불구하고 영상 상에서 매우 다양한 형태와 텍스처를 보이며, 이는 기존 딥러닝 기반 분류기가 클래스 간 차이를 명확히 학습하기 어렵게 만든다. 또한, 대부분의 기존 방법은 병변 영역을 직접 라벨링하거나, 약한 지도 하에서 클래스 활성 맵(CAM)을 이용해 ROI를 추정하지만, 깊은 네트워크의 수용 영역 확대에 따라 ROI가 실제 병변에서 멀어지는 ‘ROI shifting’ 문제가 존재한다. 이러한 문제점을 해결하고자 저자들은 두 가지 핵심 기법을 도입한다. 첫 번째는 Cosine Margin Sigmoid Loss(CMSL)이다. 전통적인 sigmoid loss는 w·x 형태의 선형 결합에 의존해, 특성 벡터와 가중치 벡터의 크기‖w‖,‖x‖가 학습에 영향을 미친다. 이를 보완하기 위해 특성 벡터와 가중치를 L2 정규화하고, 스케일 파라미터 s를 도입해 p(y|x)=1/(1+e^{-s·cosθ}) 형태로 변형한다. 여기서 cosθ는 특성 벡터와 가중치 벡터 사이의 코사인 유사도이며, -1≤cosθ≤1의 제한된 범위 내에서 학습이 진행된다. 그러나 단순히 cosθ만을 사용하면 여전히 경계 근처에 모호한 샘플이 존재할 수 있다. 따라서 마진 파라미터 m을 도입해 클래스 0과 1에 대해 각각 cosθ+m<0, cosθ−m>0이라는 각도 기반 결정 경계를 만든다. 이 마진은 클래스 간 각도 차이를 강제로 벌려주어, 같은 클래스 내 변동은 감소하고 서로 다른 클래스는 명확히 구분되도록 한다. 논문에서는 s=20, m=0.35가 최적값으로 확인되었으며, 이를 3D ResNet34에 적용한 결과, 기존 sigmoid loss나 NSL(Normalized Sigmoid Loss) 대비 정확도·특이도·AUC가 모두 크게 향상되었다. 두 번째는 COrrelation Attention Map(COAM)이다. 약한 지도(이미지 레벨 라벨)만을 이용해 병변 위치를 시각화하려면, 클래스 활성 맵보다 특징 간 상관관계를 활용하는 것이 더 효과적일 수 있다. 저자들은 마지막 컨볼루션 층의 출력 X∈ℝ^{H×W×S×C}를 N=H·W·S개의 C‑차원 벡터로 재배열하고, Gram 행렬 G=X₀X₀ᵀ∈ℝ^{N×N}를 계산한다. G_{i,j}=⟨x_i, x_j⟩는 i와 j 위치 특징 간 내적을 의미하며, 이는 두 위치가 같은 의미(악성·양성)를 공유할수록 크게 된다. 각 위치 i에 대해 G의 모든 열을 합산한 M_i=∑_j G_{i,j}는 해당 위치가 전체 특징 공간에서 차지하는 상관 강도를 나타낸다. M을 원래 3D 형태(H,W,S)로 복원하면, 높은 값이 할당된 영역이 바로 암 후보 ROI가 된다. 이 과정은 역전파에 포함되지 않으며, 순수히 특징 상관을 기반으로 한 self‑attention 메커니즘이다. 실험에서는 기존 CAM이 병변 중심에서 평균 39.84 mm 떨어진 반면, COAM은 18.26 mm로 절반 수준으로 감소했으며, 시각적으로도 병변을 더 정확히 강조하였다. 데이터 측면에서 저자들은 1.5 T Siemens MRI 장비로 촬영된 10,290개의 DCE‑MRI 스캔(악성 1,137, 양성 578)을 수집했다. 각 스캔은 6개의 차감 이미지와 1개의 비지방 억제 T1 이미지로 구성되며, BI‑RADS 평가와 병리학적 라벨이 제공된다. 데이터는 훈련 1,204명, 검증 165명, 테스트 346명으로 무작위 분할하였다. 전처리 단계에서는 Frangi 필터를 이용해 유방 경계를 추출하고, 3D 마스크를 생성해 배경을 제거한 뒤, 강도 정규화와 고정 크기(340×220×128)로 리샘플링하였다. 모델은 3D ResNet34를 기반으로, 전역 평균 풀링 대신 1×1×1 컨볼루션과 풀링을 사용했으며, 학습률 1e‑4에서 시작해 정체 시 10배 감소시키는 스케줄을 적용하였다. 성능 비교에서는 2D MIL, 3D ResNet, 3D Sparse MIL, 3D DK‑MT 등 다양한 베이스라인과 NSL, CMSL을 각각 적용한 모델을 평가하였다. CMSL 적용 모델은 정확도 0.855, 민감도 0.857, 특이도 0.852, F1 0.888, AUC 0.902를 기록하며, 모든 비교 모델을 앞섰다. 특히 특이도에서 7.9%p 상승을 보였는데, 이는 양성 사례를 오분류하는 위험을 크게 감소시킨다. 로컬라이제이션 실험에서는 방사선과 전문가가 직접 85개의 악성 샘플에 대해 중심을 표시했으며, COAM은 평균 거리 18.26 mm(표준편차 13.65 mm)를 달성, CAM 대비 55% 이상의 정확도 향상을 보였다. 결론적으로, 각도 기반 마진 손실은 유방 MRI의 이질성을 효과적으로 다루어 분류 성능을 크게 끌어올리고, 특징 상관 기반 주의 맵은 약한 지도 상황에서도 병변 위치를 정밀히 추정한다는 점을 입증하였다. 다만 Gram 행렬의 O(N²) 연산 비용이 메모리·시간 측면에서 부담이 될 수 있어, 차원 축소나 샘플링 기법을 통한 효율화가 필요하다. 향후 연구에서는 다중 클래스 확장, 멀티모달 데이터 통합, 실시간 임상 적용을 위한 경량화 모델 개발 등이 기대된다.

원본 논문

고화질 논문을 불러오는 중입니다...

댓글 및 학술 토론

Loading comments...

의견 남기기