다중벤더 유방촬영 벤치마크와 에너지 정규화 프로토콜

LUMINA는 6개 벤더의 디지털 유방촬영 영상을 1824장 수집해 병리확인 악성·양성 라벨, BI‑RADS 및 유방밀도 정보를 제공한다. 고·저에너지 영상 차이를 전처리 단계에서 전경만을 대상으로 히스토그램 매칭으로 통합하는 ‘에너지 정규화’를 제안하고, EfficientNet‑B0와 Swin‑T 등 다양한 CNN·Transformer 모델을 두 뷰(CC·MLO) 입력으로 학습시켜 악성 진단, BI‑RADS 분류, 밀도 예측 3가지 임상 과제…

저자: Hongyi Pan, Gorkem Durak, Halil Ertugrul Aktas

다중벤더 유방촬영 벤치마크와 에너지 정규화 프로토콜
유방암은 여성에게 가장 흔한 암이며 조기 발견이 치료 성공의 핵심이다. 최근 딥러닝 기반 자동 판독 시스템이 높은 진단 정확도를 보이고 있지만, 기존 공개 데이터베이스는 필름 기반 저해상도 영상, 단일 벤더, 라벨 부족 등으로 실제 임상 환경에 적용하기엔 한계가 있다. 이러한 문제점을 해결하고자 저자들은 ‘LUMINA’라는 새로운 데이터셋을 구축하였다. 데이터셋은 터키의 두 의료기관에서 수집한 468명의 환자(30‑88세)로 구성되며, 총 1824장의 전장 디지털 유방촬영(FFDM) 영상을 포함한다. 각 환자는 병리학적으로 확인된 양성(960장) 혹은 악성(864장) 라벨을 가지고 있다. 또한, BI‑RADS 0‑6 위험 등급과 유방밀도(A‑D) 라벨이 전문가에 의해 부착돼 있다. 이미지 해상도는 2364×2964~4800×6000 픽셀, 비트 깊이는 12‑14비트이며, 대부분 MONOCHROME2 포맷으로 저장돼 있다. FUJIFILM 시스템만 MONOCHROME1을 사용했으며, 이를 동일한 MONOCHROME2로 변환해 일관성을 확보하였다. LUMINA는 6개 제조사(IMS, Metaltronica, FUJIFILM, Siemens, Carestream, GE)와 두 가지 X‑ray 에너지(고·저) 설정을 모두 포함한다. 고에너지 영상은 조직 대비가 강하고 저에너지 영상은 연부조직 대비가 우수해, 두 스타일 간에 강도와 대비 차이가 크게 나타난다. 이러한 차이는 모델이 특정 벤더·에너지에 과적합되는 원인이 되므로, 데이터셋 전처리 단계에서 ‘에너지 정규화’를 적용한다. 에너지 정규화는 전경(유방) 픽셀만을 대상으로 히스토그램 매칭을 수행한다. 전경 마스크 Mₛ와 Mᵣ을 정의하고, 각각의 픽셀값 히스토그램 Hₛ(k), Hᵣ(k)를 12‑bit 구간으로 계산한다. 정규화된 누적분포함수(CDF) \(\bar C_s(p), \bar C_r(q)\)를 매칭해 변환 함수 T(p)를 구한다. 이후 원본 이미지 Iₛ의 전경 픽셀에 T를 적용하고 배경은 0으로 유지한다. 이 과정은 모델‑아키텍처와 무관하게 사전 처리만으로 수행되며, 저에너지 기준 히스토그램을 참조해 모든 고에너지 영상을 일관된 저에너지 스타일로 변환한다. 평가 프로토콜은 세 가지 임상 과제로 구성된다. ① 악성 진단: 병리학적 라벨을 이용해 양성·악성을 이진 분류한다. ② BI‑RADS 분류: (a) 저위험(1‑3) vs 고위험(4‑6) 이진, (b) 저위험(1‑2), 중위험(3‑4), 고위험(5‑6) 3‑클래스 분류한다. ③ 유방밀도 예측: A‑D 네 단계 분류한다. 각 과제는 표준 두 뷰(CC·MLO) 입력을 사용하며, 단일 뷰와 두 뷰 모델을 비교한다. 모델은 EfficientNet‑B0, ResNet‑50, DenseNet‑121 같은 CNN과 Swin‑Transformer‑T 같은 Vision Transformer를 백본으로 사용한다. 두 뷰를 동시에 처리하는 공유‑백본 구조는 파라미터를 48% 절감하면서도 성능을 유지한다. 실험 결과, EfficientNet‑B0는 악성 진단에서 AUC 93.54%를 달성했고, Swin‑T는 밀도 예측에서 macro‑AUC 89.43%로 최고 성능을 보였다. 에너지 정규화를 적용한 경우 모든 모델에서 AUC/ACC가 평균 1‑2% 상승했으며, Grad‑CAM 시각화에서도 병변 부위에 더 집중된 활성화가 관찰돼 진단 신호가 강화된 것을 확인했다. 벤더·에너지 별 성능 편차 분석에서는 정규화 전후의 차이가 크게 감소했으며, 특히 저에너지 기준에 맞춘 이미지가 다양한 벤더에서 일관된 특징을 학습하도록 돕는다. 한편, 데이터셋은 현재 6개 벤더에 국한돼 있어 전 세계 모든 장비를 포괄하지 못한다는 제한이 있다. 또한, 정규화 기준 히스토그램이 고정돼 있어 새로운 장비가 추가될 경우 재조정이 필요하다. 결론적으로, LUMINA는 고해상도·다중벤더·다중라벨을 갖춘 최초의 공개 FFDM 벤치마크이며, 전경 전용 히스토그램 매칭 기반 에너지 정규화는 간단하면서도 강력한 도메인 적응 방법이다. 이는 향후 유방촬영 AI 모델이 다양한 임상 환경에서 신뢰성 있게 배포될 수 있는 기반을 제공한다.

원본 논문

고화질 논문을 불러오는 중입니다...

댓글 및 학술 토론

Loading comments...

의견 남기기