의료 영상 분할을 위한 임베딩 기반 스캔 선택과 활성 학습
초록
본 논문은 의료 영상 분할에서 라벨링 비용을 최소화하기 위해 두 단계의 샘플링 프레임워크를 제안한다. 첫 번째 단계는 대규모 사전학습된 비전 모델의 임베딩을 t‑SNE 로 2차원에 투영한 뒤, 실루엣 점수를 이용해 최적 클러스터 수를 자동 결정하고, 각 클러스터의 메도이드를 초기 시드로 선택한다. 남은 예산은 클러스터 크기에 비례해 할당하고, 클러스터 내부에서는 가장 멀리 떨어진 포인트를 순차적으로 선택해 다양성을 극대화한다. 두 번째 단계에서는 학습된 모델의 이미지‑레벨 엔트로피와 임베딩 공간에서의 거리(공간 다양성)를 α 파라미터로 가중합한 점수를 사용해 추가 샘플을 선택한다. 세 가지 데이터셋(CheXmask, Montgomery, SynthStrip)에서 실험한 결과, 제안 방법은 무작위 선택 및 기존 베이스라인 대비 Dice와 Hausdorff 거리 모두에서 유의미하게 개선되었으며, 특히 저예산 상황에서 강건한 성능을 보였다.
상세 분석
이 연구는 의료 영상 분할 작업에서 라벨링 비용을 크게 절감할 수 있는 두 단계의 샘플 선택 전략을 체계적으로 설계하였다. 첫 번째인 ‘콜드 스타트’ 단계에서는 사전학습된 대규모 비전 인코더(RadImageNet 기반 ResNet‑50)를 이용해 각 이미지의 고차원 특징 벡터를 추출한다. 이후 t‑SNE 로 2차원에 투영함으로써 인간이 직관적으로 이해할 수 있는 시각적 공간을 만든다. 여기서 핵심은 클러스터 수 k 를 사전에 고정하지 않고, 후보 k 집합에 대해 실루엣 점수를 계산해 평균이 가장 높은 k̂ 를 선택한다는 점이다. 이는 데이터 분포가 복잡하거나 불균형한 경우에도 과도한 군집화 혹은 과소 군집화를 방지한다. 선택된 클러스터마다 메도이드를 초기 시드로 삼고, 남은 라벨링 예산을 클러스터 크기에 비례해 할당한다. 클러스터 내부에서는 ‘farthest‑point sampling’ 방식을 적용해 이미 선택된 샘플들과의 최소 거리를 최대화하는 포인트를 순차적으로 추가한다. 이 과정은 다양성을 보장하면서도 각 군집을 대표하는 샘플을 골고루 확보한다는 장점을 갖는다.
두 번째 ‘활성 학습’ 단계에서는 초기 모델을 학습한 뒤, 이미지‑레벨 엔트로피를 불확실성 지표로 사용한다. 엔트로피는 픽셀‑단위 확률 분포의 평균값으로 계산되며, 전체 이미지 풀에 대해 min‑max 정규화를 수행한다. 동시에, t‑SNE 임베딩 공간에서 후보 이미지와 이미 선택된 이미지 집합 사이의 최소 유클리드 거리를 구해 공간 다양성 점수를 만든다. 이 두 점수를 α ∈
댓글 및 학술 토론
Loading comments...
의견 남기기