Cholec80‑port: 기하학적 일관성을 갖춘 트로카 포트 세분화 데이터셋
초록
본 논문은 기존 라파로스코피 데이터셋에서 트로카 포트 라벨이 부족하거나 기하학적으로 부정확한 문제를 해결하기 위해, Cholec80 영상 20개를 기반으로 38,434개의 프레임을 주석하고 포트‑슬리브(중심 구멍 제외) 마스크를 정의한 SOP를 제시한다. 또한 m2caiSeg와 GynSurg 데이터셋을 동일 SOP에 맞게 정제·통합하였다. ConvNeXt‑Base + U‑Net 모델을 동일 학습 프로토콜로 실험한 결과, 기하학적 일관성을 갖춘 라벨이 교차‑데이터셋 전이 성능을 크게 향상시킴을 확인하였다.
상세 분석
본 연구는 외과 영상에서 트로카 포트가 카메라 고정 구조물임에도 불구하고, 반사와 텍스처 때문에 특징점이 과다하게 집중되는 문제를 지적한다. 이러한 비해부 구조는 이미지 스티칭, 3D 재구성, 시각 SLAM 등 기하학 기반 파이프라인에서 오류 전파의 주요 원인으로 작용한다. 기존 공개 데이터셋(m2caiSeg, GynSurg)은 포트 라벨이 거의 없거나, 중앙 구멍을 포함한 전체 원통형 마스크를 제공해 실제 해부학적 장면과의 기하학적 불일치를 초래한다. 논문은 이를 해결하기 위해 “포트‑슬리브” 정의를 SOP로 제시한다. 슬리브는 포트 외벽만을 포함하고, 중앙 구멍은 제외한다. 이 정의는 (1) 해부학적 구조가 구멍을 통해 보이는 경우에도 마스크가 이를 억제하지 않으며, (2) 이미지 평면에서의 특징점 집합이 실제 물리적 경계와 일치하도록 보장한다.
데이터 구축 단계에서는 Cholec80의 앞 20개 영상을 30프레임 간격으로 샘플링해 38,434프레임을 주석했으며, 그 중 1,398프레임에 포트가 가시적으로 나타난다. 이는 기존 데이터셋 대비 5~10배 이상의 양성 샘플을 제공한다. 라벨링은 CVAT를 이용해 SOP에 따라 수행했으며, 경계가 흐리거나 스펙클이 강한 경우 주변 프레임을 참고해 물리적 슬리브 길이를 확인한다.
정제 과정에서는 m2caiSeg의 보간 노이즈와 잘못된 마스크를 재주석하고, GynSurg의 “홀‑필링” 정책을 역으로 적용해 중앙 구멍을 빼고 슬리브만 남기는 작업을 수행했다. 이렇게 정제·통합된 데이터는 “Combined (cleaned)” 라벨로 별도 실험에 사용되었다.
모델은 ConvNeXt‑Base 백본에 U‑Net 디코더를 결합한 바이너리 세그멘테이션 구조를 채택했으며, Dice 손실과 BCE 손실을 가중합한 목표 함수를 사용했다. 학습 하이퍼파라미터는 AdamW(learning rate 5e‑5, batch 16, input 384×384)이며, 동일 프로토콜을 모든 데이터셋에 적용해 공정한 비교를 가능하게 했다.
평가 지표는 (1) 포트가 존재하는 프레임에 한정한 Dice 점수와 (2) 프레임 단위 포트 존재 여부를 판단하는 Detect F1을 사용했다. 실험 결과, Cholec80‑port로 학습한 모델은 자체 테스트 셋에서 Dice 0.862, Detect F1 0.856을 기록했으며, m2caiSeg 테스트 셋에서도 기존 m2caiSeg‑trained 모델보다 높은 성능을 보였다. 이는 라벨의 기하학적 일관성이 데이터 양보다 전이 성능에 더 큰 영향을 미친다는 것을 시사한다. 반면 GynSurg에 대한 전이 성능은 도메인 차이(포트 재질, 조명, 수술 단계) 때문에 여전히 낮았다. 정제되지 않은 원본 라벨을 사용한 경우 전이 성능이 크게 저하되는 것이 확인되었으며, SOP 수준의 정제가 전이 강건성의 핵심 요인임을 입증했다.
실패 사례 분석에서는 (i) 이미지 가장자리 근처에 위치한 얇은 포트, (ii) 투명하거나 저대비 슬리브, (iii) 강한 스펙클이 경계를 가리는 경우가 주요 원인으로 지적되었다. 이러한 한계는 향후 데이터 다양성 확대와 고해상도 라벨링, 멀티모달(예: 깊이·광학 흐름) 정보를 결합한 방법으로 보완될 수 있다.
결론적으로, 본 논문은 포트‑슬리브 라벨링 SOP와 대규모 정제된 데이터셋을 제공함으로써 외과 영상에서 기하학 기반 알고리즘의 정확도와 안정성을 크게 향상시킬 수 있음을 실증하였다. 향후 연구는 포트 마스킹을 실제 SLAM·3D 재구성 파이프라인에 통합하고, 다양한 포트 형태와 환경을 포함한 데이터 확장을 목표로 한다.
댓글 및 학술 토론
Loading comments...
의견 남기기