HMRF‑UNet으로 폴리우레탄 마이크로CT 무지도 분할
초록
본 논문은 마이크로CT 영상의 폴리우레탄 폼 구조를, 라벨이 없는 상태에서도 높은 정확도로 빠르게 분할할 수 있는 HMRF‑UNet을 제안한다. HMRF 이론을 기반으로 한 에너지 손실을 U‑Net에 결합하고, 퍼츠와 Banerjee 형태의 이웃 항을 퍼지 형태로 재정의하였다. 인공·실제 PU‑foam 데이터셋에서 다양한 이웃 가중치와 σ threshold를 실험적으로 최적화했으며, 기존 EM‑ICM 혹은 진화 알고리즘 대비 수십 배 빠른 속도와 Dice ≈ 0.96 수준의 정확도를 달성했다. 또한, 사전학습 전략을 통해 라벨이 극소량인 경우에도 성능 저하를 최소화한다는 점을 보였다.
상세 분석
이 연구는 두 가지 핵심 아이디어를 결합한다. 첫째, 전통적인 Hidden Markov Random Field(HMRF)의 확률적 모델링을 그대로 유지하면서, CNN이 출력하는 퍼지 확률 맵을 이용해 에너지 함수를 연속적으로 정의한다는 점이다. 기존 HMRF는 이산 라벨에 대해 클래스 평균·분산을 추정하고, Potts 혹은 Banerjee와 같은 이웃 페널티를 적용해 전체 에너지를 최소화한다. 저자들은 이를 식(12)–(16)에서 보듯, 각 클래스의 평균·표준편차를 퍼지 가중 평균(eµₗ, eσₗ)으로 재계산하고, 이웃 간 라벨 차이를 라벨 확률 벡터의 유클리드 거리로 변환함으로써 미분 가능하게 만들었다. 이렇게 하면 역전파가 가능한 손실 함수 L = λ_d L_d + λ_n L_n을 구성할 수 있다.
둘째, U‑Net 구조에 위의 손실을 적용해 완전한 엔드‑투‑엔드 학습을 수행한다. 네트워크는 3단계 인코더‑디코더와 64개의 초기 필터를 갖는 전형적인 U‑Net이며, 최종 레이어는 2‑채널 소프트맥스이다. 손실 구성에서 λ_d와 λ_n은 서로 보완하도록 설정(λ_d = 1 − λ_n)했으며, λ_n은 하이퍼파라미터 탐색을 통해 0.31 정도가 최적임을 확인했다.
실험에서는 두 데이터셋을 사용한다. 인공적으로 생성된 2D PU‑foam 이미지(ArtPUF) 20 000장과 실제 3D µCT 볼륨(RealPUF)에서 추출한 2D 슬라이스다. 전자는 라벨이 풍부해 손실 가중치와 이웃 형태(Potts vs. Banerjee, 가중치 적용 여부)를 체계적으로 비교했으며, 후자는 cuboid‑based split을 통해 데이터 누수를 방지하고, 42 000장의 학습 이미지와 6 000장의 검증·테스트 이미지를 확보했다.
결과적으로, 가중치가 적용된 Banerjee 이웃(HMRF‑UNet wban)이 가장 높은 Dice ≈ 0.96을 기록했고, Potts 기반 모델보다 약 5 % 정도 정확도가 향상되었다. 또한, σ_thresh = 0.10 ~ 0.15 구간에서 최적 성능이 도출돼 이웃 가중치가 지역적 강도 변동을 효과적으로 반영함을 보여준다. 속도 측면에서는 전통적인 EM‑ICM이나 진화 알고리즘이 수십 초에서 수분이 걸리는 반면, HMRF‑UNet은 GPU 기반 추론으로 0.02 s 수준의 실시간 성능을 달성했다.
마지막으로, 사전학습(pre‑training) 실험에서는 ArtPUF 데이터로 HMRF‑UNet을 먼저 학습시킨 뒤, 제한된 라벨(5 %20 %)만을 사용해 전체 U‑Net을 미세조정했을 때, 라벨이 전혀 없는 경우 대비 Dice가 0.070.12 정도 상승하는 효과를 확인했다. 이는 무지도 학습이 라벨이 부족한 실제 재료 과학 분야에 실용적인 전이 학습 기반을 제공한다는 점에서 의미가 크다.
전반적으로, 이 논문은 HMRF의 통계적 강점과 CNN의 연산 효율성을 성공적으로 융합했으며, 퍼지 라벨링을 통한 미분 가능 손실 설계가 무지도 세그멘테이션에 새로운 가능성을 열었다는 점에서 학계·산업 모두에 큰 기여를 한다.
댓글 및 학술 토론
Loading comments...
의견 남기기