CNN 기반 입자 섀도우그래프를 이용한 입자 크기·형상 실시간 분석

CNN 기반 입자 섀도우그래프를 이용한 입자 크기·형상 실시간 분석

초록

본 논문은 단일 U‑Net 기반 컨볼루션 신경망을 활용해 입자 섀도우 이미지에서 이진 마스크와 중심점 이미지를 동시에 예측하고, 이를 마커‑제어 워터셰드와 결합해 복잡한 형태와 군집을 가진 입자를 정확히 분할한다. 합성 및 실험용 버블 이미지에서 기존 비머신러닝 방법보다 우수한 정확도와 처리 속도를 보이며 실시간 분석 가능성을 제시한다.

상세 분석

이 연구는 전통적인 이미지 처리 파이프라인이 복잡한 배경, 다양한 입자 형태, 군집 현상 등에 취약하다는 점을 지적하고, 이를 극복하기 위한 딥러닝 기반 접근법을 제안한다. 핵심은 두 개의 채널 출력을 갖는 U‑Net 구조이다. 첫 번째 채널은 픽셀 단위의 이진 마스크를, 두 번째 채널은 입자 중심점을 나타내는 히트맵을 생성한다. 이중 출력은 서로 보완적인 정보를 제공한다는 점에서 의미가 크다. 이진 마스크는 전통적인 마커‑제어 워터셰드 알고리즘에 입력되어 초기에 과분할되거나 과소분할되는 문제를 완화한다. 중심점 히트맵은 워터셰드의 마커 이미지로 활용돼 정확한 영역 분리를 유도한다.

데이터 준비 단계에서는 실제 실험 이미지와 유사한 합성 버블 이미지를 대량 생성해 네트워크를 사전 학습시켰다. 합성 데이터는 입자 크기, 형태, 겹침 정도, 배경 잡음 등을 다양하게 변형해 모델의 일반화 능력을 강화한다. 손실 함수는 이진 교차 엔트로피와 중심점 히트맵에 대한 평균 제곱 오차(MSE)를 가중합한 복합 손실을 사용해 두 출력이 동시에 최적화되도록 설계하였다.

학습 과정에서 데이터 증강(회전, 스케일, 밝기 변동)과 배치 정규화, 드롭아웃을 적용해 과적합을 방지하였다. 실험 결과는 정량적 지표인 IoU(Intersection over Union), F1‑score, 중심점 정확도에서 기존 비머신러닝 방법(예: 전통적인 임계값 기반 이진화와 거리 변환 워터셰드)보다 현저히 높은 값을 기록했다. 특히 군집된 입자와 불규칙 형태를 가진 경우에도 분할 오류가 크게 감소하였다.

처리 속도 측면에서는 GPU 가속을 이용해 한 프레임당 30 ms 이하의 추론 시간을 달성했으며, 이는 실시간 영상 분석에 충분한 수준이다. 다만, 모델이 학습된 도메인(버블 이미지)과 크게 다른 입자 재질이나 광학 조건에서는 성능 저하가 관찰되었으며, 이는 추가적인 도메인 적응 학습이 필요함을 시사한다.

전반적으로 이 논문은 딥러닝 기반 전처리와 전통적인 워터셰드 후처리를 결합한 하이브리드 파이프라인이 복잡한 입자 이미지 분석에 효율적임을 입증한다. 향후 다중 채널(예: 색상, 편광) 입력과 3‑D 입자 영상에 대한 확장 가능성도 기대된다.