소르검 기공 세분화 위한 반지도학습 인스턴스 세그멘테이션 프레임워크
초록
본 논문은 소르검 잎의 고해상도 현미경 이미지에서 기공, 보호세포, 복합부 3가지 구성요소를 정확히 구분하기 위해 패치 기반 전처리와 의사라벨링을 결합한 반지도학습 인스턴스 세그멘테이션 파이프라인을 제안한다. 11,060개의 인간 라벨 패치와 56,428개의 의사라벨 패치를 활용해 기존 모델 대비 mIoU 4.4%p, AP 17.8%p 향상을 달성했으며, 소르검 기공 형질 고속 추출에 실용적인 데이터셋과 방법론을 제공한다.
상세 분석
StomataSeg 논문은 작고 복잡한 식물 기공 구조를 자동화하기 위한 두 가지 핵심 기술을 도입한다. 첫 번째는 고해상도 현미경 이미지를 겹치는 작은 패치로 분할하는 전처리 단계이다. 이 접근법은 전체 이미지에서 발생하는 스케일 불균형을 완화하고, 40 µm 이하의 미세한 기공을 확대해 모델이 세부 경계를 학습하도록 돕는다. 두 번째는 반지도학습을 이용한 의사라벨링 전략이다. 초기에는 인간이 라벨링한 11,060개의 패치를 사용해 강력한 인스턴스 세그멘테이션 모델(Mask R‑CNN 기반)을 학습하고, 이를 통해 라벨이 없는 56,428개의 패치에 고신뢰도 마스크를 자동 생성한다. 의사라벨은 confidence threshold와 클래스별 균형을 고려해 선택되며, 이후 전체 라벨셋(인간 라벨 + 의사라벨)로 재학습함으로써 데이터 양을 6배 이상 확대한다.
실험에서는 semantic segmentation 모델(U‑Net, DeepLabV3+)과 instance segmentation 모델(Mask R‑CNN, Cascade Mask R‑CNN)을 각각 베이스라인과 비교하였다. 결과는 semantic 모델의 최고 mIoU가 65.93%에서 70.35%로, instance 모델의 최고 AP가 28.30%에서 46.10%로 크게 상승했음을 보여준다. 특히 작은 pore 영역의 AP가 20%p 이상 개선되어, 기존 연구에서 지적되던 “극소 객체 검출 한계”를 효과적으로 극복했다.
데이터셋 측면에서도 다섯 개 유전형, 두 면(adaxial/abaxial), 세 개 잎 부분(베이스, 미드, 팁) 등 다양한 변이를 포함해 실제 현장 변동성을 충분히 반영하였다. 라벨링 품질 관리 절차(전문가 리뷰, 합의 기반 교육, 라벨링 속도·정확도 모니터링)도 상세히 기술되어 있어, 데이터 신뢰성이 높다.
한계점으로는 의사라벨링 과정에서 발생할 수 있는 오류 전파 위험과, 패치 기반 전처리로 인한 경계 중복 처리 비용이 있다. 또한, 현재는 정적인 이미지에 초점을 맞추었으며, 동영상 기반 실시간 모니터링에는 추가 연구가 필요하다. 향후 연구에서는 멀티스케일 피라미드 네트워크와 자기 지도 학습을 결합해 라벨 의존도를 더욱 낮추고, 다양한 작물에 일반화 가능한 프레임워크로 확장할 여지가 있다.
댓글 및 학술 토론
Loading comments...
의견 남기기