GLCM 라쿠날리티 및 션 특징을 이용한 식물 식별 시스템 모델

GLCM 라쿠날리티 및 션 특징을 이용한 식물 식별 시스템 모델

초록

본 연구는 회색공동행렬(GLCM), 라쿠날리티, 션 특징을 결합하고 베이지안 분류기를 적용하여 식물 잎 이미지 식별 정확도를 향상시킨다. 플라비아 데이터셋에서 97.19%, 폴리지를 데이터셋에서 95.00%의 정확도를 달성했으며, 기존 방법들을 능가한다.

상세 분석

본 논문은 식물 식별 분야에서 텍스처 기반 특징의 활용 가능성을 재조명한다. 먼저 회색공동행렬(GLCM)을 이용해 2차원 텍스처 상관관계를 정량화하고, 이를 통해 에너지, 대비, 동질성, 상관계수 등 4가지 기본 통계량을 추출한다. GLCM은 방향(0°, 45°, 90°, 135°)과 거리(보통 1픽셀) 설정에 따라 다중 특징을 생성할 수 있어, 잎맥과 같은 미세 구조를 효과적으로 포착한다.

라쿠날리티는 프랙탈 차원의 확장 개념으로, 이미지의 구멍(공극) 구조와 공간적 불균일성을 측정한다. 일반적인 프랙탈 차원은 전체적인 복잡도만을 반영하지만, 라쿠날리티는 구멍 크기의 분포와 형태까지 고려한다. 논문에서는 3가지 라쿠날리티 파라미터( Q=1,2,3 )를 계산해 텍스처의 다중 스케일 특성을 보강한다.

션 특징은 한국 연구진이 제안한 고차원 텍스처 지표로, 이미지의 비대칭성, 비선형성, 그리고 국소 대조도를 정량화한다. 특히 션의 S1, S2, S3 지표는 이미지의 회전 불변성을 유지하면서도 미세한 패턴 차이를 감지한다. 이 세 가지 특징을 결합함으로써, 기존 단일 특징 기반 시스템이 놓치기 쉬운 미세한 잎맥 변형이나 색상 변동을 보완한다.

특징 결합 후 베이지안 분류기를 적용한다. 베이지안 분류기는 사전 확률과 조건부 확률을 이용해 클래스(식물 종)별 최대 사후 확률을 계산한다. 여기서는 다중 정규분포 가정을 통해 각 특징 벡터의 공분산 행렬을 추정하고, 차원 축소 없이 원본 특징을 그대로 사용한다. 이는 특징 간 상관관계를 보존하면서도 계산 복잡도를 크게 증가시키지 않는다.

실험에서는 널리 사용되는 두 데이터셋인 Flavia와 Foliage를 선택했다. Flavia는 32종, 1907장의 고해상도 잎 이미지로 구성돼 있으며, Foliage는 32종, 1360장의 다양한 조명·각도 조건을 포함한다. 데이터 전처리 단계에서 RGB 이미지를 그레이스케일로 변환하고, Otsu 이진화를 통해 배경을 제거한 뒤, ROI(Region of Interest)를 정규화한다.

성능 평가는 정확도, 정밀도, 재현율, F1-score를 사용했으며, 교차 검증(5‑fold)으로 모델의 일반화 능력을 검증했다. 결과는 Flavia에서 97.19%, Foliage에서 95.00%의 정확도를 기록했으며, 기존 GLCM‑SIFT, 색상‑형상 결합 모델보다 2~4%p 높은 성능을 보였다. 특히 라쿠날리티와 션 특징을 추가했을 때 정확도 향상이 가장 두드러졌으며, 이는 텍스처의 다중 스케일 및 비선형 특성을 효과적으로 포착했기 때문으로 해석된다.

한계점으로는 특징 차원의 증가에 따른 학습 데이터 요구량 상승과, 베이지안 분류기의 가우시안 가정이 실제 데이터 분포와 완벽히 일치하지 않을 수 있다는 점을 들 수 있다. 향후 연구에서는 차원 축소 기법(예: PCA, LDA)과 비선형 분류기(예: SVM, 딥러닝)와의 결합을 통해 성능을 더욱 끌어올릴 여지가 있다.

요약하면, GLCM, 라쿠날리티, 션 특징을 통합하고 베이지안 분류기를 적용한 본 모델은 기존 텍스처 기반 식물 식별 시스템보다 높은 정확도를 달성했으며, 다중 스케일·비선형 텍스처 정보를 활용하는 접근법이 식물 이미지 인식에 유효함을 입증한다.