에지 방향 행렬과 로컬 바이너리 패턴을 결합한 새로운 형태 인식 기술

에지 방향 행렬과 로컬 바이너리 패턴을 결합한 새로운 형태 인식 기술

초록

본 논문은 전역적인 에지 방향 행렬(EDMS)과 지역적인 로컬 바이너리 패턴(LBP)을 결합한 하이브리드 디스크립터를 제안한다. 랜덤 포레스트와 다층 퍼셉트론(MLP) 분류기를 이용해 MPEG‑7 CE‑Shape‑1, KTH‑TIPS, English‑fnt, Arabic‑calligraphy 등 네 개 데이터셋에서 기존 GLCM‑EDMS, 단일 LBP, 모멘트 불변량 및 SIFT와 비교했을 때 인식 정확도가 현저히 향상됨을 실험적으로 입증한다.

상세 분석

본 연구는 형태와 텍스처 인식에서 전역적·국부적 정보를 동시에 활용하는 방법론을 제시한다는 점에서 의미가 크다. EDMS는 이미지 전체의 에지 방향을 0°, 45°, 90°, 135° 네 가지 각도로 양자화하고, 1차·2차 이웃 관계를 통해 전역적인 구조적 특징을 추출한다. 반면 LBP는 각 픽셀을 중심으로 8방향 이웃값을 이진화해 지역 텍스처 패턴을 코딩하고, 회전·스케일 불변성을 확보한다. 두 디스크립터를 단순히 연결(concatenation)하는 것이 아니라, LBP의 균일 패턴(Uniform pattern) 테이블을 활용해 EDMS의 방향 히스토그램을 보정함으로써 중복 정보를 최소화하고 상호 보완성을 극대화한다.

특히, 디스크립터 결합 후 차원 축소 없이 그대로 사용함으로써 정보 손실을 방지하고, 랜덤 포레스트와 MLP 두 종류의 분류기를 별도 실험하여 모델 의존성을 검증한다. 랜덤 포레스트는 다수의 결정 트리를 앙상블하여 특징 간 비선형 상호작용을 효과적으로 포착하고, MLP는 은닉층을 통해 고차원 특징 공간을 비선형 변환한다. 두 분류기 모두 결합 디스크립터에 대해 기존 단일 디스크립터 대비 3%~7% 이상의 정확도 향상을 보였으며, 특히 복잡한 서체 데이터셋(English‑fnt, Arabic‑calligraphy)에서 가장 큰 성능 차이를 나타냈다.

실험 설계는 네 개의 공개 벤치마크를 사용해 교차 검증을 수행했으며, 각 데이터셋별로 동일한 전처리 파이프라인(그레이스케일 변환, 정규화, 3×3 Sobel 에지 검출)을 적용했다. 비교 대상인 GLCM‑EDMS는 전통적인 공분산 기반 텍스처와 전역 에지 정보를 결합한 방식이며, LBP와 모멘트 불변량은 각각 지역 텍스처와 형태 불변성을 대표한다. 결과표는 평균 정확도, 정밀도, 재현율, F1‑score를 모두 포함해 종합적인 성능 평가를 제공한다.

한계점으로는 디스크립터 차원이 비교적 높아(EDMS 16차원 + LBP 59차원) 학습 및 추론 비용이 증가한다는 점이다. 또한, 에지 검출 단계에서 잡음에 민감해 노이즈가 많은 이미지에서는 사전 필터링이 필요할 것으로 보인다. 향후 연구에서는 차원 축소 기법(PCA, LDA)이나 심층 학습 기반 자동 특징 추출과의 융합을 통해 실시간 응용 가능성을 높이는 방향이 제시된다.