이미지 검색을 위한 특징 추출 기법 비교 및 최적화 연구
초록
본 논문은 평균 RGB, 색상 모멘트, 공분산 행렬, 지역·전역 색상 히스토그램, 기하학적 모멘트 등 여섯 가지 특징 추출 기법을 비교하고, 이들의 조합이 단일 기법보다 우수함을 실험적으로 입증한다. 또한 이미지 크롭을 통한 질의 수정 방식을 제안하여 사용자가 관심 영역을 지정함으로써 검색 정확도를 향상시킨다.
상세 분석
이 연구는 CBIR 시스템에서 가장 기본적인 저차원 색상 특징부터 고차원 텍스처·형상 특징까지 포괄적인 비교를 수행한다. 평균 RGB는 구현이 간단하지만 색상 분포의 변동성을 충분히 포착하지 못한다는 한계가 있다. 색상 모멘트(1차·2차·3차)는 이미지 전체 색상 분포의 평균, 분산, 왜도를 요약해 색상 변동성을 보다 정밀하게 표현하지만, 회전·스케일 변화에 민감하다. 공분산 행렬(공동 발생 행렬, Co‑occurrence)은 픽셀 쌍 간의 공간적 관계를 모델링해 텍스처 정보를 제공하지만, 차원 폭발과 메모리 요구량이 큰 문제가 있다. 지역 색상 히스토그램(Local Color Histogram)은 이미지 를 사전 정의된 그리드로 분할하고 각 셀마다 히스토그램을 계산함으로써 공간 정보를 보존한다. 반면 전역 색상 히스토그램(Global Color Histogram)은 전체 이미지에 대한 색상 분포만을 제공해 물체 위치 정보가 손실된다. 기하학적 모멘트(Geometric Moment)는 형태 정보를 수치화하지만, 복잡한 배경이나 다중 객체가 존재할 경우 잡음에 취약하다.
실험에서는 10개의 이미지 클래스(자연, 인물, 건축 등) 각각에 대해 개별 기법과 23개 기법의 조합을 적용하고, 정밀도·재현율·F‑measure를 기준으로 성능을 평가하였다. 결과는 대부분의 클래스에서 평균 RGB와 색상 모멘트를 결합한 조합이 단일 기법보다 1218% 높은 평균 정밀도를 보였으며, 특히 텍스처가 중요한 자연 풍경 클래스에서는 공분산 행렬과 지역 색상 히스토그램을 함께 사용할 때 가장 큰 향상을 얻었다.
또한, 질의 이미지에 대해 사용자가 직접 관심 영역을 크롭하여 새로운 질의로 재전송하는 “쿼리 수정” 방식을 도입하였다. 크롭된 영역은 기존 특징 추출 파이프라인에 그대로 적용되며, 불필요한 배경 정보가 제거돼 특징 벡터의 노이즈가 감소한다. 실험 결과, 크롭 전후의 정밀도가 평균 9% 상승했으며, 특히 복잡한 배경을 가진 이미지에서 효과가 두드러졌다.
이 논문은 특징 추출 기법의 상호 보완성을 강조하고, 실제 사용자 인터랙션을 통한 질의 수정이 CBIR 성능을 실질적으로 개선할 수 있음을 입증한다. 또한, 각 이미지 클래스별 최적 조합을 제시함으로써 시스템 설계자가 응용 도메인에 맞는 맞춤형 특징 선택 전략을 수립할 수 있는 실용적인 가이드를 제공한다.