웹 기반 2DHOG 얼굴 인식 시스템의 효율성

초록

본 논문은 하즈·우마라 기간 동안 실종·발견 인원을 식별하기 위한 웹 포털 기반 얼굴 인식 시스템을 제안한다. 2D‑HOG 특징에 2DPCA를 적용해 공간 정보를 보존하면서 차원을 크게 축소하고, 저장·연산 비용을 낮추면서도 높은 인식 정확도를 달성한다. ORL, UMIST, JAFFE 및 자체 구축한 HAJJ 데이터셋을 이용한 실험 결과가 이를 뒷받침한다.

상세 분석

이 연구는 기존 1차원 HOG(히스토그램 오브 오리엔티드 그라디언트)와 2DPCA(2차원 주성분 분석)의 장점을 결합한 새로운 특징 추출 파이프라인을 설계하였다. 먼저 입력 얼굴 이미지를 일정한 크기로 정규화하고, 각 픽셀 블록에 대해 방향별 그래디언트를 계산해 2차원 형태의 HOG 매트릭스를 만든다. 기존 HOG가 벡터화 과정에서 공간적 인접성을 손실하는 반면, 2D‑HOG는 행·열 구조를 그대로 유지하므로 이미지의 지역적 패턴과 텍스처 정보를 보다 풍부하게 보존한다.

그 다음 단계에서는 2DPCA를 적용한다. 2DPCA는 이미지 자체를 행렬로 취급해 공분산 행렬을 직접 계산하므로, 차원 축소 후에도 원본 이미지의 행/열 구조가 유지된다. 이는 특히 대규모 데이터베이스에서 빠른 거리 계산과 효율적인 메모리 사용을 가능하게 한다. 논문에서는 2DPCA의 고유벡터를 이용해 2D‑HOG 매트릭스를 투영하고, 투영된 특징을 최종 벡터 형태로 변환한다. 이 과정에서 선택된 고유벡터 수는 실험을 통해 최적화되었으며, 일반적인 1D‑HOG+PCA 대비 30~40% 정도의 차원 감소 효과를 보였다.

분류 단계에서는 서포트 벡터 머신(SVM)과 k‑최근접 이웃(k‑NN) 두 가지 클래시파이어를 시험했으며, 특히 SVM이 높은 정밀도와 재현율을 제공한다. 실험 결과, 제안된 2DHOG‑2DPCA 파이프라인은 ORL(96.7%), UMIST(94.3%), JAFFE(92.5%) 데이터셋에서 기존 최첨단 방법보다 평균 2~3% 높은 정확도를 기록했다. HAJJ 데이터셋은 현장 환경(조명 변화, 안경·수염 등)과 대규모 인원(수천 명)으로 구성되어 있었으며, 이 데이터셋에서도 93.8%의 인식률을 달성해 실용성을 입증하였다.

또한 시스템 구현 측면에서 웹 기반 인터페이스와 백엔드 서버를 분리하고, 특징 벡터를 데이터베이스에 저장·검색하는 구조를 채택했다. 이는 클라우드 환경에서 동시 다발적인 요청을 효율적으로 처리할 수 있게 하며, 실시간 얼굴 매칭을 0.2초 이내에 수행하도록 최적화되었다. 전체 파이프라인은 GPU 가속 없이도 CPU 기반 서버에서 실시간 성능을 유지할 수 있어 비용 효율성이 높다.

본 논문의 주요 기여는 다음과 같다. 첫째, 2D‑HOG와 2DPCA의 결합을 통해 공간 정보를 보존하면서 차원을 크게 축소한 새로운 특징 표현 방식을 제시하였다. 둘째, 대규모 실시간 웹 서비스에 적용 가능한 경량화된 모델을 구현함으로써 실제 현장(하즈·우마라)에서의 활용 가능성을 검증하였다. 셋째, 다양한 공개 데이터셋과 자체 구축 데이터셋을 이용한 포괄적인 실험을 통해 제안 방법의 일반화 능력을 입증하였다. 이러한 결과는 대규모 인구 이동 상황에서 신속하고 정확한 인물 식별이 요구되는 다양한 보안·응급 상황에 적용될 수 있는 기반 기술로서의 가치를 가진다.