빠른 사람 검출을 위한 HOG 기반 알고리즘

초록

본 논문은 차량에 장착된 CCD 카메라 영상을 이용해 실시간으로 사람을 탐지하는 방법을 제안한다. 핵심은 Histogram of Oriented Gradient(HOG) 특징을 추출하고, 이를 선형 SVM 분류기로 학습시켜 빠르고 정확한 인간 검출을 구현한 것이다. 실험 결과, 제안된 시스템은 로봇 내비게이션 및 보안 감시 등 다양한 로봇 응용 분야에 적용 가능함을 보였다.

상세 요약

본 연구는 인간 검출 문제를 해결하기 위해 HOG 특징과 선형 SVM을 결합한 파이프라인을 설계하였다. 먼저 입력 영상은 64×128 픽셀의 고정 크기로 정규화되며, 각 셀(8×8 픽셀)마다 0°~180° 범위의 그래디언트 방향을 9개의 구간으로 양자화한다. 이때 각 구간에 대한 가중치 합산을 통해 9차원 히스토그램을 구성하고, 2×2 셀을 하나의 블록으로 묶어 L2-노멀라이제이션을 적용한다. 블록 단위 정규화는 조명 변화와 그림자에 대한 강인성을 크게 향상시킨다. 전체 이미지에서는 7×15개의 블록이 생성되어 3780 차원의 특징 벡터가 얻어진다.

특징 벡터는 선형 SVM에 입력되며, 학습 단계에서는 양성(사람)과 음성(배경) 샘플을 각각 수천 장씩 수집해 하드 마진을 최대화하는 최적 초평면을 찾는다. 논문에서는 기존의 다중 커널 SVM보다 계산량이 적은 선형 SVM을 선택함으로써 실시간 처리 요구를 충족시켰다. 또한, 슬라이딩 윈도우와 다중 스케일 탐색을 통해 다양한 거리와 자세의 사람을 검출한다. 윈도우 이동 간격은 8픽셀로 설정해 정확도와 속도 사이의 트레이드오프를 최적화하였다.

실험 환경은 자동차형 모바일 로봇에 장착된 640×480 해상도 CCD 카메라이며, 프레임당 평균 처리 시간은 약 45ms(22FPS)로 보고되었다. 검출 성능은 평균 정확도 92%, 재현율 89%를 기록했으며, 이는 기존 HOG+SVM 기반 검출기 대비 5% 이상의 향상을 의미한다. 특히, 로봇이 이동 중 발생하는 급격한 조명 변화와 배경 복잡도에도 비교적 안정적인 검출 결과를 유지한다.

한계점으로는 고해상도 영상에서의 연산량 증가와, 사람의 부분 가려짐(occlusion) 상황에서의 오탐률 상승이 언급된다. 향후 연구에서는 차원 축소 기법(예: PCA)이나 딥러닝 기반 후처리 모듈을 도입해 정확도와 속도 모두를 더욱 개선할 여지가 있다.

초록

상세 요약

📜 논문 원문 (영문)