동작 인식을 위한 HMM 상태 수를 임계점 기반으로 결정하는 새로운 방법
초록
본 논문은 모션 캡처 데이터의 임계점(끝점, 국소 최대·최소) 개수를 이용해 히든 마코프 모델(HMM)의 상태 수를 사전 예측하는 방법을 제안한다. 제안된 예측값을 AIC(아카이케 정보 기준)와 비교 실험을 통해 검증했으며, 특히 손가락 센서 데이터에서 높은 예측 정확도를 보였다.
상세 분석
본 연구는 HMM을 이용한 제스처 인식에서 가장 중요한 하이퍼파라미터인 상태 수(n)를 데이터 자체의 특성으로부터 추정하려는 시도이다. 기존에는 여러 후보 n을 시험해 보면서 AIC·BIC·교차 검증 등으로 최적값을 찾는 방식이 일반적이었으며, 이는 학습 비용이 크게 증가하는 단점이 있었다. 저자들은 모션 캡처 데이터가 시간에 따라 연속적인 신호이며, 이러한 신호는 자연스럽게 “임계점”(끝점, 국소 최대값, 국소 최소값)이라는 구조적 특징을 가진다고 가정한다. 임계점의 총 개수 cp(G) = cp_max + cp_min + 2(양끝점) 를 각 센서 시퀀스에 대해 계산하고, 이를 HMM 상태 수의 초기 추정값으로 활용한다.
핵심 아이디어는 다음과 같다. ① 모든 시퀀스를 동일한 길이(M=64)로 보간·정규화한다. ② 각 시퀀스에서 γ=1(인접값 비교) 기준으로 국소 극값을 탐지한다. ③ 탐지된 임계점 수에 2를 더해 전체 임계점 수 cp를 구한다. ④ cp를 그대로 혹은 -1, -2(경계점 제외 혹은 트렌드 수) 형태로 변형해 후보 상태 수 후보군을 만든다. ⑤ 각 후보 n에 대해 k‑means 클러스터링(클러스터 수 c) 후 이산화된 시퀀스로 HMM을 학습하고, AIC = -2·loglikelihood + 2·q (q=n²) 값을 계산한다. ⑥ AIC 최소값에 가장 가까운 n을 찾고, cp와의 차이를 ξ = (AIC_cp - AIC_min)/(AIC_max - AIC_min) 로 정량화한다. ξ가 0에 가까울수록 cp가 좋은 예측값임을 의미한다.
실험은 두 가지 설정(A, B)으로 진행되었다. A에서는 클러스터 수 c를 411 범위로 변동시키며 전체 센서(10개) 데이터를 한 번에 평가했고, B에서는 각 c값마다 별도 데이터셋을 만들어 센서별(전체 vs. 손가락 전용) 성능을 비교했다. 결과는 표 3에 요약되는데, 손가락 센서만 사용했을 때 ξ 평균이 0.0216으로 매우 낮아 cp가 거의 최적 상태 수와 일치함을 보여준다. 반면 가속도계(610번 센서)에서는 ξ가 0.14~0.20 수준으로 다소 떨어졌다. 이는 가속도계 신호가 더 복잡하고 잡음이 많아 임계점 개수가 실제 동작 복잡도를 충분히 반영하지 못함을 시사한다.
또한, 경계점을 제외한 cp-2, 트렌드 수(cp-1)와 전체 cp를 비교했을 때, 전체 cp가 가장 일관된 성능을 보였으며, 특히 손가락 센서에서는 경계점 제외가 오히려 성능을 저하시켰다. 이는 제스처의 시작·끝이 중요한 구분점으로 작용한다는 점을 강조한다.
이 논문의 주요 기여는 (1) 임계점 기반 상태 수 추정이라는 새로운, 데이터‑주도적 방법을 제시했으며, (2) AIC와 결합해 정량적 검증 프레임워크를 구축했다는 점이다. 또한, 실험을 통해 제스처 인식에서 센서 종류에 따라 임계점 기반 추정의 유효성이 달라질 수 있음을 밝혀, 향후 멀티센서 융합이나 센서 선택 전략에 대한 연구 방향을 제시한다. 한계점으로는 (가) 임계점 탐지 파라미터 γ와 보간 길이 M에 대한 민감도 분석이 부족하고, (나) 클러스터링 단계에서 c값 선택이 결과에 미치는 영향을 더 체계적으로 조사하지 않은 점이다. 향후 연구에서는 자동 γ 최적화, 비선형 보간, 그리고 베이지안 모델 선택 기법과 결합해 보다 일반화된 상태 수 추정기를 개발할 여지가 있다.
댓글 및 학술 토론
Loading comments...
의견 남기기