숨겨진 마르코프 모델 회귀 기반 무감독 인간 활동 인식
이 논문은 라벨이 없는 가속도 데이터를 활용해 인간 활동을 자동으로 구분·인식하는 무감독 방법을 제안한다. 다차원 시계열을 다중 회귀 형태의 숨겨진 마르코프 모델(HMMR)로 표현하고, EM 알고리즘으로 파라미터를 학습한 뒤 Viterbi 알고리즘으로 가장 가능성 높은 활동 시퀀스를 추정한다. 3개의 몸 부위에 부착한 9축 가속도 센서로 수집한 12가지 일상 활동 데이터를 실험에 사용했으며, 기존의 지도학습 및 비지도 학습 기법과 비교해 경쟁력…
저자: Dorra Trabelsi, Samer Mohammed, Faicel Chamroukhi
본 논문은 라벨이 없는 가속도 데이터를 이용해 인간 활동을 자동으로 구분하고 인식하는 새로운 무감독 방법을 제시한다. 연구 배경으로는 고령화 사회에서 일상 활동 모니터링의 필요성이 강조되며, 기존의 지도학습 기반 활동 인식은 대량의 라벨링된 데이터가 필요하다는 한계가 있다. 이를 극복하고자 저자들은 다차원 시계열을 다중 회귀 형태의 숨겨진 마르코프 모델(HMMR)로 모델링하는 접근법을 고안하였다.
제안된 모델은 각 숨겨진 상태(활동)를 다변량 다항 회귀 모델로 표현한다. 구체적으로, 시간 t에서의 관측 벡터 yₜ∈ℝᵈ는 상태 zₜ∈{1,…,K}에 따라 yₜ = B_{zₜ}ᵀ t + εₜ (εₜ∼N(0, Σ_{zₜ})) 로 생성된다. 여기서 B_{zₜ}는 (p+1)×d 차원의 회귀 계수 행렬이며, Σ_{zₜ}는 상태별 공분산 행렬이다. 상태 전이는 1차 마코프 체인으로 가정하고 초기 확률 π와 전이 행렬 A를 정의한다.
파라미터 추정은 EM 알고리즘, 즉 Baum‑Welch 절차를 사용한다. E‑step에서는 현재 파라미터 하에 전방‑후방 확률을 계산해 상태별 책임값 γₜ(k)와 연속 상태쌍 책임값 ξₜ(i,j)를 얻는다. M‑step에서는 이 책임값을 가중치로 활용해 π, A, B_k, Σ_k 를 업데이트한다. 이 과정은 라벨이 전혀 없는 원시 가속도 시계열에 대해 최대우도 추정을 가능하게 하며, 충분한 데이터가 확보될 경우 파라미터 수렴이 보장된다.
디코딩 단계에서는 Viterbi 알고리즘을 적용해 가장 높은 사후 확률을 갖는 상태 시퀀스를 추정한다. 이는 활동 전이의 시간적 제약을 자연스럽게 반영함으로써, 단순 클러스터링이나 GMM 기반 방법보다 전이 구조를 보존한다는 장점을 제공한다.
실험은 프랑스 파리 동부 대학의 LISSI 연구실에서 6명의 건강한 피험자를 대상으로 수행되었다. 각 피험자는 가슴, 오른쪽 허벅지, 왼쪽 발목에 Xsens MTx 3‑DOF 관성 트래커를 부착했으며, 25 Hz로 9축 가속도 데이터를 수집하였다. 실험에 포함된 활동은 계단 하강(A₁), 서기(A₂), 좌식(A₃), 앉기(A₄), 바닥에 앉기(A₆), 눕기(A₇), 누워있기(A₈), 일어서기(A₁₀), 걷기(A₁₁), 계단 상승(A₁₂) 등 총 12가지와 그 전이 동작이다. 각 활동은 피험자마다 자유롭게 수행하도록 하여 지속 시간과 강도가 다양하게 기록되었다.
비교 대상으로는 전통적인 지도학습 기법(k‑Nearest Neighbor, Support Vector Machine, 다층 퍼셉트론, Radial Basis Function 네트워크)과 비지도 학습 기법(k‑Means, Gaussian Mixture Model)이 사용되었다. 평가 지표는 정확도, 정밀도, 재현율, F1‑스코어 등이다. 실험 결과, 제안된 MHMMR은 라벨이 없는 상황에서도 경쟁적인 정확도를 달성했으며, 특히 전이 구간(예: 앉기→일어서기)에서 연속성을 유지하는 데 강점을 보였다. 지도학습 기법과 비교했을 때 약간의 성능 차이는 있었지만, 라벨링 비용을 고려하면 실용적인 대안으로 평가된다.
논문의 주요 기여는 다음과 같다. 첫째, 활동 인식을 회귀 기반 HMM으로 재구성함으로써 시계열 데이터의 비선형 동역학을 효과적으로 모델링하였다. 둘째, EM 기반 무감독 학습을 통해 라벨링 비용을 크게 절감하면서도 충분한 데이터가 있을 경우 일관된 파라미터 추정을 가능하게 했다. 셋째, 다중 센서(가슴, 허벅지, 발목)와 다차원 회귀 모델을 결합해 각 활동의 특징을 풍부하게 표현하고 구분력을 향상시켰다. 넷째, 전이 행렬 A를 명시적으로 학습함으로써 활동 전이 확률을 반영한 시계열 분할이 가능해 전이 구간에서의 오분류를 최소화했다. 다섯째, 제안된 프레임워크는 알고리즘 복잡도를 조절해 실시간 구현이 가능하므로 웨어러블 기반 실시간 모니터링 시스템에 적용하기에 적합하다.
결론적으로, 이 연구는 라벨이 없는 가속도 데이터만으로도 인간 활동을 효과적으로 구분·인식할 수 있는 무감독 방법을 제시했으며, 향후 더 많은 활동 종류와 장기간 자유 생활 데이터에 대한 확장 가능성을 제시한다.
원본 논문
고화질 논문을 불러오는 중입니다...
댓글 및 학술 토론
Loading comments...
의견 남기기