온라인 학습을 위한 이산 히든 마코프 모델 알고리즘 비교

본 연구는 이산 히든 마코프 모델(HMM)의 온라인 파라미터 학습을 위한 새로운 알고리즘 세 가지와 기존 Baldi‑Chauvin(BC) 알고리즘을 비교·분석한다. 먼저 HMM의 기본 구조와 학습 목표를 소개하고, 교사‑학생 시나리오에서 KL 발산을 일반화 오차 척도로 사용한다는 점을 명시한다. 1. **Baum‑Welch Online (BWO)** - 전통적인 Baum‑Welch(EM) 업데이트에 학습률 η_BW를 곱해 순차적으로 파라미터를 조정한다. - 업데이트 식은 ω̂_{p+1}=ω̂_p+η_BW·Δ̂ω_p이며, Δ̂ω_p는 현재 관측 시퀀스 y_p에 대한 BW 변화량이다. - 실험에서는 n=2, m=3, T=2인 작은 HMM을 사용해 η_BW=0.01, 0.1, 1.0 등 다양한 학습률을 시험하였다. - 대칭 초기화(모든 확률을 동일하게 설정) 시 일정 구간 이후 KL 발산이 정체되는 현상이 나타났으며, 이는 파라미터가 동일한 값에 머무르는 “대칭 정체” 현상이다. 비대칭 초기화에서는 정체가 사라진다. 2. **Bayesian Online Algorithm (BOnA)** - 베이지안 프레임워크를 도입해 사전분포를 Dirichlet 형태로 가정하고, 관측마다 사후분포를 계산한다. - 사후분포는 일반적으로 Dirichlet 형태를 유지하지 않으므로, KL 최소화를 통해 가장 가까운 Dirichlet 분포로 투사한다. - 투사 과정은 디감마 함수 ψ와 그 역함수 ψ^{-1}를 이용해 파라미터를 업데이트한다(식 9‑13). - 숨겨진 상태 합산이 T에 대해 지수적으로 복잡해져 실용성이 떨어진다(시간 복잡도 ≈ O(exp(T))). 3. **Mean Posterior Approximation (MPA)** - BOnA의 사후 평균과 분산을 직접 매칭해 파라미터를 추정함으로써 계산량을 크게 감소시킨다. - 업데이트 식은 평균값 ρ̂_i, â_{ij}, b̂_{iα}를 사후 평균과 두 번째 모멘트를 이용해 계산한다(식 14). - 복잡도는 O(n·T)이며, 실제 실험에서 BOnA가 340분 걸린 반면 MPA는 5초 만에 수행되었다. 4. **성능 비교** - 정적 교사 모델에 대해 MPA가 BC와 BWO보다 빠르게 KL 발산을 감소시켰으며, 특히 η_BW와 λ에 민감한 BWO보다 안정적인 수렴을 보였다(그림 3a, 3b). - 드리프트 상황(교사 파라미터가 주기적으로 혹은 연속적으로 변하는 경우)에서는 BC가 더 빠르게 적응했지만, MPA는 베이지안 특성상 학습률(분산)이 감소하면서 메모리 효과가 발생해 적응이 늦어졌다. 저자들은 변분 학습률 조절을 통해 MPA의 드리프트 적응성을 개선할 수 있음을 제안한다. 5. **대칭 붕괴(Symmetry Breaking)** - 대칭 초기화된 학생 모델은 파라미터가 동일한 값에 머무르는 플래토를 형성한다. - 어느 순간 하나 이상의 파라미터가 비대칭적으로 변하면서 급격히 KL 발산이 감소한다. 이는 “대칭 붕괴” 현상이며, 학습 효율을 크게 좌우한다. - BWO에서는 방출 행렬 B만 붕괴하고, BC와 MPA에서는 전이 행렬 A와 방출 행렬 B가 동시에 붕괴한다. 대칭이 많이 깨질수록 일반화 성능이 향상된다(그림 5, 6). 6. **결론** - 제안된 세 알고리즘 중 MPA가 정적 교사에 대해 가장 우수한 성능을 보이며, 계산 효율도 뛰어나다. - 드리프트 상황에서는 BC가 더 빠른 적응성을 보이지만, 베이지안 기반 MPA는 학습률 조절을 통해 개선 가능성을 제시한다. - 대칭 초기화와 대칭 붕괴 현상은 온라인 학습에서 중요한 역할을 하며, 이를 고려한 초기화 및 학습률 설계가 필요함을 강조한다. - 실제 데이터에 대한 초기 테스트에서도 제안된 방법들의 유용성이 확인되었다.

온라인 학습을 위한 이산 히든 마코프 모델 알고리즘 비교

원본 논문

댓글 및 학술 토론

의견 남기기

원본 논문

관련 논문

댓글 및 학술 토론

의견 남기기