연속시간 이변량 마코프 연쇄의 EM 알고리즘

본 논문은 관측 가능한 하나의 과정만을 이용해 유한 상태의 연속시간 이변량 마코프 연쇄(CTBMC)의 생성자를 추정하는 기대-최대화(EM) 알고리즘을 제안한다. 기존 모델(BMAP, MMMP 등)을 일반화하며, 동시 점프와 비마코프성도 허용한다. 제안 방법은 연속시간 체계에 직접 적용되며 수치 적분이나 샘플링 없이 폐쇄형 업데이트 식을 제공한다.

저자: Brian L. Mark, Yariv Ephraim

본 논문은 연속시간 이변량 마코프 연쇄(Continuous‑time Bivariate Markov Chain, CTBMC)의 파라미터 추정 문제를 다루며, 관측 가능한 하나의 과정 X만을 이용해 전체 생성자 행렬 H를 효율적으로 학습하는 기대‑최대화(EM) 알고리즘을 제안한다. 1. **모델 정의 및 특성** CTBMC는 유한 상태의 동시 연속시간 마코프 연쇄 Z(t) = (X(t), S(t)) 로 정의된다. 여기서 X(t)∈{b₁,…,b_d}는 관측 가능한 과정, S(t)∈{a₁,…,a_r}는 잠재(underlying) 과정이다. 전체 상태 공간은 {1,…,d}×{1,…,r} 로, 생성자 행렬 H는 블록 형태 H_{ln} (l,n=1…d) 로 표현된다. 각 블록은 r×r 행렬이며, 대각 블록 H_{ll} 은 대각우위(diagonal dominant) 조건을 만족해 비특이성을 보장한다. 중요한 점은 H_{ln} (l≠n) 이 반드시 대각 행렬일 필요가 없으며, 따라서 X와 S가 동시에 점프하는 현상을 모델링할 수 있다는 것이다. 이는 기존의 BMAP(무한 상삼각 토플리츠 구조), MMMP, MMPP(동시 점프 금지)와 차별화되는 특징이다. 2. **관측 과정의 확률 구조** 관측 과정 X는 점프 시점 T₁,…,T_N 과 체류시간 ΔT_k 로 기술된다. Z_k = (X_k, S_k) = (X(T_k), S(T_k)) 로 정의하면 {Z_k, T_k}는 마코프 재생 프로세스가 된다. 전방(forward) 벡터 L(k)와 후방(backward) 벡터 R(k) 를 각각 L(k) = P(X(·), 0≤t≤T_k, S_k = i) (i=1…r) R(k) = P(X(·), T_{k-1}

원본 논문

고화질 논문을 불러오는 중입니다...

댓글 및 학술 토론

Loading comments...

의견 남기기