연속시간 이변량 마코프 연쇄의 EM 알고리즘
본 논문은 관측 가능한 하나의 과정만을 이용해 유한 상태의 연속시간 이변량 마코프 연쇄(CTBMC)의 생성자를 추정하는 기대-최대화(EM) 알고리즘을 제안한다. 기존 모델(BMAP, MMMP 등)을 일반화하며, 동시 점프와 비마코프성도 허용한다. 제안 방법은 연속시간 체계에 직접 적용되며 수치 적분이나 샘플링 없이 폐쇄형 업데이트 식을 제공한다.
저자: Brian L. Mark, Yariv Ephraim
본 논문은 연속시간 이변량 마코프 연쇄(Continuous‑time Bivariate Markov Chain, CTBMC)의 파라미터 추정 문제를 다루며, 관측 가능한 하나의 과정 X만을 이용해 전체 생성자 행렬 H를 효율적으로 학습하는 기대‑최대화(EM) 알고리즘을 제안한다.
1. **모델 정의 및 특성**
CTBMC는 유한 상태의 동시 연속시간 마코프 연쇄 Z(t) = (X(t), S(t)) 로 정의된다. 여기서 X(t)∈{b₁,…,b_d}는 관측 가능한 과정, S(t)∈{a₁,…,a_r}는 잠재(underlying) 과정이다. 전체 상태 공간은 {1,…,d}×{1,…,r} 로, 생성자 행렬 H는 블록 형태 H_{ln} (l,n=1…d) 로 표현된다. 각 블록은 r×r 행렬이며, 대각 블록 H_{ll} 은 대각우위(diagonal dominant) 조건을 만족해 비특이성을 보장한다. 중요한 점은 H_{ln} (l≠n) 이 반드시 대각 행렬일 필요가 없으며, 따라서 X와 S가 동시에 점프하는 현상을 모델링할 수 있다는 것이다. 이는 기존의 BMAP(무한 상삼각 토플리츠 구조), MMMP, MMPP(동시 점프 금지)와 차별화되는 특징이다.
2. **관측 과정의 확률 구조**
관측 과정 X는 점프 시점 T₁,…,T_N 과 체류시간 ΔT_k 로 기술된다. Z_k = (X_k, S_k) = (X(T_k), S(T_k)) 로 정의하면 {Z_k, T_k}는 마코프 재생 프로세스가 된다. 전방(forward) 벡터 L(k)와 후방(backward) 벡터 R(k) 를 각각
L(k) = P(X(·), 0≤t≤T_k, S_k = i) (i=1…r)
R(k) = P(X(·), T_{k-1}
원본 논문
고화질 논문을 불러오는 중입니다...
댓글 및 학술 토론
Loading comments...
의견 남기기