동질 구간 탐지를 위한 최적 정지 규칙

본 논문은 두 개의 마코프 과정이 무작위 기하분포 시점 θ에서 전환되는 관측 시퀀스에서, 변화 시점을 최대 확률로 탐지하기 위한 최적 정지 규칙을 제시한다. 후방 확률 Πₙ을 이용한 동적 계획법으로 임계값 r*를 구하고, 이를 이용해 τ* = inf{n≥d+1: LLR≥r*(X_{n-d,n})} 형태의 정지 시점을 도출한다. 이산 상태공간(예: {0,1})에 대한 구체적 해도 제시한다.

저자: Wojciech Sarnowski, Krzysztof Szajowski

1. **문제 설정 및 모델링** 논문은 관측 시퀀스 X = {Xₙ}_{n≥0}가 두 개의 동질 마코프 체인 X⁰ₙ, X¹ₙ 사이에서 무작위 시점 θ 에서 전환되는 구조라고 가정한다. θ는 기하분포 P(θ=j)=p^{j-1}q (j≥1) 를 따르며, 전환 전후 과정은 각각 전이 확률밀도 f₀, f₁ 으로 기술된다. 전환 직전 관측값 X_{θ-1}와 전환 직후 첫 관측값 X_θ 는 동일 상태에서 시작한다는 연속성 가정이 있다. 2. **목표와 최적화 기준** 목표는 정지 시점 τ (ℱₙ-정지시간) 를 선택해 P_x(|θ−τ|≤d) 를 최대화하는 것이다. 여기서 d≥0 는 탐지 정확도 허용 오차이며, d=0이면 정확히 전환 시점을 맞추는 것이 목표가 된다. 3. **후방 확률과 동적 계획** 후방 확률 Πₙ = P_x(θ≤n | ℱₙ) 를 도입하고, Zₙ = P_x(|θ−n|≤d | ℱₙ) 를 정의한다. 레마 1·2를 통해 Zₙ→0 (a.s.)임을 보이며, 최적 정지 시점 τ₀ = inf{n: Zₙ=Vₙ} (여기서 Vₙ 는 Zₙ 의 ess sup) 임을 증명한다. 4. **보상 함수와 마코프 보조 과정** 보상 함수 h(x,α) = 1−p^{d}+q^{d+1}∑_{m=1}^{L_m}… (α) 를 정의하고, 이를 마코프 보조 과정 ηₙ = (X_{n-d-1,n}, Πₙ) 에 적용한다. ηₙ는 상태 x 와 후방 확률 α 를 포함하는 마코프 체인이다. 5. **동적 프로그래밍 연산자** 연산자 T 와 Q 를 각각 T u(x,α)=E_x

원본 논문

고화질 논문을 불러오는 중입니다...

댓글 및 학술 토론

Loading comments...

의견 남기기