가중 불확실 마코프 연쇄의 하한·상한 기대 도달 시간

본 논문은 불확실 마코프 연쇄(IMC)의 기대 도달 시간 개념을 가중치 행렬 W와 결합한 새로운 모델, 가중 불확실 마코프 연쇄(WIMC)를 제안한다. 서론에서는 전통적인 마코프 연쇄에서 기대 도달 시간이 “몇 단계”를 의미하던 것을, 실제 시스템에서는 전이마다 서로 다른 시간·비용이 소요되는 경우가 많아 이를 가중치 W(x,y)로 표현하고, 동시에 전이 확률 자체가 불확실한 상황을 모델링하기 위해 전이 행렬의 집합 𝒯를 도입한다는 동기를 제시한다. 2절에서는 기본적인 마코프 연쇄 이론을 정리하고, 가중 마코프 연쇄의 정의와 기대 도달 시간 h_{T,W}가 식(8)의 비선형 방정식을 만족함을 보인다. 여기서 가중치가 상수 c 일 경우 h_{T,cW}=c h_{T,W} 라는 스케일링 성질(Lemma 1)도 제시한다. 핵심 기술은 Proposition 1과 Corollary 1에 있다. 가중치 W≥2인 경우, 각 전이 (x→y) 에 대해 보조 상태 z_{xy}를 도입해 두 단계 전이로 분해하고, 새로운 전이 행렬 T′를 구성한다. 이 변환을 통해 가중된 기대 도달 시간 h_{T,W}와 무가중된 기대 도달 시간 h_{T′}가 동일함을 증명한다. W가 2보다 작을 경우, 전체 가중치를 c≥1 으로 스케일링해 W′=cW≥2 로 만든 뒤 동일한 변환을 적용한다. 따라서 모든 가중된 문제는 무가중된 문제로 환원될 수 있다. 4절에서는 WIMC를 정의하고, 하한·상한 기대 도달 시간 h_W, \bar h_W를 각각 inf_{T∈𝒯} h_{T,W}와 sup_{T∈𝒯} h_{T,W}로 정의한다. Lemma 2는 최소·최대값을 달성하는 전이 행렬 \hat T, \tilde T 가 집합 𝒯에 존재함을 보이며, 이는 기존 IMC에서 최소·최대 전이 연산자 𝒯 가 존재하는 것과 유사하다. 그 후 연산자 ℒ_W를 (16)식으로 정의하고, Theorem 1을 통해 하한 기대 도달 시간 h_W가 비선형 고정점 방정식 h_W = ℒ_W h_W의 유일한 해임을 증명한다. 증명은 앞서 제시한 변환을 이용해 W≥2인 경우 무가중 IMC의 고정점 존재성을 이용하고, W<2인 경우 스케일링을 적용한다. 상한 기대 도달 시간에 대해서는 ℒ_W의 supremum 버전을 사용해 동일한 고정점 성질을 얻는다(식 18). 4.1절에서는 실제 계산 방법을 제시한다. Krak(2021)의 정책 반복 알고리즘을 그대로 차용해, 현재 추정된 h^{(n)} 에 대해 각 상태 x 에 대해 T^{(n+1)}(x,·) 를 inf_{T∈𝒯_x} ∑_y T(x,y)

가중 불확실 마코프 연쇄의 하한·상한 기대 도달 시간

원본 논문

댓글 및 학술 토론

의견 남기기

원본 논문

관련 논문

댓글 및 학술 토론

의견 남기기