관측 불가능 마코프 연쇄와 원함 필터 최적 제어

본 논문은 전이율이 제어 변수에 의해 변하는 유한 상태공간 연속시간 마코프 연쇄를 다룬다. 상태를 직접 관측할 수 없으며, 외생 브라운 운동에 의해 교란되는 관측 과정만을 이용해 제어를 수행한다. Girsanov 변환을 이용해 조건부 분포(정규화되지 않은) 를 상태로 하는 분리된 제어 문제를 정의하고, 이를 원함 필터 방정식 형태로 기술한다. 마지막으로 동적 계획 방정식의 점성해 해 존재성을 증명하고, 검증 정리와 확률적 최대 원리를 제시한다.

저자: Fulvia Confortola, Marco Fuhrman

본 논문은 “관측 불가능 마코프 연쇄와 원함 필터 최적 제어”라는 제목 아래, 전이율이 제어 변수에 의해 조정되는 유한 상태공간 연속시간 마코프 연쇄를 대상으로 하는 최적 제어 문제를 체계적으로 분석한다. 연구는 크게 네 단계로 전개된다. 첫 번째 단계에서는 모델 설정을 명확히 한다. 상태 과정 \(X_t\) 는 \(\{1,\dots,N\}\) 로 이루어진 마코프 연쇄이며, 전이율 행렬 \(\Lambda(u_t) = (\lambda_{ij}(u_t))\) 는 제어 \(u_t\) 에 의존한다. 직접 관측이 불가능하므로, 관측 과정 \(Y_t\) 를 다음과 같이 정의한다. \

관측 불가능 마코프 연쇄와 원함 필터 최적 제어

원본 논문

댓글 및 학술 토론

의견 남기기

원본 논문

관련 논문

댓글 및 학술 토론

의견 남기기