부분관측 확률선형 스택엘버그 게임: 포아송 점프와 평균 분산 기준의 새로운 해법

부분관측 확률선형 스택엘버그 게임: 포아송 점프와 평균 분산 기준의 새로운 해법
안내: 본 포스트의 한글 요약 및 분석 리포트는 AI 기술을 통해 자동 생성되었습니다. 정보의 정확성을 위해 하단의 [원본 논문 뷰어] 또는 ArXiv 원문을 반드시 참조하시기 바랍니다.

초록

본 논문은 부분관측 환경에서 브라운 운동과 포아송 점프를 포함한 선형 확률 시스템을 대상으로, 평균‑분산 목표를 가진 스택엘버그(리더‑팔로워) 게임을 연구한다. 제어와 상태 사이의 순환 의존성을 해소하기 위해 직교 분해 기법과 비선형 필터링을 결합하고, 이를 완전 관측 형태의 LQ 문제로 변환한다. 최종적으로 리더와 팔로워의 관측가능 상태 피드백 균형을 Riccati 방정식 체계로 제시한다.

상세 분석

이 연구는 세 가지 핵심 난관을 동시에 해결한다. 첫째, 상태가 직접 관측되지 않아 팔로워와 리더 각각이 서로 다른 관측 프로세스(Y₁, Y₂)를 통해 부분 정보를 얻는다. 이를 위해 저자들은 포아송 랜덤 측정이 포함된 비선형 스토캐스틱 필터링 방정식을 새롭게 도출하고, 필터링 오차 ˜X와 추정값 ˆX를 직교 분해한다. 특히, 포아송 점프가 존재할 경우 조건부 공분산 행렬 Σ(t)가 확률 과정으로 변동한다는 점을 명시하고, Σ(t)의 동역학을 SDE 형태로 제시함으로써 기존의 칼만‑부시(Kalman‑Bucy) 필터와 차별화한다.

둘째, 평균‑분산 비용은 위험 회피 성향을 반영하는 비선형 함수이지만, 이를 직접 다루면 HJB 방정식이 복잡해진다. 저자들은 Zhou‑Li의 임베딩 정리를 활용해 평균‑분산 목표를 선형‑이차(LQ) 형태로 변환한다. 구체적으로, 비용 J_i(u₁,u₂)=E


댓글 및 학술 토론

Loading comments...

의견 남기기