제어 가능한 확산을 포함한 확률 최적 제어의 이중성 이론
안내: 본 포스트의 한글 요약 및 분석 리포트는 AI 기술을 통해 자동 생성되었습니다. 정보의 정확성을 위해 하단의 [원본 논문 뷰어] 또는 ArXiv 원문을 반드시 참조하시기 바랍니다.
초록
본 논문은 확률 미분 방정식(SDE) 기반 최적 제어 문제에 대해 두 가지 이중성 표현을 제시한다. 첫 번째는 경로별(stochastic) 최적화 형태이며, 두 번째는 점별(pointwise) 최적화 형태이다. 특히 확산 항이 제어 변수에 의존하는 경우에도 이중성 결과가 성립함을 증명한다. 기존 문헌에서 다루지 못했던 비정형(비스무스) 해에 대해서도 약한 가정 하에 동일한 이중성 관계를 확장한다.
상세 분석
논문은 먼저 확률 최적 제어 문제를 일반적인 형태로 설정한다. 상태 변수 X는 시간 t부터 T까지의 구간에서 d차원 확률 미분 방정식 dXₛ = b(s,Xₛ,πₛ)ds + σ(s,Xₛ,πₛ)dWₛ 로 기술되며, 제어 π는 적합한 측정가능한 과정의 집합 U에 속한다. 목표는 보상 함수 J(t,x,π)=E
댓글 및 학술 토론
Loading comments...
의견 남기기