자유 최종 시간 적응 메쉬 공분산 스티어링을 위한 순차 볼록 프로그래밍

본 논문은 비선형 확률 미분 방정식에 대해 자유 최종 시간을 최소화하면서 평균·공분산을 목표값에 맞추는 제어 정책을 설계한다. 시간 정규화와 구간별 시간 팽창 변수를 도입해 적응형 시간 격자를 동시에 최적화하고, 곱셈형 노이즈를 포함한 1차 선형화 모델을 정확히 보존하는 이산화 방식을 제안한다. 각 SCP 서브문제는 반볼록/반정밀 공분산 스티어링 이완과 확률적 안전 제약을 포함한 반볼록 형태로 풀어낸다. 수치 실험은 드래그와 속도 의존 확산을 …

저자: Joshua Pilipovsky

본 논문은 비선형 확률 미분 방정식(SDE) 시스템에 대해 자유 최종 시간을 최소화하면서 상태의 평균과 공분산을 목표값에 맞추는 제어 정책을 설계하는 새로운 프레임워크를 제시한다. 기존의 순차 볼록 프로그래밍(SCP) 혹은 SCvx 기법은 고정된 시간 격자를 전제로 하여 결정론적 시스템에 적용돼 왔으며, 확률 시스템에 적용하려면 두 가지 주요 난관이 있다. 첫 번째는 자유 최종 시간을 포함한 최적화 문제를 고정된 구간으로 변환하는 시간 정규화와 구간별 시간 팽창(σ_k) 변수를 도입하는 방법이다. 이를 통해 물리적 시간 간격이 가변적인 적응형 메쉬를 동시에 최적화할 수 있다. 두 번째는 곱셈형 노이즈가 존재하는 경우, 확산 항이 상태·제어에 의존하므로 공분산 전파가 비선형적으로 복잡해진다. 기존 연구는 선형화 단계에서 확산을 고정하거나 무시했지만, 이는 공분산 전파 오차를 O(Δτ) 수준으로 크게 만들었다. 논문은 이러한 문제를 해결하기 위해 다음과 같은 일련의 기술적 기여를 한다. 1. **시간 정규화와 적응형 메쉬**: 최종 시간 t_f 를 변수 σ(τ) = dt/dτ 로 표현하고, τ∈

자유 최종 시간 적응 메쉬 공분산 스티어링을 위한 순차 볼록 프로그래밍

원본 논문

댓글 및 학술 토론

의견 남기기

원본 논문

관련 논문

댓글 및 학술 토론

의견 남기기