잠재변수와 위너 혼돈으로 배우는 확률편미분방정식
초록
본 논문은 관측된 솔루션 궤적만을 이용해 선형 SPDE의 확률 법칙을 학습하는 새로운 프레임워크를 제안한다. 공간을 스펙트럴 갈레르킨으로 축소하고, 위너 혼돈 전개를 통해 결정적 진화와 무작위 강제력을 명확히 분리한다. 이렇게 얻은 유한 차원의 ODE 시스템을 변분 베이지안 방식으로 공동 추정함으로써, 노이즈가 관측되지 않은 상황에서도 정확한 확률 구조를 복원한다. 합성 실험에서 기존 방법들을 능가하는 성능을 보인다.
상세 분석
이 논문은 선형 SPDE (dX_t = AX_tdt + dW_t) 에 대해, 직접적인 노이즈 관측 없이 솔루션 궤적만으로 전체 확률 법칙을 복원하고자 한다. 핵심 아이디어는 두 단계의 구조적 차원 축소이다. 첫 번째는 스펙트럴 갈레르킨 투영을 이용해 무한 차원의 상태 (X_t) 를 (N) 개의 고유함수 ({h_n}{n=1}^N) 에 대한 선형 결합으로 표현한다. 이때 얻어지는 유한 차원 시스템 (\tilde X_t) 은 여전히 가우시안 위너 프로세스 (fW_t) 에 의해 구동된다. 두 번째 단계는 위너‑이토 혼돈 전개를 적용해 (\tilde X_t) 를 ({\xi\alpha}) 라는 고정된 확률 기저와 시간‑의존적 결정적 계수 ({eX^{(\alpha)}(t)}) 의 곱으로 분해한다. 혼돈 차수가 1 인 경우만이 비제로가 되며, 이는 선형·가우시안 구조에서 첫 번째 차수 혼돈이 전부를 설명한다는 ‘1차 폐쇄’ 정리(Prop. 2.1)로 정리된다. 결과적으로, 각 고유모드 (h_n) 에 대한 계수는 단순한 선형 ODE (\dot eX^{(0)}{n} = -\lambda_n eX^{(0)}{n}) 와, 혼돈 계수에 대한 (\dot eX^{(\alpha)}{n}= -\lambda_n eX^{(\alpha)}{n}+ m_k(t)\langle Q^{1/2}h_\ell, h_n\rangle) 형태를 갖는다. 여기서 (\lambda_n) 은 고유값, (m_k) 는 시간 기반 함수, (Q) 는 공분산 연산자이다.
이러한 구조적 해석을 바탕으로 저자는 변분 베이지안 모델을 설계한다. 관측된 솔루션 궤적 (X^{(m)}) 을 인코더 (Enc_\phi) 가 두 종류의 잠재 변수—초기 결정적 상태 (z_0) 와 혼돈 계수 (\xi)—의 근사 사후분포 (q_\phi(z_0,\xi|X^{(m)})) 로 매핑한다. 이후 ODE 솔버가 파라미터 (\theta=(\lambda,q)) 에 의해 정의된 벡터장 (f_\theta) 를 따라 (z_t) 를 전진시킨다. 재구성 연산자 (R) 는 (z_t) 와 (\xi) 를 이용해 (12)식의 truncated Wiener chaos 표현을 평가하고, 디코더 (Dec_\gamma) 는 가우시안 관측 모델을 통해 실제 측정값과 연결한다. ELBO를 최대화하는 학습 과정은 (\phi,\theta,\gamma) 를 동시에 최적화한다.
핵심적인 기술적 기여는 다음과 같다. (1) 갈레르킨‑혼돈 결합을 통해 무한 차원 SPDE를 완전하게 유한 차원의 ODE‑혼돈 시스템으로 변환함으로써, 학습 가능한 파라미터 수를 (d=N(1+KL)) 로 명시적으로 제어한다. (2) 첫 번째 차수 혼돈만을 이용한 ‘1차 폐쇄’는 모델을 과도하게 복잡하게 만들 위험을 없애고, 선형 가우시안 구조와 완벽히 일치한다. (3) 변분 프레임워크 내에서 (z_0) 와 (\xi) 를 독립적인 잠재 변수로 다루어, 초기 조건이 공유되는 경우에도 관측 노이즈와 불완전한 데이터에 강인하게 대응한다. (4) 실험에서는 유한 차원 근사와 혼돈 차수 증가가 오류 감소에 기여함을 확인하고, 기존 신경 연산자 기반 방법들보다 높은 예측 정확도와 더 정확한 공분산 복원을 달성한다.
이러한 설계는 선형·가우시안 SPDE에 한정되지만, 갈레르킨 투영과 혼돈 전개의 일반화 가능성을 감안하면 비선형·비가우시안 상황에도 확장 가능성이 있다. 특히, 혼돈 차수를 높이거나 비선형 연산자를 고차 다항식으로 근사하면, 복잡한 확률 동역학을 동일한 잠재‑ODE 구조 안에 포함시킬 수 있다. 또한, 변분 사후분포를 더 풍부한 흐름 기반 변분 추정기로 교체하면, 잠재 변수 간 상관관계를 포착할 수 있어 모델 표현력이 크게 향상될 전망이다.
댓글 및 학술 토론
Loading comments...
의견 남기기