비선형 상태공간 식별을 위한 가이드 잔차 탐색
초록
**
본 논문은 초기 선형 모델을 기반으로 비선형 잔차 동역학을 단계별로 추정하고, 다중촬영(multiple‑shooting) 최적화를 통해 파라미터를 정밀하게 재조정하는 새로운 비선형 상태공간 식별 프레임워크를 제안한다. 가이드 잔차 탐색 단계에서 비선형 잔차를 효율적으로 추정하고, 이후 신경망으로 비선형 부분을 학습한 뒤, 최종 단계에서 시뮬레이션 오류 누적을 억제하기 위해 다중촬영 기법을 적용한다. 두 개의 실험 벤치마크(Silverbox, F‑16 진동 테스트)에서 기존 블랙‑박스 방법들과 비교해 경쟁력 있는 정확도와 향상된 수렴성을 보였다.
**
상세 분석
**
이 연구는 비선형 상태공간 모델의 파라미터 추정이 고차원 비선형 최적화 문제로 변하면서 지역 최소점에 빠지기 쉽고, 재귀 시뮬레이션 시 기울기 소실·폭발 문제가 심각해지는 점을 정확히 지적한다. 이를 해결하기 위해 저자는 NL‑LFR(Nonlinear Linear Fractional Representation) 구조를 채택한다. NL‑LFR은 선형 동역학(A, B_u, C_y, D_yu)과 정적 비선형성(f_NN) 사이를 피드백으로 연결해, 선형 부분을 먼저 식별하고 비선형 잔차를 별도로 추정할 수 있는 자연스러운 분해를 제공한다.
핵심 기여는 세 단계로 구성된 순차적 식별 전략이다.
1️⃣ 가이드 잔차 탐색 (Guided Residual Search): 초기 선형 모델 M₀을 고정하고, B_w와 D_yw를 포함한 파라미터 θ_wy를 추정한다. 여기서는 이중 레벨(bilevel) 최적화를 도입해, 내부 문제에서는 제한된 윈도우(H+1) 내에서 w와 상태 x를 비선형 최소제곱 방식으로 추정하고, 외부 문제에서는 θ_wy를 업데이트한다. 슬라이딩 윈도우와 정규화된 관측가능 행렬 O_x, Toeplitz 행렬 T_u, T_w를 활용해 폐쇄형 해를 얻음으로써 계산 효율성을 크게 높인다. 또한, 상태 정규화를 위해 T_x 대각 행렬을 사용해 단위 분산을 맞추어 수치적 안정성을 확보한다.
2️⃣ 비선형 잔차 학습: 가이드 잔차 탐색으로 얻은 (w*, x*) 데이터를 독립 샘플로 가정하고, 정적 비선형성 f_NN을 피드포워드 신경망으로 학습한다. C_z와 D_zu는 균등 초기화, 신경망 가중치는 Xavier 초기화로 시작한다. 손실 함수는 w와 신경망 출력 ˆw 사이의 평균 제곱 오차이며, GPU 병렬 처리를 통해 대규모 데이터에서도 빠르게 최적화한다.
3️⃣ 다중촬영 최적화 (Multiple Shooting): 비선형 잔차를 포함한 전체 NL‑LFR 모델을 최종적으로 재조정한다. 여기서 중요한 이론적 결과는 Theorem 1으로, 한 단계 예측 오차 ε가 시뮬레이션 길이 N에 대해 O(L^{N‑1} ε) 만큼 기하급수적으로 증폭될 수 있음을 증명한다(L은 Lipschitz 상수, 일반적으로 >1). 따라서 전체 시뮬레이션을 하나의 긴 구간으로 최적화하면 수렴이 어려워진다. 이를 방지하기 위해 시뮬레이션을 짧은 구간(d)으로 나누고, 각 구간의 시작 상태를 결정 변수로 두는 다중촬영 방식을 채택한다. 구간 길이가 짧을수록 오류 누적이 제한되어 손실 함수의 지형이 부드러워지고, 초기화된 상태와 파라미터를 그대로 활용해 최적화 효율을 유지한다.
실험에서는 Silverbox(비선형 스프링‑댐퍼)와 F‑16 진동 테스트 두 데이터셋을 사용했다. 두 경우 모두 초기 선형 모델은 BLA(Best Linear Approximation)로 얻었으며, 이후 제안된 파이프라인을 적용했다. 결과는 기존 블랙‑박스 비선형 상태공간 식별 방법(예: 전통적인 직접 다중촬영, 딥 서브스페이스 인코더 등)과 비교해 동일하거나 더 낮은 RMS 오류를 기록했으며, 특히 수렴 속도가 크게 개선되었다. 특히, 가이드 잔차 탐색 단계에서 여러 무작위 초기화를 시도하면 다양한 로컬 최소점이 생성되지만, 최종 다중촬영 단계에서 가장 좋은 초기값을 선택함으로써 안정적인 최종 모델을 얻을 수 있었다.
이 논문의 의의는 (1) NL‑LFR 구조를 활용해 선형/비선형 부분을 명확히 분리함으로써 파라미터 추정 문제를 구조화하고, (2) 이중 레벨 최적화와 슬라이딩 윈도우를 결합한 가이드 잔차 탐색으로 초기화 품질을 크게 향상시켰으며, (3) 이론적 분산 이동 현상을 정량화하고 다중촬영으로 실질적인 해결책을 제시했다는 점이다. 향후 연구에서는 비정상(non‑periodic) 데이터에 대한 자동 윈도우 길이 선택, 더 복잡한 비선형 구조(예: 다중 입력·다중 출력) 적용, 그리고 실시간 시스템 식별에 대한 확장 가능성을 탐색할 여지가 있다.
**
댓글 및 학술 토론
Loading comments...
의견 남기기