시스템 식별을 위한 가우시안 프로세스 활용
본 논문은 가우시안 프로세스(GP)를 이용한 시스템 식별 방법들을 개관한다. GP 회귀의 기본 이론, 하이퍼파라미터 학습, 계산 복잡도 감소 기법을 소개하고, NFIR, NARX, NOE 등 다양한 시계열 모델에 GP를 적용하는 구조를 설명한다. 또한 상태공간 모델(GPSS)에서 동적·측정 모델을 GP로 학습하는 방법과, 상태가 관측되지 않을 때의 마진화·근사 기법들을 논의한다.
저자: Simo S"arkk"a
본 논문은 가우시안 프로세스(GP)를 시스템 식별에 적용하는 주요 방법들을 포괄적으로 정리한다. 먼저 GP 회귀의 기본 수학적 틀을 소개한다. 함수 f(z)는 평균 m(z)와 커널 k(z,z′)로 정의된 GP로 가정하고, 관측값 yₖ = f(zₖ)+εₖ(εₖ∼N(0,σₙ²))와 함께 베이즈 정리를 적용해 사후 평균과 공분산을 얻는다. 평균은 보통 0으로 두고, 커널은 제곱 지수(k_SE)나 매터른 등 다양한 형태를 선택한다. 하이퍼파라미터(스케일 s, 길이 ℓ 등)는 주변가능도 최대화 혹은 베이지안 사후 추정으로 학습한다. 그러나 전통적인 GP 회귀는 N개의 데이터에 대해 O(N³) 연산 복잡도를 가지므로, 유도점(sparse) 근사, 스펙트럴 전개, 랜덤 베이스 확장 등으로 계산량을 감소시키는 방법들을 논의한다.
다음으로 시계열 모델에 GP를 적용하는 네 가지 대표 구조를 설명한다. ① GP‑NFIR 모델은 현재 출력 ŷₖ = f(uₖ₋₁,…,uₖ₋ₘ) 형태로, 입력 히스토리를 레그레서 벡터 zₖ에 넣어 GP 회귀로 학습한다. ② GP‑NARX 모델은 출력과 입력 히스토리를 모두 포함한 yₖ = f(yₖ₋₁,…,yₖ₋ₙ, uₖ₋₁,…,uₖ₋ₘ)+εₖ 로, 비선형 동적 관계를 직접 학습한다. ③ GP‑NOE 모델은 이전 단계의 GP 예측값 ŷₖ₋₁,…, ŷₖ₋ₙ을 피드백으로 사용해 yₖ = f(ŷₖ₋₁,…, ŷₖ₋ₙ, uₖ₋₁,…, uₖ₋ₘ)+εₖ 로 구성되며, 피드백 루프 때문에 학습 시 근사(예: 선형화, 샘플링)가 필요하다. ④ 확장형으로 GP‑NARMAX·NJB 모델이 제시되며, 이동 평균(MA) 항을 포함해 더욱 일반적인 비선형 구조를 표현한다.
상태공간 모델(GPSS)에서는 동적 함수 f(xₖ,uₖ)와 측정 함수 g(xₖ,uₖ)를 각각 GP로 모델링한다. 상태가 완전히 관측되는 경우, 두 함수는 독립적인 GP 회귀로 학습 가능하고, 모멘트 매칭 기반의 가우시안 필터와 스무터가 적용된다. 이는 로봇 제어 등 실시간 시스템에 유용하다. 상태가 관측되지 않을 때는 GP를 마진화하여 비마코프식 사전 분포를 얻고, 파티클 MCMC, 파티클 EM 등 샘플링 기반 추정법을 사용한다. 또한, 카루넨–뢰베 전개나 유도점 변분법을 통해 GP를 유한 차원 파라미터화하고, 기존 파라미터 추정 기법을 그대로 적용한다. 이러한 근사 방법은 계산 효율성을 크게 향상시키면서도 모델 정확성을 유지한다.
마지막으로 논문은 GP 기반 시스템 식별이 갖는 장점(비모수적 유연성, 불확실성 정량화)과 한계(계산 복잡도, 피드백 구조 학습의 어려움)를 정리하고, 현재 연구 동향과 향후 과제(실시간 구현, 대규모 데이터 처리, 하이브리드 모델링) 등을 제시한다. 전체적으로 본 논문은 GP를 이용한 다양한 식별 프레임워크와 학습·추정 기법을 체계적으로 정리함으로써, 연구자와 실무자가 적절한 모델을 선택하고 구현하는 데 실질적인 지침을 제공한다.
원본 논문
고화질 논문을 불러오는 중입니다...
댓글 및 학술 토론
Loading comments...
의견 남기기