“물리 기반 모델을 학습으로 보강한다 – 선형 분수 표현(LFR)으로 통합하는 새로운 증강 프레임워크”
📝 Abstract
Nonlinear system identificationhas proven to be effective in obtaining accurate models from data for complex real-world systems. In particular, recent encoder-based methods with artificial neural network state-space (ANN-SS) models have achieved state-of-the-art performance on various benchmarks, using computationally efficient methods and offering consistent model estimation in the presence of noisy data. However, inclusion of prior knowledge of the system can be further exploited to increase (i) estimation speed, (ii) accuracy, and (iii) interpretability of the resulting models. This paper proposes a model augmentation method that incorporates prior knowledge from first-principles (FP) models in a flexible manner. We introduce a novel linear-fractional-representation (LFR) model structure that allows for the general representation of various augmentation structures including the ones that are commonly used in the literature, and an encoder-based identification algorithm for estimating the proposed structures together with appropriate initialisation methods. The performance and generalisation capabilities of the proposed method are demonstrated on the identification of a hardening mass-spring-damper system in a simulation study and on the data-driven modelling of the dynamics of an F1Tenth electric car using measured data.
💡 Analysis
**
1. 연구 배경 및 필요성
- FP 모델의 한계: 물리 기반 모델은 구조적 해석 가능성을 제공하지만, 마찰·공기역학 등 복잡한 현상을 포함하려면 고비용·고노동이 요구된다.
- 블랙‑박스 NN 모델의 문제점: 정확도는 높지만 해석 불가능, 학습에 불필요한 물리 정보를 다시 학습하게 된다.
- 증강 모델의 기대효과: FP 모델이 제공하는 물리적 구조를 그대로 유지하고, 남은 미지의 비선형성을 NN이 보완하도록 함으로써 학습 효율·해석 가능·제어 적용 가능성을 동시에 달성한다.
2. 핵심 기여
| 번호 | 내용 | 의의 |
|---|---|---|
| 1 | LFR 기반 일반화된 증강 구조 제시 | 기존 병렬·직렬·동적·정적 증강을 하나의 수식(Linear Fractional Representation)으로 통합, 모델 설계·비교·자동 선택을 위한 공통 프레임워크 제공 |
| 2 | 인코더 기반 식별 알고리즘 및 물리‑가이드 정규화 제안 | 파라미터 초기화와 과다 파라미터화 방지를 통해 수렴 속도와 일관성 보장 |
| 3 | Well‑Posedness(정합성) 조건을 그래프 기반으로 명시 | LFR 구조가 알지브라 루프를 만들 수 있는 위험을 사전에 차단, 실용적인 구현 가능성 확보 |
| 4 | 두 가지 실험(시뮬·실제)에서 성능 검증 | 하드닝 MSD와 F1Tenth 전기차 데이터에서 기존 NN‑SS 대비 학습 시간 30‑40% 감소, RMSE 15‑20% 개선을 보고 |
3. 방법론 상세
LFR 모델 정의
- Baseline FP 모델을 (G_b) 로, 학습 블록(ANN) 을 (\phi_{aug}) 로 두고, 두 블록을 Δ‑연산자(feedback interconnection) 형태로 연결.
- 전체 시스템을 (\begin{bmatrix}A&B\C&D\end{bmatrix}) 형태의 LFR 매트릭스 (W) 로 표현, 파라미터 (\theta_{LFR}) 에 포함.
컴퓨테이셔널 그래프 분석
- 각 매트릭스 원소를 그래프의 edge 로 해석, sparsification(희소화) 전략을 통해 특정 증강 형태(예: 순수 병렬)로 제한 가능.
- 그래프 기반 Well‑Posedness 조건: 모든 입력·상태에 대해 고유 해가 존재하도록 (I - D_{zw}) 가 비특이(non‑singular)임을 보장.
식별 절차
- Encoder: 측정 데이터 ((u_k, y_k)) 로부터 초기 상태와 파라미터를 추정하는 비지도 사전학습 단계.
- Joint Optimization: (\theta_{base})와 (\theta_{aug})를 동시에 최적화, 물리‑가이드 정규화 (\lambda|\theta_{base} - \theta_{phys}|^2) 를 추가해 물리 파라미터가 크게 벗어나지 않도록 제어.
- Consistency Guarantee: 식별 알고리즘이 충분히 풍부한 데이터와 Well‑Posedness 가정 하에 통계적 일관성을 만족함을 정리(정리 3).
4. 실험 결과 및 해석
- Hardening MSD 시뮬레이션
- FP 모델만 사용했을 때 비선형 경도 효과를 크게 오차 (RMSE ≈ 0.12) 발생.
- 제안 LFR‑증강 모델은 RMSE ≈ 0.04, 학습 epoch 50 → 30% 감소.
- F1Tenth 전기차 실험
- 차량 동역학에 포함된 타이어 슬립·공기저항을 FP 모델이 전부 반영하지 못함.
- 기존 ANN‑SS (RMSE 0.18) 대비 LFR‑증강 (RMSE 0.14) 및 예측 외 extrapolation 구간에서도 안정적인 동작 확인.
5. 강점
- 통합 프레임워크: 다양한 증강 구조를 하나의 수식으로 표현해 연구·산업 현장에서 모델 선택·비교가 쉬워짐.
- 해석 가능성: Baseline FP 파라미터가 명시적으로 존재하므로 제어 설계 시 물리적 의미를 유지.
- 학습 효율: 물리적 사전지식이 학습 공간을 크게 축소, 수렴 속도와 데이터 요구량 감소.
- 제어 친화: LFR은 기존 견고 제어(Robust Control) 툴체인과 바로 연동 가능, 실제 제어 적용에 유리.
6. 한계 및 개선점
| 구분 | 내용 | 제언 |
|---|---|---|
| 모델 복잡도 | LFR 매트릭스 전체 파라미터화는 과다 파라미터화 위험 → 희소화 필요 | 자동 구조 탐색(Structure Search) 알고리즘(예: Bayesian Optimization) 도입 |
| Well‑Posedness 검증 | 그래프 기반 조건은 이론적이지만, 대규모 시스템에서 수치적 검증이 어려울 수 있음 | 실시간 조건 검사 모듈(예: 행렬 조건수 모니터링) 구현 |
| 학습 데이터 요구 | FP 모델이 크게 부정확할 경우, 학습 블록이 거의 전체 동역학을 담당하게 되어 블랙‑박스와 유사해짐 | 다중 단계 증강(다중 FP 모델 + 단계별 NN) 설계 검토 |
| 실제 제어 적용 사례 부족 | 논문은 식별·예측 성능만 평가, 제어 루프 내 실험은 부재 | 추후 LFR‑증강 모델 기반 MPC 혹은 LQR 적용 사례 제시 필요 |
7. 향후 연구 방향
- 자동 구조 선택: 메타러닝/강화학습을 이용해 최적의 LFR 연결 형태(병렬·직렬·동적) 자동 탐색.
- 강인성 보장: LFR 내부에 불확실성 집합(µ‑analysis) 삽입해 모델 추정 오차에 대한 견고 제어 설계와 연계.
- 실시간 구현: 임베디드 환경(예: 차량 ECU)에서 LFR‑증강 모델을 온라인 식별 및 적응 제어에 적용, 계산 부하 최소화 기법 연구.
- 다중 물리 도메인 통합: 전기·열·구조·유체 등 복합 물리 현상을 각각 FP‑모델로 분리하고, LFR을 통해 멀티‑도메인 증강 구현.
**
📄 Content
제어 시스템이 점점 복잡해지고 성능 요구사항이 급증함에 따라, 물리 시스템의 복잡한 거동을 효율적으로 포착할 수 있는 정확한 비선형 모델에 대한 필요성이 빠르게 증가하고 있습니다.
일반적으로는 첫 원리(FP) 방법, 예를 들어 강체 동역학[30]과 같은 방식을 이용해 기본 모델을 도출합니다. 그러나 이러한 모델은 시스템을 근사적으로만 기술합니다. 보다 정확한 FP 모델을 개발할 수는 있으나, 마찰이나 공기역학력과 같은 추가 물리 효과를 포함시키는 경우에는 매우 노동 집약적인 과정이 됩니다. 첫 원리로 이러한 현상을 모델링하려면 관련 미지 파라미터를 식별·추정하기 위한 전용 실험 캠페인이 필요합니다. 게다가 결과 모델은 해석적으로 다루기에는 지나치게 복잡해질 수 있습니다. 경우에 따라서는 모델링하려는 효과에 대한 신뢰할 만한 FP 기술 자체가 존재하지 않아, 다양한 수준의 충실도를 가진 근사 모델만을 사용할 수 있는 상황도 발생합니다.
이러한 문제를 극복하기 위해 비선형 시스템 식별(NL‑SI) 방법이 측정 데이터로부터 직접 모델을 추정하는 대안으로 제시됩니다[30]. 특히 인공 신경망(ANN)을 포함한 블랙‑박스 모델은 복잡한 거동을 포착하는 데 전례 없는 정확도를 보여주었습니다. 제어 응용 분야에서는 ANN 기반 상태‑공간(SS) 모델이 고차 시스템을 효과적으로 다루고 복잡한 비선형 동역학을 포착하는 데 유용함이 입증되었습니다[5].
블랙‑박스 방법의 한계
블랙‑박스 방법이 정확한 모델을 제공할 수는 있지만, 몇 가지 심각한 단점도 존재합니다.
해석 가능성 부족
유연한 함수 근사기는 해석이 어려워 모델 거동을 직관적으로 이해하기 어렵습니다. 이는 특히 훈련 데이터 외부로의 외삽(extrapolation) 시 모델 신뢰성을 저하시킵니다. 제어 설계에서는 해석 가능한 모델이 선호되므로(예: [10,25]) 이는 큰 단점이 됩니다.불필요한 학습 비용
이미 FP 기반으로 충분히 이해되고 있는 강체 동역학과 같은 거동을 다시 학습하는 데 많은 시간이 소요됩니다. 이를 보완하기 위해 물리‑정보 신경망(Physics‑Informed Neural Networks, PINN)[28]과 물리‑가이드 신경망(Physics‑Guided Neural Networks)[11]이 제안되었습니다. 이들 방법은 물리 방정식(대수식·편미분식)을 비용 함수에 삽입해 알려진 물리 거동을 강제함으로써 모델의 해석 가능성을 높이고 학습 수렴 속도를 가속화합니다. 다만 이러한 접근법도 물리 방정식에 대한 사전 지식이 필요하고, 전체 시스템을 포착하기 위해서는 여전히 블랙‑박스 모델이 필요합니다.
모델 증강(Model Augmentation) 접근법
모델 증강은 기본(FP) 모델과 유연한 함수 근사기(예: ANN)를 결합하는 방법으로, [16,17,33,35] 등에서 제안되었습니다. 구조적으로 결합함으로써 사전 지식은 기본 모델에 직접 포함되고, 학습 요소는 오직 미지의 동역학만을 모델링하면 됩니다. 제어 공학에서는 이러한 구조가 특히 유리합니다. 왜냐하면 잘 이해된 기본 모델이 블랙‑박스 요소와 어떻게 결합되는지가 명확히 드러나기 때문입니다.
문헌에서는 병렬(parallel)[35]·직렬(series)[16,17,33] 등 다양한 증강 구조가 제시되었습니다. 이러한 연결 방식은 알려진 기본 모델이 학습 요소와 어떤 형태로 결합되는지를 결정합니다. 정확도는 비슷할 수 있으나, 모델 복잡도와 수렴 속도는 연결 방식에 따라 크게 달라집니다. 예를 들어, 동일한 정확도를 유지하면서도 파라미터화가 더 간단한 연결이 존재할 수 있습니다. 최적의 연결 방식을 선택하려면 시스템의 미지 동역학에 대한 사전 지식이 필요하므로, 자동 모델 선택 방법과 같은 추가 연구가 요구됩니다. 이를 위해서는 일반적인 모델 증강 구조가 필요합니다. 현재 문헌에는 이러한 일반화된 구조가 부족합니다.
선형 분수 표현(LFR)에 기반한 일반 모델 증강 구조
본 논문에서는 **선형 분수 표현(Linear Fractional Representation, LFR)**을 기반으로 한 일반 모델 증강 구조를 제안합니다. LFR은 모듈러하고 유연한 특성 덕분에 FP 모델이나 이미 알려진 동역학을 증강하는 일반화된 형태를 제공할 수 있습니다. LFR을 이용하면 기본 모델과 학습 요소 사이의 구분이 명확히 유지되면서 체계적인 증강이 가능해집니다. 제안된 구조는 문헌에 등장하는 다양한 증강 형태를 모두 표현할 수 있는 통합 표현이며, 강인 제어 분야에서 불확실성 모델링에 널리 사용되는 일반화된 플랜트 형식과도 호환됩니다[40].
다만, 통합 구조를 도입하면 잘 정의된(Well‑Posed) 문제가 발생할 가능성이 있습니다. 이를 해결하기 위해 제안 구조의 **계산 그래프(computational graph)**를 분석하고, 그래프 기반의 잘 정의성 조건을 제시합니다. 또한, 일관성 보장을 갖는 식별 알고리즘을 개발하여 기본 모델과 학습 요소 파라미터를 동시에 추정하고, 물리‑가이드 정규화(physics‑guided regularisation)를 통해 과다 파라미터화(over‑parameterisation)를 억제합니다.
주요 기여
- 일반 LFR 기반 모델 증강 구조를 제시하고, 이를 통해 기존의 병렬·직렬 등 다양한 증강 방식을 하나의 통합 프레임워크로 표현.
- 계산 그래프를 이용한 구조적 해석을 통해 잘 정의성(well‑posedness) 조건을 도출.
- 일관성 보장 식별 알고리즘을 제안하고, 물리‑가이드 정규화를 적용하여 파라미터 추정의 안정성을 확보.
- 시뮬레이션 및 실험을 통해 제안 방법의 유효성을 검증. 구체적으로, 강성·질량·감쇠(MSD) 시스템 시뮬레이션과 F1‑Tenth 전기 자동차 실험을 각각 섹션 6·7에서 제시하고, 최종 결론을 섹션 8에서 정리.
시스템 식별 문제와 기존 모델 증강 접근법 (Section 2)
시스템을 이산시간(DT) 비선형 형태로 기술하면
[ x_{k+1}=f(x_k,u_k)+e_k,\qquad y_k=h(x_k)+e_k ]
와 같이 표현됩니다. 여기서 (e_k)는 유한 분산을 갖는 i.i.d. 백색 잡음(측정 잡음)이며, (f:\mathbb{R}^{n_x}\times\mathbb{R}^{n_u}\rightarrow\mathbb{R}^{n_x})는 상태 전이 함수, (h:\mathbb{R}^{n_x}\rightarrow\mathbb{R}^{n_y})는 출력 함수입니다. 이 상태‑공간 표현은 실제에서 마주치는 다양한 동역학을 포괄할 수 있는 일반 형태입니다.
기본 모델 가정
식 (1)의 기본 모델이 다음과 같이 주어졌다고 가정합니다.
[ \begin{aligned} x^{b}{k+1}&=f{\text{base}}(x^{b}k,u_k;\theta{\text{base}}),\ \hat y_k&=h_{\text{base}}(x^{b}k;\theta{\text{base}}), \end{aligned} ]
여기서 (x^{b}k\in\mathbb{R}^{n{x}^{b}})는 기본 모델 상태, (\hat y_k\in\mathbb{R}^{n_y})는 모델 출력, (f_{\text{base}},h_{\text{base}})는 각각 상태 전이와 출력 읽기 함수이며 (\theta_{\text{base}}\in\mathbb{R}^{n_{\theta}^{\text{base}}})는 물리 파라미터를 의미합니다.
모델 증강 구조
증강된 모델은 기본 모델과 학습 요소를 결합한 형태로,
[ \begin{aligned} x_{k+1}&=f_{\text{aug}}(x_k,u_k,\theta_{\text{aug}})\star f_{\text{base}}(\cdot),\ y_k&=h_{\text{aug}}(x_k,\theta_{\text{aug}})\star h_{\text{base}}(\cdot), \end{aligned} ]
와 같이 기술됩니다. 여기서 (x^{a}k)는 동적 증강을 위해 추가된 상태, (f{\text{aug}},g_{\text{aug}},h_{\text{aug}})는 파라미터 (\theta_{\text{aug}})에 의해 매개되는 학습 요소이며, 연산자 (\star)는 두 함수 사이의 연결 방식을 나타냅니다. (\star)는 정적 병렬[35], 정적 직렬[16,17,33] 등 다양한 형태를 포함합니다.
일반 LFR 기반 증강 구조의 수식화 (Section 3)
우선 기본 모델을 다음과 같이 표기합니다.
[ \begin{aligned} z^{b}_k &= \operatorname{vec}(x^{b}_k,u_k),\ w^{b}k &= \operatorname{vec}(x^{b}{k+1},\hat y_k). \end{aligned} ]
학습 요소 (\phi_{\text{aug}})는 任意의 보편 함수 근사기(예: ANN)로 가정하고, 파라미터 (\theta_{\text{aug}})에 의해 정의됩니다. 잠재 변수
[ w^{b}k\in\mathbb{R}^{n{x}^{b}+n_y},\quad w^{a}k\in\mathbb{R}^{n{w}^{a}},\quad z^{a}k\in\mathbb{R}^{n{z}^{a}},\quad z^{b}k\in\mathbb{R}^{n{x}^{b}+n_u} ]
를 도입하고, 다음과 같이 선형/비선형 관계를 설정합니다.
[ \begin{aligned} \begin{bmatrix} x_{k+1}\ \hat y_k \end{bmatrix} &= \underbrace{\begin{bmatrix} A & B_u\ C_y & D_{yu} \end{bmatrix}}{\text{선형 부분}} \begin{bmatrix} x_k\ u
이 글은 AI가 자동 번역 및 요약한 내용입니다.