연합 인과 표현 학습을 통한 분산 상태공간 시스템의 반사실 추론

본 논문은 고차원 센서 데이터를 보유한 산업 현장 자산들을 개별적인 프라이버시를 유지하면서도, 서로의 제어 입력 변화가 다른 자산에 미치는 영향을 추론할 수 있는 연합 학습 프레임워크를 제안한다. 각 클라이언트는 자체 모델로 고차원 관측을 저차원 잠재 상태로 변환하고, 중앙 서버는 이 잠재 상태와 제어 입력을 이용해 전역 상태 전이 행렬 A와 입력 행렬 B를 추정한다. 이를 통해 클라이언트는 다른 클라이언트의 제어 변화에 대한 반사실(count…

저자: Nazal Mohamed, Ayush Mohanty, Nagi Gebraeel

연합 인과 표현 학습을 통한 분산 상태공간 시스템의 반사실 추론
**1. 서론** 산업 현장의 설비들은 지리적으로 분산돼 있으면서 물리·제어 흐름을 통해 강하게 결합된다. 한 설비의 제어 변화가 다른 설비에 미치는 인과적 영향을 파악하는 것이 위험 관리와 최적 운영에 필수적이다. 그러나 각 설비는 고차원 센서 데이터를 보유하고 있으며, 데이터 프라이버시와 통신 비용 때문에 원시 데이터를 중앙에 모으는 것이 불가능하고, 기존 그랜저 인과성 분석은 제어 입력을 직접 조작하는 반사실 질문을 다루지 못한다. **2. 관련 연구** 그랜저 인과성, 구조적 인과 모델, 동적 베이지안 네트워크 등은 중앙집중식 가정하에 개발돼 왔으며, 연합 학습을 이용한 인과 탐색도 존재하지만 모두 연관성(association) 혹은 구조 회복에 머물러 반사실 의미를 제공하지 않는다. 인과 표현 학습과 인버리언트 위험 최소화 등 최신 방법도 원시 데이터 접근을 전제로 한다. **3. 사전 지식** 선형 시간불변(LTI) 상태공간 모델을 도입하고, 상태 hₜ, 입력 uₜ, 관측 yₜ 로 구성한다. 상태 전이 행렬 A, 입력 행렬 B, 출력 행렬 C 로 시스템을 기술한다. 또한 구조적 인과 모델(SCM) 관점에서 입력 uₜ₋₁을 외생 변수로, 상태와 관측을 내생 변수로 본다. 평균 처리 효과(ATE)는 C B (u₁‑u₀) 로 표현됨을 제시한다(Prop. 4.1). **4. 문제 정의** 다중 클라이언트(각 설비) 시스템을 고려한다. 각 클라이언트 m은 고차원 관측 yₜᵐ (Dₘ≫Pₘ)와 입력 uₜᵐ 를 가지고 있다. 목표는 다른 클라이언트 n의 입력 변화가 클라이언트 m의 관측에 미치는 인과 효과 Cₘₘ Bₘₙ Δu 를 추정하는 것이다. 제약은 (1) 원시 yₜᵐ 은 공유되지 않음, (2) 통신량 제한, (3) 각 클라이언트는 자체 모델을 수정할 수 없음이다. **5. 연합 학습 방법론** - **5.1 기존 클라이언트 모델**: 각 클라이언트는 자체 블록 Aₘₘ, Bₘₘ, Cₘₘ 를 이용해 Kalman 필터를 실행, 예측 상태 hₜₘ,ᶜ 와 정제 상태 ĥₜₘ,ᶜ 를 얻는다. 이는 로컬에서만 가능하고, 오프‑다이아고날 Aₘₙ, Bₘₙ 을 반영하지 못한다. - **5.2 확장된 클라이언트 모델**: 두 학습 파라미터 ϕₘ (오프‑다이아고날 보정)와 θₘ (관측 재구성) 를 도입한다. 확장된 예측식(4)과 정제식(5)을 통해 hₜₘ,ₐ , ĥₜₘ,ₐ 를 계산하고, 재구성 손실 Lₘ,ₐ (식 6) 로 로컬 업데이트를 수행한다. - **5.3 서버 역할**: 모든 클라이언트가 전송한 {ĥₜₘ,ₐ , uₜᵐ } 를 집계해 전역 A와 B 를 최소제곱으로 추정한다. 서버는 또한 전체 손실 Lₛ 를 정의하고, ∇hₜₘ,ₐ Lₛ , ∇ĥₜ₋₁ₘ,ₐ Lₛ 를 클라이언트에 전송한다. - **5.4 파라미터 업데이트**: 클라이언트는 체인 룰을 이용해 (7)(8) 식으로 서버 그래디언트를 θₘ, ϕₘ 에 대한 미분값으로 변환하고, 로컬 학습률 η₁, η₂, γ₁, γ₂ 로 혼합 업데이트(9)(10)를 수행한다. 이를 통해 로컬 파라미터가 전역 Aₘₙ, Bₘₙ 의 정보를 인코딩한다(Claim 5.3). **6. 이론적 분석** - **수렴성**: 연합 알고리즘이 전역 최적해(모든 원시 데이터를 이용한 중앙 오라클)로 확률적 수렴함을 증명한다. 핵심은 각 클라이언트의 추정 오차가 서버 업데이트에 의해 점차 감소하고, 전체 손실이 강한 볼츠만-라그랑주 형태를 만족한다는 점이다. - **프라이버시**: 전송되는 그래디언트와 잠재 상태에 가우시안 잡음을 추가해 (ε,δ)-차등 프라이버시를 보장한다. 잡음 규모는 클라이언트 수와 민감도에 따라 조정 가능하며, 실험에서 유용한 정확도-프라이버시 트레이드오프를 확인한다. **7. 실험** - **합성 데이터**: 5~20개의 클라이언트, 각 50차원 상태, 200차원 관측을 가진 LTI 네트워크를 생성. 제안 방법은 Bₘₙ 을 평균 4% 오차로 복원하고, 반사실 ATE 예측에서 RMSE 0.07을 달성, 기존 그랜저 기반 방법 대비 30% 개선. - **실제 산업 데이터**: 석유 정제 공정의 유량·압력 센서 데이터를 사용. 클라이언트는 각 공정 구간, 입력은 밸브 개방도. 제안 프레임워크는 상류 유량 감소가 하류 안정성에 미치는 영향을 0.92의 상관계수로 정확히 예측, 기존 방법은 0.68 수준. - **확장성**: 클라이언트 수를 10배 늘려도 통신량은 잠재 차원(≈10) × 2 (예측·정제) 로 유지, 학습 시간은 선형 증가. **8. 논의 및 한계** 선형 가정과 C 행렬의 블록 대각성은 많은 실제 시스템에 근사적으로 적용 가능하지만, 비선형 동역학이나 센서 간 교차 의존성이 강한 경우 추가 비선형 확장(예: EKF 기반 잠재 추정) 이 필요하다. 또한 차등 프라이버시를 위한 잡음 삽입이 매우 작은 데이터셋에서는 성능 저하를 일으킬 수 있다. **9. 결론** 본 논문은 고차원 산업 데이터의 프라이버시를 보존하면서도, 분산된 환경에서 인과적 반사실 추론을 가능하게 하는 최초의 연합 인과 표현 학습 프레임워크를 제시한다. 이론적 수렴성, 차등 프라이버시 보장, 그리고 합성·실제 데이터에서의 실증적 검증을 통해 실용성을 입증하였다. 향후 연구는 비선형 시스템, 동적 클라이언트 참여/탈퇴, 그리고 실시간 제어와의 통합을 목표로 한다.

원본 논문

고화질 논문을 불러오는 중입니다...

댓글 및 학술 토론

Loading comments...

의견 남기기