공변량 이동을 고려한 가중치 기반 STL 추론 프레임워크
본 논문은 훈련 데이터와 배포 환경 간의 공변량 이동(covariate shift)을 명시적으로 다루는 신호시계논리(STL) 추론 방법을 제안한다. 템플릿‑프리 차별화 가능한 STL 학습기(TLINet)를 초기 모델로 사용하고, 제한된 배포‑측 데이터로 모델을 재조정한다. 이후 훈련‑배포 밀도비를 추정해 가중치 기반 비정형(conformal) 예측에 통합함으로써, 배포 시점에서도 정량적 커버리지 보장을 제공한다. 실험 결과, 제안 방법이 해석 …
저자: Yixuan Wang, Danyang Li, Matthew Cleavel
**1. 연구 배경 및 동기**
Signal Temporal Logic(STL)은 동적 시스템의 시계열 행동을 인간이 이해하기 쉬운 논리식으로 표현하고, 강건성(robustness)이라는 정량적 의미를 부여한다. 최근 차별화 가능한 STL 학습기(TLINet, STLcg 등)가 템플릿 없이 공식 구조와 파라미터를 동시에 최적화해 해석 가능성을 크게 향상시켰다. 그러나 실제 로봇·제어 시스템에서는 훈련 시 수집한 데이터와 배포 시 수집되는 데이터가 환경 변화, 센서 노이즈, 데이터 수집 편향 등으로 인해 분포가 달라지는 공변량 이동(covariate shift)이 흔히 발생한다. 기존 STL 추론은 이러한 이동을 무시하고, 교환가능성을 전제로 한 Conformal Prediction(CP)만을 적용해도 배포 시 커버리지가 크게 틀어질 위험이 있다.
**2. 문제 정의**
- **데이터 설정**: 훈련 데이터 D_train ~ P_train, 배포 데이터 D_dep ~ P_dep (조건부 라벨 분포 동일, 마진 분포만 변함), 캘리브레이션 데이터 D_cal ~ P_train.
- **목표**: STL 공식 φ_θ를 학습해 (i) 배포 분포에서의 미스클래스율(MCR)을 최소화하고, (ii) 배포 시점에서 1−α 수준의 커버리지를 보장하는 예측 집합 C_θ(X) 를 제공한다.
**3. 프레임워크 전체 흐름**
1) **초기 학습**: TLINet을 이용해 D_train에서 로지스틱 마진 손실을 최소화, 초기 파라미터 θ⁰와 공식 φ_θ⁰를 얻는다.
2) **배포‑측 데이터 활용**: D_dep을 이용해 두 가지 적응 메커니즘을 적용한다.
- **밀도비 가중치**: k‑NN 기반 밀도비 ω*(X)=p_dep(X)/p_train(X) 를 추정하고, 각 D_dep 샘플에 가중치를 부여한다.
- **강건성 정규화 손실**: 배포 데이터에서 강건성 점수 ρ_φθ(X) 의 분포를 목표 분포와 맞추도록 KL‑divergence 혹은 MMD 형태의 정규화 손실을 추가한다.
- **전체 손실**: L_total(θ)=L_train(θ)+λ₁·E_{D_dep}
원본 논문
고화질 논문을 불러오는 중입니다...
댓글 및 학술 토론
Loading comments...
의견 남기기