비정상 시계열을 위한 온라인 컨포멀 모델 선택 프레임워크
초록
본 논문은 비정상 시계열 환경에서 실시간으로 최적 모델을 예측하기 위해 MPS(Model Prediction Set)라는 온라인 컨포멀 추론 기반 프레임워크를 제안한다. MPS는 후보 모델들의 신뢰 집합을 지속적으로 업데이트하며, 장기적으로 지정된 오차율(ᾱ) 이하로 최적 모델을 포함하도록 보장한다. 시뮬레이션 및 실제 데이터 실험을 통해 작은 집합 크기와 높은 커버리지 정확도를 입증한다.
상세 분석
MPS는 기존 오프라인 모델 신뢰 집합(MCS)과 최신 베일리언 컨포멀 추론(BCI)을 결합한 하이브리드 구조를 갖는다. 핵심 아이디어는 매 시점 t에 관측된 손실 행렬 Lₜ를 이용해 임시 신뢰 집합 Cₜ(1‑αₜ)를 MCS 방식으로 구성하고, αₜ를 온라인 적응적으로 조정해 장기 평균 미포함률이 목표 ᾱ를 초과하지 않도록 하는 것이다. 이를 위해 논문은 다음 두 가지 메커니즘을 제시한다.
-
MCS 기반 집합 생성: 각 모델 i에 대한 손실 Lₜ,i(예: 제곱 오차)를 누적해 부트스트랩 혹은 순위 검정을 적용, 지정된 명목 오차율 β에 대해 모델을 단계적으로 제거한다. 결과는 현재까지의 데이터에 대한 “후보 집합” Cₜ(1‑β)이다.
-
BCI‑style 적응 보정: 명목 오차율 αₜ를 실시간으로 재조정한다. 구체적으로, 이전 시점까지의 커버리지(즉, Mₜ₊₁ ∈ Cₜ) 여부를 이진 지표로 기록하고, 이를 마르코프 혹은 지수 가중 평균 방식으로 누적해 목표 ᾱ와의 차이를 최소화하도록 αₜ를 업데이트한다. 이 과정은 무분포 가정 하에 유효한 마진 커버리지를 제공한다는 BCI 이론을 그대로 차용한다.
비정상성에 대한 가정이 거의 없으며, “최적 모델” 정의를 사용자가 지정한 임의의 평가 지표(예: AIC, 교차 검증, 예측 정확도)로 자유롭게 설정할 수 있다. 따라서 MPS는 통계 모델부터 블랙박스 머신러닝, 정책 선택까지 광범위한 적용이 가능하다.
실험에서는 (i) 전통적인 오프라인 단일 모델 선택(AIC, BIC, CV), (ii) 오프라인 MCS, (iii) 제안된 MPS를 비교하였다. ETTh1 데이터셋을 이용한 이동 윈도우(크기 100) 분석에서 MPS는 목표 ᾱ≈0.05에 근접한 실제 미포함률을 유지하면서 평균 집합 크기가 2~3개 수준으로 작았다. 반면 오프라인 방법은 높은 미포함률(>0.2) 혹은 전체 모델을 포함하는 과도한 집합을 생성했다. 시뮬레이션에서는 급격한 구조 변화와 서서히 변하는 계절성 모두에서 MPS가 안정적으로 커버리지를 유지함을 확인했다.
이론적 측면에서는 장기 평균 커버리지를 보장하는 식 (1)을 제시하고, αₜ의 적응 규칙이 마르코프 불평등을 만족하면 (1)의 상한 ᾱ을 초과하지 않음을 증명한다. 또한, 손실 행렬이 의존적이더라도 최근 연구의 “시계열 컨포멀” 결과를 이용해 마진 커버리지가 유지된다는 점을 강조한다.
한계점으로는 (1) 손실 행렬 계산 비용이 후보 모델 수에 선형적으로 증가한다는 점, (2) αₜ 업데이트에 사용되는 윈도우 길이와 가중치 선택이 실험적으로 조정돼야 한다는 점, (3) 비정상성의 급격한 전이 시 초기 적응 지연이 발생할 수 있다는 점을 들 수 있다. 향후 연구에서는 효율적인 서브샘플링, 다중 단계 적응(예: 변동성 추정과 결합) 및 다변량 시계열에 대한 확장 가능성을 탐색할 필요가 있다.
댓글 및 학술 토론
Loading comments...
의견 남기기