정적 자기회귀 모델의 일반화 오차 경계

본 논문은 정적(univariate) 자기회귀(AR) 모델에 대해 일반화 오차 상한을 이론적으로 도출한다. 정규성(stationarity) 가정만으로도 가우시안 복잡도(Gaussian complexity)를 충분히 제어할 수 있음을 보이며, 추가적인 정규화 없이 구조적 위험 최소화(SRM)를 통한 모델 선택이 가능함을 증명한다. 실증에서는 금리 변동 예측에 적용해 모델 선택 기준의 실효성을 확인한다.

저자: Daniel J. McDonald, Cosma Rohilla Shalizi, Mark Schervish (Carnegie Mellon University)

본 논문은 정적(univariate) 자기회귀(AR) 모델에 대한 일반화 오차(bound) 이론을 체계적으로 구축한다. 기존의 통계적 시계열 분석에서는 모델 적합도와 예측 정확도를 평가할 때 AIC, BIC와 같은 정보 기준을 주로 사용했으며, 머신러닝 분야에서는 교차 검증이나 정규화 기법을 통해 과적합을 방지했다. 그러나 이러한 방법들은 대부분 경험적이며, 정적 AR 모델 특유의 시간 의존성을 고려한 복잡도 이론이 부족했다. 저자들은 이 격차를 메우기 위해, 정적성(stationarity)이라는 자연스러운 제약만으로도 함수 클래스의 복잡도를 충분히 제어할 수 있음을 보인다. 첫 번째 단계에서는 정적 AR(p) 모델을 함수 집합 ℱp 로 정의한다. ℱp 의 원소는 과거 p개의 관측값을 선형 결합한 형태 f(x_t)=∑_{i=1}^p φ_i x_{t-i}이며, 계수 벡터 φ=(φ_1,…,φ_p)는 특성 다항식 1-∑ φ_i z^i 의 근이 단위 원 안에 존재한다는 정적성 조건을 만족한다. 이 조건은 φ가 ℓ2-볼 안에 제한된다는 의미로 해석될 수 있다. 저자들은 이 사실을 이용해 ℱp 의 가우시안 평균 복잡도(Gaussian complexity) G(ℱp)=E_σ

정적 자기회귀 모델의 일반화 오차 경계

원본 논문

댓글 및 학술 토론

의견 남기기

원본 논문

관련 논문

댓글 및 학술 토론

의견 남기기