계절적 장기 기억 프로세스와 반파라메트릭 추정법
초록
본 논문은 계절적 주기가 하나 또는 두 개인 경우에 적용 가능한 계절적 분수 차분 ARIMA(SARFIMA) 모델을 제시하고, 그 모델의 정상성·가역성 조건을 규명한다. 기억 지수(d)와 계절 기억 지수(d₁, d₂)를 동시에 추정하기 위해 Reisen·Rodrigues·Palma(2006)의 로그주기법을 확장한 반파라메트릭 추정기를 개발한다. 추정기의 점근적 정규성 및 일관성을 증명하고, 몬테카를로 시뮬레이션을 통해 정확도를 검증한다. 인공 데이터와 대기오염 PM10 시계열에 적용한 결과, 제안된 방법이 기존 추정법에 비해 경쟁력 있는 성능을 보임을 확인한다.
상세 분석
이 연구는 기존의 장기 기억(time‑series) 모델링이 계절성을 충분히 반영하지 못한다는 점에 착안한다. 특히, 계절 주기가 하나뿐인 전통적 SARFIMA 모델은 다중 계절성을 가진 데이터(예: 월·주기, 일·주기 등)에 적용하기 어려운 구조적 한계를 가진다. 저자는 이러한 문제를 해결하기 위해 두 개의 계절 주기(예: s₁, s₂)를 동시에 포함하는 확장형 SARFIMA(p,d,q)(P₁,D₁,Q₁)ₛ₁(P₂,D₂,Q₂)ₛ₂ 모델을 정의한다. 여기서 d는 비계절적 분수 차분 차수, D₁·D₂는 각각의 계절적 분수 차분 차수를 나타내며, 0 < d, D₁, D₂ < 0.5 범위에서 정상성과 가역성을 보장한다. 논문은 특성다항식 φ(B)·Φ₁(B^{s₁})·Φ₂(B^{s₂})와 역특성다항식 θ(B)·Θ₁(B^{s₁})·Θ₂(B^{s₂})가 모두 단위근을 제외하고는 복소평면 안쪽에 위치하도록 하는 충분조건을 제시한다.
추정 부분에서는 Reisen et al. (2006)에서 제안한 로그주기 회귀법을 두 단계로 확장한다. 첫 단계에서는 전체 주파수 구간을 로그‑주기 그래프에 대해 선형 회귀시켜 비계절적 기억 지수 d̂를 얻고, 두 번째 단계에서는 각각의 계절 주기 s₁, s₂에 해당하는 저주파 영역을 별도로 회귀하여 D̂₁, D̂₂를 추정한다. 이때, 주파수 선택을 위한 밴드폭(bandwidth) 파라미터 m은 n^{α} (0 < α < 1) 형태로 설정하며, α의 선택이 편향·분산 트레이드오프에 미치는 영향을 이론적으로 분석한다. 점근적 결과는 (d̂, D̂₁, D̂₂)ᵀ가 평균이 실제 파라미터와 일치하고 공분산 행렬이 O(1/m)인 정규분포로 수렴함을 보인다. 또한, 모델 차수(p,q,P₁,Q₁,P₂,Q₂)가 과소/과대 지정되더라도 추정량의 일관성은 유지된다는 강건성 특성을 논증한다.
시뮬레이션에서는 n = 512, 1024, 2048 크기의 시계열에 대해 다양한 (d, D₁, D₂) 조합을 생성하고, 제안된 추정기와 기존 최대우도법, Whittle 추정법을 비교한다. 결과는 평균제곱오차(MSE)와 편향 측면에서 제안법이 특히 D̂₁, D̂₂ 추정에서 우수함을 보여준다. 특히, 두 계절 주기가 서로 겹치는 경우에도 추정량이 안정적으로 수렴한다는 점이 강조된다.
실제 데이터 적용에서는 베를린의 대기오염 PM10 측정치를 사용한다. 이 데이터는 일일 평균값에 주 주기와 연주기가 동시에 존재한다는 사전 지식을 바탕으로 s₁ = 7, s₂ = 365를 설정한다. 추정 결과 d̂ ≈ 0.32, D̂₁ ≈ 0.18, D̂₂ ≈ 0.12 로, 비계절적 장기 기억과 두 계절적 장기 기억이 모두 존재함을 확인한다. 잔차 분석과 Ljung‑Box 검정 결과는 모델이 충분히 데이터를 설명함을 시사한다.
전반적으로 이 논문은 다중 계절성을 갖는 장기 기억 시계열에 대한 이론적 기반을 확립하고, 실용적인 반파라메트릭 추정 절차를 제공함으로써 계절 SARFIMA 모델링 분야에 중요한 기여를 한다.
댓글 및 학술 토론
Loading comments...
의견 남기기