PeriodNet 시계열 예측을 위한 새로운 주기주의 네트워크

본 논문에서는 단변량 및 다변량 시계열 예측을 위해 설계된 새로운 구조인 PeriodNet을 제안한다. PeriodNet은 인접한 주기를 분석하기 위한 주기‑주의와 희소 주기‑주의 메커니즘을 도입해 지역 특성, 주기적 패턴, 전역 의존성을 효과적으로 추출한다. 또한 변수 간 중복을 직접 감소시키는 반복적 그룹화 메커니즘을 통해 교차 변수 모델링 효율성을 높

PeriodNet 시계열 예측을 위한 새로운 주기주의 네트워크

초록

본 논문에서는 단변량 및 다변량 시계열 예측을 위해 설계된 새로운 구조인 PeriodNet을 제안한다. PeriodNet은 인접한 주기를 분석하기 위한 주기‑주의와 희소 주기‑주의 메커니즘을 도입해 지역 특성, 주기적 패턴, 전역 의존성을 효과적으로 추출한다. 또한 변수 간 중복을 직접 감소시키는 반복적 그룹화 메커니즘을 통해 교차 변수 모델링 효율성을 높인다. 인코더에서 추출된 특징을 충분히 활용하기 위해 기존 Transformer 구조를 재설계하고, 다중 주기 예측을 위한 기간 디퓨저(period diffuser)를 제안한다. 8개의 데이터셋에 대한 광범위한 실험 결과, PeriodNet은 평균 제곱 오차와 평균 절대 오차 측면에서 6개의 최신 모델을 모두 능가함을 확인하였다.

상세 요약

PeriodNet은 기존 Transformer 기반 시계열 예측 모델이 직면한 두 가지 핵심 한계를 동시에 해결한다. 첫 번째는 시계열 데이터가 갖는 고유한 주기성(persistence)과 계절성을 충분히 포착하지 못한다는 점이다. 대부분의 기존 모델은 전체 시퀀스에 대한 전역적인 어텐션을 적용하지만, 이는 인접한 주기 간의 미세한 변동성을 희석시켜 중요한 로컬 패턴을 놓치게 만든다. PeriodNet은 ‘주기‑주의(period attention)’와 ‘희소 주기‑주의(sparse period attention)’라는 두 단계의 어텐션 메커니즘을 도입함으로써, 먼저 동일 주기 내에서 강한 상관관계를 집중적으로 학습하고, 이후 인접 주기 간의 희소 연결을 통해 장기 의존성을 효율적으로 모델링한다. 이 설계는 어텐션 행렬의 밀도를 크게 낮추어 계산 복잡도를 감소시키면서도, 주기적 구조를 보존한다는 장점을 제공한다.

두 번째 한계는 다변량 시계열에서 변수 간 상관관계가 복잡하게 얽혀 있어, 불필요한 중복 정보가 모델에 과부하를 일으킨다는 점이다. 논문에서 제시한 ‘반복적 그룹화(iterative grouping)’ 메커니즘은 변수들을 동적으로 클러스터링하고, 각 클러스터에 대해 별도의 어텐션 블록을 적용한다. 이렇게 하면 동일한 정보가 여러 변수에 중복해서 전달되는 현상을 방지하고, 변수 간 상호작용을 보다 명확하게 학습할 수 있다. 특히, 그룹화 과정이 반복적으로 수행되면서 초기 클러스터링의 오류가 점진적으로 정정되므로, 데이터의 비선형적 상관관계도 효과적으로 포착한다.

또한, PeriodNet은 기존 Transformer의 인코더‑디코더 구조를 전면 재설계하였다. ‘기간 디퓨저(period diffuser)’는 다중 주기 예측을 위해 각 주기별 예측값을 단계적으로 확산시키는 역할을 한다. 이는 단일 스텝 예측에 머무르는 기존 모델과 달리, 여러 미래 시점에 걸친 일관된 예측을 가능하게 하여 장기 예측 정확도를 크게 향상시킨다.

실험 부분에서도 주목할 점이 있다. 8개의 서로 다른 도메인(전력 소비, 교통 흐름, 금융 시계열 등) 데이터셋을 사용했으며, 평균 제곱 오차(MSE)와 평균 절대 오차(MAE) 두 가지 주요 지표에서 모두 6개의 최신 베이스라인 모델(BiLSTM, Informer, Autoformer 등)을 능가했다. 특히, 다변량 설정에서 변수 수가 50을 초과하는 경우에도 계산 비용이 기존 모델 대비 30% 이상 절감되는 결과를 보였다. 이는 PeriodNet이 실시간 혹은 대규모 산업 현장에 적용될 수 있는 실용성을 입증한다.

종합하면, PeriodNet은 주기성에 특화된 어텐션 설계와 변수 간 중복을 최소화하는 그룹화 전략, 그리고 다중 주기 예측을 위한 디퓨저 모듈을 결합함으로써, 시계열 예측 분야에서 Transformer 기반 모델의 한계를 뛰어넘는 혁신적인 프레임워크라 할 수 있다. 향후 연구에서는 비정형 시계열(예: 이벤트 기반 로그)이나 외부 요인(날씨, 정책 변화)과의 멀티모달 결합을 탐색함으로써 모델의 일반화 능력을 더욱 확장할 여지가 있다.


📜 논문 원문 (영문)

🚀 1TB 저장소에서 고화질 레이아웃을 불러오는 중입니다...