다중계절 범주형 시계열 예측을 위한 푸리에 기반 모델링

다중계절 범주형 시계열 예측을 위한 푸리에 기반 모델링
안내: 본 포스트의 한글 요약 및 분석 리포트는 AI 기술을 통해 자동 생성되었습니다. 정보의 정확성을 위해 하단의 [원본 논문 뷰어] 또는 ArXiv 원문을 반드시 참조하시기 바랍니다.

초록

본 논문은 대기질지수(AQI)와 같이 순서형 범주형 데이터를 대상으로, 일·주·연간의 복합적인 계절성을 푸리에 급수와 지표함수로 표현한 새로운 예측 프레임워크를 제안한다. 순서형 로짓 회귀에 푸리에 항을 결합해 계절 효과를 해석 가능하게 모델링하고, 시뮬레이션과 콜카타 실 데이터 분석을 통해 기존 마코프·머신러닝 모델 대비 예측 정확도가 향상됨을 입증한다.

상세 분석

이 연구는 연속형 시계열에서 다중계절성을 다루는 TBATS 모델의 아이디어를 범주형, 특히 순서형 데이터에 적용한다는 점에서 혁신적이다. 저자는 순서형 로짓 회귀(Ordinal Logistic Regression)를 기본 구조로 채택하고, 일일, 주간, 연간 주기의 푸리에 사인·코사인 항을 설계 변수로 포함한다. 푸リエ 항은 계절 주기의 주기성을 부드럽게 포착하면서도 파라미터 수를 제한해 과적합 위험을 낮춘다. 또한, 푸리에 급수 대신 지표함수(Indicator Functions)를 이용해 각 시간 구간(시간대, 요일, 월)을 더미 변수로 직접 모델링하는 대안을 제시한다. 이는 급격한 변동이나 비정형적인 계절 패턴(예: 특정 축제일에 급증하는 오염)에도 대응 가능하도록 설계되었다.

모델 추정은 최대우도법을 사용하며, 시뮬레이션을 통해 파라미터 일관성(consistency)과 추정 정확도를 검증한다. 특히, 다중계절성 차수를 선택하기 위해 AIC·BIC 외에도 계절 자기상관(Seasonal Autocorrelation)과 교차상관을 활용한 절차를 제시한다. 실증 분석에서는 2019‑2024년 콜카타 일일 AQI 데이터를 사용해, 푸리에 기반 모델(TSOLR)과 지표함수 기반 모델(ISOLR)을 각각 구현하고, 전통적인 마코프 체인, 이산 ARMA, MTD, 그리고 랜덤 포레스트·LSTM 등 최신 머신러닝 기법과 비교한다.

예측 성능 평가는 정확도(Accuracy), 평균 절대 오차(MAE), 그리고 순서형 특성을 반영한 Kappa 지표를 포함한다. 결과는 푸리에 기반 TSOLR이 특히 주간·연간 계절성을 동시에 포착하는 데 강점을 보이며, 전통 모델 대비 3‑5%p의 정확도 향상을 달성함을 보여준다. 지표함수 기반 ISOLR은 비정형 계절 패턴을 잘 포착하지만 파라미터 수가 많아 정규화(Lasso) 없이는 과적합 위험이 존재한다.

이 논문은 범주형 시계열에 대한 다중계절성 모델링의 이론적 틀을 제공함과 동시에, 실제 환경 데이터에 적용 가능한 실용적 방법론을 제시한다는 점에서 학술적·실무적 의의가 크다.


댓글 및 학술 토론

Loading comments...

의견 남기기