EMD 기반 시계열 예측에서 종단 효과 억제가 성능을 좌우한다
초록
본 연구는 경험적 모드 분해(EMD) 과정에서 발생하는 종단 효과(end effect)를 완화하기 위해 네 가지 종단 조건 방법(미러, Coughlin, 기울기 기반, Rato)을 도입하고, 이를 SVR 모델과 결합한 예측 프레임워크를 제안한다. NN3 대회 데이터셋을 이용한 실험 결과, 종단 조건을 적용한 EMD‑SVR 모델이 기존 베이스라인 대비 예측 정확도가 크게 향상되었으며, 특히 EMD‑SBM‑SVR과 EMD‑Rato‑SVR이 가장 우수한 성능을 보였다.
상세 분석
본 논문은 비선형·비정상 시계열 분석에 널리 활용되는 경험적 모드 분해(EMD) 기법의 핵심 약점인 종단 효과(end effect)를 체계적으로 탐구한다. 종단 효과는 신호의 양 끝부분에서 발생하는 경계 왜곡으로, sifting 과정에서 모드 함수(IMF)가 실제 신호 특성을 제대로 포착하지 못하게 만든다. 이러한 왜곡은 이후에 적용되는 예측 모델, 특히 서포트 벡터 회귀(SVR)와 같은 고차원 비선형 학습기에 전달될 경우, 학습 데이터의 왜곡을 그대로 반영해 예측 정확도를 저하시킨다.
논문은 네 가지 대표적인 종단 조건 보정 방법을 선정하였다. 첫 번째인 미러(Mirror) 방법은 신호 양쪽 끝을 대칭 복제해 인공적인 연속성을 부여함으로써 경계에서의 급격한 변화 를 완화한다. 두 번째인 Coughlin 방법은 기존 데이터의 추세를 외삽하여 경계 구간을 보강한다. 세 번째인 기울기 기반(Slope‑based) 방법은 양 끝점의 기울기를 이용해 선형 외삽을 수행, 급격한 변동을 최소화한다. 마지막으로 Rato 방법은 통계적 특성을 고려해 경계 구간에 적절한 잡음 수준을 추가, 과도한 평활화를 방지한다.
이들 방법을 EMD와 결합한 뒤, 각 IMF에 대해 SVR을 독립적으로 학습하고, 최종 예측값은 가중 평균(ensemble) 방식으로 통합한다. 실험에 사용된 NN3 대회 데이터는 전통적인 시계열 예측 벤치마크로, 다중 단계(1‑step, 3‑step, 5‑step) 예측 정확도를 평가한다. 성능 평가지표는 평균 절대 오차(MAE), 평균 제곱근 오차(RMSE), MAPE 등 다중 지표를 활용했으며, 통계적 유의성 검증을 위해 Diebold‑Mariano(DM) 테스트와 동등성 검정(equal accuracy)도 수행하였다.
결과는 종단 조건을 적용한 EMD‑SVR 모델이 모든 지표에서 기존 EMD‑SVR(종단 보정 미적용)보다 유의미하게 우수함을 보여준다. 특히 미러와 Rato 방법이 가장 큰 개선 효과를 보였으며, 이는 경계 구간에서의 왜곡을 최소화하면서도 IMF의 고유 진동 특성을 보존했기 때문으로 해석된다. DM 테스트 결과, EMD‑SBM‑SVR과 EMD‑Rato‑SVR은 다른 베이스라인 모델과의 차이가 통계적으로 유의미함을 확인했다. 또한, 동등성 검정에서 두 모델은 서로 비교했을 때도 차이가 없을 정도로 비슷한 수준의 높은 정확도를 유지했다.
이러한 분석은 종단 효과가 EMD 기반 예측 체인의 전 단계에 걸쳐 누적될 수 있음을 시사한다. 따라서 종단 조건 보정은 단순히 전처리 단계가 아니라, 전체 모델링 파이프라인의 성능을 좌우하는 핵심 요소로 간주될 수 있다. 향후 연구에서는 종단 조건을 동적으로 선택하거나, 딥러닝 기반 IMF 추출기와 결합하는 방안을 모색함으로써 더욱 일반화된 프레임워크를 구축할 여지가 있다.