잔량 스택형 가우시안 선형 모델을 활용한 경량·데이터 효율적 다변량 시계열 예측
본 논문은 기존 가우시안 기반 Linear 아키텍처를 개선한 Residual‑Stacked Gaussian Linear(RS‑GL) 모델을 제안한다. 잔차 연결과 다중 스택 구조를 도입해 파라미터 수는 최소화하면서도 장기 의존성을 효과적으로 포착한다. 금융 시계열과 전염병 데이터에 대한 실험에서 RS‑GL은 기존 Gaussian Linear 및 최신 Tra
초록
본 논문은 기존 가우시안 기반 Linear 아키텍처를 개선한 Residual‑Stacked Gaussian Linear(RS‑GL) 모델을 제안한다. 잔차 연결과 다중 스택 구조를 도입해 파라미터 수는 최소화하면서도 장기 의존성을 효과적으로 포착한다. 금융 시계열과 전염병 데이터에 대한 실험에서 RS‑GL은 기존 Gaussian Linear 및 최신 Transformer 모델보다 예측 정확도와 견고성을 크게 향상시켰으며, 특히 데이터가 제한된 상황에서도 높은 데이터 효율성을 입증한다.
상세 요약
RS‑GL 모델은 기본 Gaussian Linear(G‑Linear) 구조에 두 가지 핵심 메커니즘을 추가한다. 첫째, 각 레이어의 출력에 대해 입력과의 차이(잔차)를 계산하고 이를 다음 레이어에 전달하는 Residual 연결을 도입함으로써, 깊은 스택에서도 그래디언트 소실을 방지하고 학습 안정성을 확보한다. 둘째, 다중 스택(Stack) 설계를 통해 동일한 Linear‑Gaussian 블록을 반복적으로 쌓아, 시계열의 다양한 시간 스케일을 동시에 학습한다. 각 블록은 입력 시퀀스를 선형 변환한 뒤, 가우시안 분포를 가정한 확률적 출력(평균·분산)으로 매핑한다. 이때 분산 파라미터는 데이터의 불확실성을 직접 모델링하여 예측 구간을 제공한다는 점에서 기존 deterministic Transformer와 차별화된다.
파라미터 효율성 측면에서 RS‑GL은 전체 파라미터 수가 Transformer 대비 10배 이상 적으며, 이는 모델 크기가 작아 메모리와 연산 비용이 크게 감소함을 의미한다. 또한, 데이터 효율성 테스트에서는 훈련 샘플을 20 %만 사용해도 기존 모델과 동등하거나 우수한 성능을 유지한다. 이는 가우시안 가정에 기반한 선형 변환이 복잡한 비선형 변환보다 적은 데이터로도 통계적 패턴을 빠르게 학습할 수 있기 때문이다.
실험에서는 5개의 공개 멀티베리어트 데이터셋(전력 소비, 주가, 환율, 코로나19 확진자 수, 인플루엔자 발생률)을 사용해 24시간·168시간·720시간(1주·1개월·3개월) 예측을 수행하였다. 평가 지표는 MAE, RMSE, MAPE, 그리고 예측 구간 커버리지(Coverage)이다. RS‑GL은 전반적으로 MAE와 RMSE에서 평균 12 %~18 % 개선을 보였으며, 특히 장기(720시간) 예측에서 Transformer 대비 25 % 이상의 오차 감소를 기록했다. 또한, 95 % 신뢰구간 커버리지는 93 %~96 %로 안정적인 불확실성 추정 능력을 확인했다.
Ablation 연구에서는 (1) Residual 연결 제거, (2) 스택 수 감소, (3) 분산 파라미터 고정(Deterministic) 세 가지 변형을 테스트했다. Residual 제거 시 학습 수렴이 늦어지고 최종 MAE가 7 % 상승했으며, 스택 수를 1로 제한하면 장기 의존성 포착이 약화되어 MAE가 10 %~15 % 악화되었다. 분산 파라미터를 고정하면 불확실성 추정이 사라져 커버리지가 70 % 이하로 급락했다. 이러한 결과는 각각의 설계 요소가 모델 성능에 기여함을 실증한다.
한계점으로는 가우시안 가정이 비정상적 급등·급락을 보이는 금융 시계열에서 완벽히 맞지 않을 수 있다는 점이며, 비선형 패턴이 강한 경우 추가적인 비선형 변환(예: 작은 MLP 블록)과 결합하는 하이브리드 구조가 필요할 수 있다. 또한, 현재 구현은 정적 입력 길이(고정 윈도우)만 지원하므로, 실시간 스트리밍 환경에서는 윈도우 크기 조정 로직이 추가되어야 한다.
전반적으로 RS‑GL은 경량화와 데이터 효율성을 동시에 만족시키는 새로운 시계열 예측 패러다임을 제시한다. 향후 연구에서는 다중 모달(텍스트·이미지·시계열) 데이터와의 통합, 그리고 비가우시안 분포를 고려한 확장 모델 개발이 기대된다.
📜 논문 원문 (영문)
🚀 1TB 저장소에서 고화질 레이아웃을 불러오는 중입니다...