히드포머를 활용한 주가 예측 혁신

초록

본 논문은 최신 Transformer 기반 모델인 Hidformer를 주식 가격 시계열 예측에 적용하고, 기술적 분석 요소와 결합한 변형 모델의 성능을 실증적으로 평가한다. 실험 결과, 기존 LSTM·GRU 대비 높은 예측 정확도와 안정성을 보이며, 알고리즘 트레이딩 및 인간 의사결정 지원에 활용 가능성을 제시한다.

상세 요약

Hidformer는 기존 Transformer의 Self‑Attention 메커니즘을 시계열 데이터에 최적화하기 위해 Hierarchical‑Dilated 구조와 Sparse Attention을 도입한 모델이다. 논문에서는 이 구조를 주가 데이터에 맞게 약간 수정했는데, 첫 번째 단계에서 가격 변동성을 포착하기 위해 차분(differencing)과 로그 변환을 전처리로 적용하고, 두 번째 단계에서는 기술적 지표(이동평균, RSI, MACD 등)를 별도의 임베딩 레이어에 매핑한 뒤, 메인 Attention 블록에 병합하였다. 이렇게 함으로써 순수 가격 시계열만을 학습하는 경우보다 시장의 구조적 패턴을 더 잘 반영한다는 가설을 검증한다.

모델 학습에는 AdamW 옵티마이저와 Cosine Annealing 스케줄러를 사용했으며, 손실 함수는 MSE와 MAE를 가중 평균한 복합 손실을 채택해 과대·과소 예측을 동시에 억제한다. 데이터는 2010‑2022년 미국 S&P 500 구성 종목 50개를 대상으로 일일 종가와 거래량, 그리고 10가지 기술적 지표를 포함한 멀티‑변량 시계열로 구성하였다. 훈련‑검증‑테스트 비율은 70:15:15이며, 시계열 교차 검증을 통해 모델 일반화 능력을 평가하였다.

성능 비교에서는 전통적인 ARIMA, Prophet, 그리고 딥러닝 기반 LSTM·GRU와의 베이스라인 실험을 진행했다. 평가 지표는 RMSE, MAPE, Directional Accuracy(DA) 등을 사용했으며, Hidformer 변형 모델은 RMSE에서 평균 12.4% 개선, MAPE에서 9.7% 개선, DA에서는 3.2%p 상승을 기록했다. 특히 변동성이 큰 시점(예: 2020‑2021년 코로나 팬데믹)에서도 예측 오차가 상대적으로 낮아, 모델의 강건성이 입증되었다.

하지만 몇 가지 한계도 논의된다. 첫째, 고빈도(분·초 단위) 데이터에 대한 적용 가능성은 아직 검증되지 않았으며, 현재 일일 데이터에 최적화된 구조이다. 둘째, 기술적 지표 선택이 모델 성능에 미치는 영향이 충분히 탐색되지 않아, 지표 조합 최적화가 향후 과제로 남는다. 셋째, Transformer 기반 모델은 학습 시 메모리·연산 비용이 높아, 실시간 트레이딩 시스템에 직접 적용하기 위해서는 경량화 기법이 필요하다.

종합적으로, Hidformer는 시계열 특성을 고려한 계층적 Dilated Attention과 금융 도메인 특화 전처리·피처 엔지니어링을 결합함으로써 기존 모델 대비 의미 있는 성능 향상을 달성했으며, 향후 멀티‑에셋, 고빈도 데이터, 그리고 강화학습과의 연계 연구가 기대된다.

초록

상세 요약

📜 논문 원문 (영문)