헬메스: 다중 스케일 시공간 하이퍼그래프 네트워크를 활용한 주식 시계열 예측
초록
헬메스는 산업 간 선행‑후행 관계와 다중 시간 스케일 정보를 동시에 모델링하기 위해 하이퍼그래프 기반 이동 집계와 다중 스케일 융합 모듈을 도입한 새로운 주식 시계열 예측 프레임워크이다. 실험 결과, 기존 최첨단 방법들을 크게 능가한다는 것이 입증되었다.
상세 분석
본 논문은 주식 시계열 예측에서 산업 간 상호작용과 다중 스케일 특성을 동시에 고려해야 한다는 두 가지 핵심 문제점을 제시한다. 기존 하이퍼그래프 기반 모델은 동일 산업 내의 다중 종목을 하나의 하이퍼엣지로 연결해 intra‑industry 상관관계를 포착했지만, inter‑industry의 선행‑후행(lead‑lag) 효과와 서로 다른 시간 해상도에서 나타나는 패턴을 충분히 반영하지 못한다. 이를 해결하기 위해 헬메스는 두 가지 주요 모듈을 설계하였다.
첫 번째인 “하이퍼엣지 기반 이동 집계 모듈”(hyperedge‑based moving aggregation)은 슬라이딩 윈도우와 동적 시간 집계 연산을 결합한다. 각 윈도우 내에서 하이퍼엣지(산업)를 기준으로 시계열 데이터를 집계하고, 시간축을 따라 이동하면서 선행‑후행 관계를 학습한다. 이 과정에서 가중치가 시간에 따라 업데이트되는 마코프 거리(Markov distance)와 유사도 행렬을 이용해 동적인 인접 행렬을 생성함으로써, 한 산업의 변동이 다른 산업에 미치는 시차 효과를 정량화한다.
두 번째인 “다중 스케일 융합 모듈”(multi‑scale fusion)은 서로 다른 해상도의 시계열을 별도의 하이퍼그래프로 구성한 뒤, 스케일 간 엣지‑투‑엣지(edge‑to‑edge) 메시지 패싱을 수행한다. 구체적으로, 각 스케일에 대해 1‑D 컨볼루션으로 다운샘플링한 후, Causal‑Mixing MLP를 적용해 인과성을 보존한다. 이후 각 스케일의 하이퍼엣지를 연결하는 교차 스케일 하이퍼엣지를 정의하고, 이들 사이에서 메시지를 교환함으로써 미세 스케일의 주기적 변동과 거시 스케일의 추세 정보를 동시에 보존한다.
헬메스의 전체 파이프라인은 (1) 다중 스케일 분해, (2) 하이퍼그래프 구축, (3) 이동 집계에 의한 선행‑후행 상호작용 학습, (4) 스케일 간 융합, (5) MLP 기반 예측 헤드 순으로 진행된다. 실험에서는 중국 A‑주식 시장과 미국 주요 지수 데이터를 사용해 7개의 최신 베이스라인(Transformer, GNN, 기존 HGNN 등)과 비교했으며, 평균 절대 오차(MAE), 평균 제곱근 오차(RMSE) 및 방향성 정확도에서 모두 유의미한 개선을 보였다. 특히, 변동성이 큰 시점이나 산업 간 구조적 전이가 발생하는 구간에서 헬메스의 성능 우위가 두드러졌다.
이와 같이 헬메스는 하이퍼그래프의 고차원 관계 표현 능력에 동적 시간 집계와 다중 스케일 메시지 패싱을 결합함으로써, 기존 모델이 놓치기 쉬운 복합적인 금융 시장 메커니즘을 효과적으로 포착한다. 향후 연구에서는 하이퍼엣지의 가중치를 학습 가능한 어텐션 메커니즘으로 확장하거나, 외부 거시경제 지표와 결합해 더욱 정교한 예측 모델을 구축할 여지가 있다.
댓글 및 학술 토론
Loading comments...
의견 남기기