변동성 금융 시계열을 위한 트랜스포머 기반 GAN 데이터 증강
초록
본 논문은 트랜스포머 기반 GAN(TTS‑GAN)을 활용해 비트코인·S&P500 가격 데이터와 같은 금융 시계열을 합성하고, 이를 기존 LSTM 예측 모델에 증강 데이터로 추가함으로써 예측 정확도를 크게 향상시켰다. 또한 DTW와 DeD‑iMs를 결합한 새로운 품질 지표(DTW‑DeD‑iMs)를 제안해 생성 데이터의 시계열 유사성과 분포 차이를 동시에 모니터링한다.
상세 분석
본 연구는 금융 시계열 데이터의 고유한 특성—짧은 유효 기간, 비정상성, 급격한 변동성—으로 인해 딥러닝 모델이 과적합에 빠지기 쉬운 문제를 해결하고자 한다. 이를 위해 저자는 기존 RNN 기반 GAN의 한계를 인식하고, 자기‑주의(self‑attention) 메커니즘을 갖춘 트랜스포머 구조를 전면에 도입한 TTS‑GAN을 선택하였다. 트랜스포머는 전체 시퀀스를 병렬 처리하면서 장기 의존성을 효과적으로 포착하므로, 금융 데이터의 복합적인 패턴을 재현하는 데 유리하다.
구현상의 주요 개선점은 세 가지이다. 첫째, 원 논문의 커스텀 구현을 포기하고 PyTorch‑native Transformer 모듈을 사용함으로써 연산 효율과 메모리 관리가 크게 향상되었다. 둘째, Mescheder et al.이 제안한 “Simplified Gradient Penalty”를 도입해 실제 샘플에만 페널티를 부여함으로써 생성자‑판별자 간의 균형을 안정화하고 학습 수렴 속도를 가속화했다. 셋째, 하이퍼파라미터 탐색을 통해 판별자의 임베딩 차원(M_d=90)과 어텐션 헤드 수(H_d=30)를 생성자보다 현저히 크게 설정함으로써, 복잡한 데이터 분포를 더 정밀히 구분하도록 설계하였다. 이러한 설계 선택은 GAN 훈련 시 흔히 발생하는 모드 붕괴와 그래디언트 소실 문제를 완화한다.
데이터 품질 평가에 있어 기존의 Wasserstein 거리나 단순 통계량은 시계열의 순서적 특성을 반영하지 못한다는 한계를 지적하고, DTW와 DeD‑iMs를 결합한 DTW‑DeD‑iMs 지표를 제안한다. DTW는 두 시계열 간의 최적 정렬 비용을 계산해 시간적 변형에 강인한 유사성을 제공하고, DeD‑iMs는 전체 데이터셋 수준에서 분포 차이를 정량화한다. 두 지표를 동시에 고려함으로써, 합성 데이터가 원본 데이터의 동적 패턴을 유지하면서도 과도한 복제 없이 다양성을 확보했는지를 객관적으로 판단할 수 있다.
실험에서는 비트코인과 S&P500 가격 시계열을 각각 1일, 5일, 10일 예측 horizon으로 설정하고, LSTM 모델을 실제 데이터만 사용한 경우와 합성 데이터를 포함한 경우로 나누어 비교하였다. 결과는 모든 horizon에서 MSE가 평균 12% 이상 감소했으며, 특히 변동성이 큰 비트코인 데이터에서 증강 효과가 두드러졌다. 또한 DTW‑DeD‑iMs 점수가 낮을수록(즉, 원본과 유사할수록) 예측 성능 향상이 크게 나타나는 경향을 보였다. 이는 제안된 품질 지표가 GAN 훈련 과정에서 실용적인 조기 종료 신호 혹은 모델 선택 기준으로 활용될 수 있음을 시사한다.
한계점으로는 증강 데이터 비율에 대한 민감도 분석이 부족하고, 다른 시계열 예측 모델(예: Transformer‑Encoder, N‑BEATS)과의 비교가 이루어지지 않은 점을 들 수 있다. 향후 연구에서는 다중 자산 포트폴리오에 대한 확장, 강화학습 기반 시계열 생성, 그리고 실시간 거래 전략에의 적용을 탐색할 필요가 있다.
요약하면, 트랜스포머 기반 GAN을 통한 금융 시계열 데이터 증강이 실제 예측 성능을 의미 있게 개선하고, DTW‑DeD‑iMs라는 새로운 품질 지표가 생성 데이터의 시계열 적합성을 효과적으로 모니터링한다는 점에서 본 연구는 데이터‑희소 환경에서 딥러닝 기반 금융 예측 모델을 실용화하는 데 중요한 전진을 제공한다.
댓글 및 학술 토론
Loading comments...
의견 남기기