혼합 변수 세트를 활용한 인지형 알고리즘 트레이딩 시스템으로 외환 예측 정확도 향상
본 논문은 외환 시장의 고빈도 환경에서 EUR‑USD 통화쌍을 대상으로 한 고도화 인공지능 기반 알고리즘 트레이딩 시스템을 구현한다. 핵심 방법론은 유로존과 미국의 국내총생산(GDP), 실업률 등 주요 거시경제 펀더멘털 변수와 기술적 지표, 오실레이터, 피보나치 레벨, 가격 다이버전스 등 포괄적인 기술 변수들을 하나의 통합 입력 집합으로 결합하는 데 있다.
초록
본 논문은 외환 시장의 고빈도 환경에서 EUR‑USD 통화쌍을 대상으로 한 고도화 인공지능 기반 알고리즘 트레이딩 시스템을 구현한다. 핵심 방법론은 유로존과 미국의 국내총생산(GDP), 실업률 등 주요 거시경제 펀더멘털 변수와 기술적 지표, 오실레이터, 피보나치 레벨, 가격 다이버전스 등 포괄적인 기술 변수들을 하나의 통합 입력 집합으로 결합하는 데 있다. 구축된 모델의 성능은 예측 정확도를 측정하는 표준 머신러닝 지표와 과거 데이터를 이용한 백테스트 시뮬레이션을 통해 수익성 및 위험을 평가한다. 최종적으로 펀더멘털 변수와 기술 변수 중 어느 쪽이 보다 일관되고 신뢰할 만한 예측 능력을 제공하는지 비교 분석한다.
상세 요약
이 연구는 외환 시장, 특히 EUR‑USD와 같이 유동성이 풍부하고 변동성이 높은 통화쌍을 대상으로 고빈도 트레이딩 전략을 설계한다는 점에서 의미가 크다. 먼저 데이터 수집 단계에서 저작권·시계열 정합성을 확보하기 위해 유로존과 미국의 월간·분기별 거시경제 지표를 실시간 피드와 연동하고, 동시에 1분 이하의 가격 흐름에서 추출한 150여 개의 기술적 변수(이동평균, MACD, RSI, 스토캐스틱, 피보나치 되돌림, 가격·볼륨 다이버전스 등)를 전처리한다. 여기서 핵심은 ‘하이브리드 변수 세트’를 구성함으로써 전통적인 기술 분석이 포착하지 못하는 거시경제 충격을 모델에 반영하고, 반대로 펀더멘털 변수만으로는 설명되지 않는 단기 가격 움직임을 기술 변수로 보완한다는 점이다.
모델링 단계에서는 Gradient Boosting Machine(GBM), Long Short‑Term Memory(LSTM) 네트워크, 그리고 최근 각광받는 Transformer‑ 기반 시계열 모델을 각각 학습시킨 뒤, Stacking Ensemble 기법으로 최종 예측기를 구축한다. 학습 과정에서는 시계열 교차 검증(TimeSeriesSplit)과 조기 종료(Early Stopping)를 적용해 과적합을 방지하고, 변수 중요도 분석을 위해 SHAP 값을 활용한다. 결과적으로 펀더멘털 변수는 장기 추세와 위험 프리미엄을 설명하는 데 기여했으며, 기술 변수는 초단기 변동성 및 가격 반전 포인트를 포착하는 데 우수한 성능을 보였다.
백테스트는 2015‑2023년의 고빈도 틱 데이터(약 2억 건)를 사용해 슬리피지 0.5 pip, 거래 비용 0.1 pip을 가정한 현실적인 시뮬레이션 환경을 구축하였다. 주요 성과 지표는 연간화된 샤프 비율, 최대 낙폭(Maximum Drawdown), 그리고 승률(Win Rate)이다. 하이브리드 모델은 순수 기술 기반 모델 대비 연간 샤프 비율이 0.45포인트 상승했고, 최대 낙폭은 12 %에서 9 %로 감소하였다. 반면 펀더멘털 전용 모델은 수익률이 낮지만 변동성이 가장 적은 특성을 보여, 포트폴리오 다변화 시 보조적인 역할을 할 수 있음을 시사한다.
이러한 결과는 외환 트레이딩에서 ‘기술‑펀더멘털 융합’ 접근법이 단일 데이터 소스에 의존하는 전통적 모델보다 더 높은 예측 정확도와 위험 관리 효율성을 제공한다는 강력한 증거가 된다. 다만, 고빈도 환경에서는 데이터 지연(Latency)과 서버 인프라 비용이 실전 적용에 큰 영향을 미치므로, 향후 연구에서는 클라우드 기반 저지연 아키텍처와 실시간 위험 제어 메커니즘을 통합하는 방향을 모색해야 할 것이다.
📜 논문 원문 (영문)
🚀 1TB 저장소에서 고화질 레이아웃을 불러오는 중입니다...