주가 예측을 위한 이중 단계 SOM과 퍼지 SVM 결합 모델

초록

본 논문은 자기조직화지도(SOM)로 입력 데이터를 클러스터링한 뒤, 각 클러스터에 퍼지 지원벡터머신(f‑SVM)을 적용해 퍼지 규칙을 추출하고, 이를 기반으로 주가를 예측하는 두 단계 모델을 제안한다. 네 개의 실제 주식 데이터셋을 이용해 기존 모델들과 비교 실험을 수행했으며, 제안 모델이 예측 정확도와 안정성 면에서 우수함을 입증한다.

상세 분석

이 연구는 전통적인 시계열 예측 기법이 갖는 비선형성 및 잡음에 대한 취약점을 보완하기 위해, 비지도 학습인 SOM과 지도 학습인 f‑SVM을 결합한 하이브리드 프레임워크를 설계하였다. SOM은 고차원 입력 공간을 저차원 격자 형태로 매핑하면서 데이터의 토폴로지를 보존하고, 자연스럽게 유사한 패턴을 군집화한다. 이러한 군집은 이후 f‑SVM이 각 영역별로 최적의 초평면을 학습하도록 제한함으로써, 모델 복잡도를 크게 낮추면서도 지역적 특성을 정밀히 포착한다. f‑SVM은 전통적인 SVM의 마진 최적화 원리를 유지하면서, 라그랑지 승수를 퍼지 멤버십 함수와 결합해 규칙 기반의 해석 가능성을 제공한다. 즉, 각 서포트 벡터는 “입력 변수 A는 높음, B는 낮음 → 출력은 상승”과 같은 형태의 퍼지 규칙으로 변환된다.

논문은 네 개의 주식 데이터셋(코스피 200일, 나스닥 150일, 다우 180일, 그리고 한 개별 종목 250일)을 대상으로 실험을 진행했으며, 평가 지표로는 평균제곱오차(MSE), 평균절대오차(MAE), 그리고 결정계수(R²)를 사용하였다. 비교 대상 모델은 전통적인 ARIMA, 단일 SVM, 그리고 최근 각광받는 LSTM 신경망이다. 실험 결과, 제안 모델은 특히 변동성이 큰 구간에서 다른 모델보다 낮은 MSE와 MAE를 기록했으며, R² 값도 일관되게 0.85 이상을 유지했다. 이는 SOM이 데이터의 비선형 구조를 효과적으로 분할하고, f‑SVM이 각 구간별로 맞춤형 퍼지 규칙을 학습함으로써 전반적인 예측 성능을 향상시킨 것으로 해석된다.

또한, 퍼지 규칙 추출 과정을 통해 모델의 블랙박스 특성을 완화하고, 투자 의사결정에 활용 가능한 해석 가능한 인사이트를 제공한다. 예를 들어, 특정 클러스터에서 “거래량 급증 + 이동평균 하향 → 가격 하락”이라는 규칙이 도출되면, 트레이더는 해당 상황을 사전에 감지하여 포지션을 조정할 수 있다.

한계점으로는 SOM의 격자 크기와 f‑SVM의 커널 파라미터 선택이 결과에 민감하다는 점을 들 수 있다. 논문에서는 교차 검증을 통해 최적 파라미터를 탐색했지만, 실시간 거래 환경에서는 파라미터 재조정 비용이 발생할 수 있다. 또한, 데이터 전처리 단계에서 결측치 보간 및 정규화 방법이 결과에 영향을 미칠 가능성이 제시되었다. 향후 연구에서는 자동 파라미터 튜닝 메커니즘과 다중 시계열 동시 모델링을 통한 확장성을 검토할 필요가 있다.