시장 변동에 강인한 데이터 기반 옵션 가격 예측 방법

시장 변동에 강인한 데이터 기반 옵션 가격 예측 방법
안내: 본 포스트의 한글 요약 및 분석 리포트는 AI 기술을 통해 자동 생성되었습니다. 정보의 정확성을 위해 하단의 [원본 논문 뷰어] 또는 ArXiv 원문을 반드시 참조하시기 바랍니다.

초록

본 논문은 무위험 차익거래 이론에 기반한 데이터‑드리븐 앙상블 모델을 제안한다. 동일한 무위험 수익률 분포를 갖지 않는 자산 간에 공통 표현 공간을 구축해 도메인 적응을 수행하고, 이를 인도 NSE의 NIFTY 50·NIFTY Bank 옵션 데이터에 적용해 COVID‑19 기간의 급격한 도메인 변화를 효과적으로 포착한다.

상세 분석

논문은 먼저 전통적인 옵션 가격 이론(Black‑Scholes‑Merton)과 무위험 차익거래(no‑arbitrage) 조건을 수학적으로 정리하고, 이를 데이터‑드리븐 모델에 연결하는 두 가지 접근법을 제시한다. 첫 번째는 “동질성 힌트(Homogeneity Hint, HH)”라 부르는 방법으로, 옵션 가격과 기초자산 가격의 비율이 스케일‑프리(Scale‑free) 특성을 갖는다는 정리를 이용한다(정리 2.2). 이 정리는 두 자산이 동일한 위험중립 측정 하에서 동일한 만기·동일한 머니니스(moneyness)를 가질 경우, 가격 비율이 동일함을 보이며, 이를 학습 특성으로 활용한다. 그러나 HH는 두 자산의 로그수익률 분포가 거의 동일해야 한다는 강한 가정을 필요로 하며, 실제 시장에서는 자산군 간 분포 차이(예: 주식 vs. 은행지수)로 인해 성능이 급격히 저하된다.

두 번째 접근법은 “도메인 시프트(Domain Shift, DS)”를 고려한 공통 표현 공간(common representation space)을 설계한다. 저자는 위험중립 확률분포를 매개변수화(예: GBM, 변동성 스칼라)하고, 두 자산의 분포를 동일한 잠재 변수(공통 스케일링 변수)로 매핑한다. 이때 변동성 스칼라(volatility scalar)는 남은 옵션 수명 동안의 평균 변동성의 제곱근으로 정의되며, 상수 변동성 가정과 확률적 변동성 모델 모두에서 추정식이 제시된다. 공통 표현을 통해 학습된 회귀 모델은 훈련 자산과 테스트 자산 간의 분포 차이를 자동으로 보정한다.

실험에서는 인도 NSE의 NIFTY 50과 NIFTY Bank 옵션 데이터를 사용한다. COVID‑19 봉쇄 기간 동안 두 지수의 로그수익률 분포가 크게 변하면서 도메인 시프트가 발생했음이 확인되었다. HH 기반 모델은 이 시기에 큰 오차를 보였지만, DS 기반 모델은 도메인 시프트 지표(Domain Shift Quotient)를 가중치로 활용한 앙상블( HH + DS )에서 평균 절대오차(MAE)를 15 % 이상 개선하였다. 또한 다중 소스 학습(multi‑source training) 실험을 통해 두 지수 데이터를 동시에 학습시킨 경우, 새로운 자산(예: 데이터가 거의 없는 신흥 시장 지수)에도 안정적인 가격 예측이 가능함을 입증했다.

이 논문은 (1) 무위험 차익거래 이론을 데이터‑드리븐 모델에 정형화하는 방법론, (2) 도메인 적응을 위한 공통 표현 공간 설계, (3) 도메인 시프트를 정량화하고 앙상블에 반영하는 새로운 지표를 제시한다는 점에서 기존 문헌과 차별화된다. 특히, 파생상품 가격 예측에 머신러닝을 적용할 때 흔히 발생하는 “데이터 부족·분포 변화” 문제를 이론적 근거와 실증을 겸비한 해결책으로 제공한다.


댓글 및 학술 토론

Loading comments...

의견 남기기