다차원 버머던과 아메리칸 옵션 가격 산정을 위한 병렬 몬테카를로 알고리즘
초록
본 논문은 다차원 버머던·아메리칸 옵션의 가격을 추정하기 위해 두 가지 병렬 몬테카를로 기반 알고리즘을 제안한다. 첫 번째는 최적 행사 경계(optimal exercise boundary)를 계산하는 방식이며, 두 번째는 행사와 지속 가치(continuation value)를 구분하는 분류(classification) 접근법이다. 두 알고리즘을 이기종 데스크톱 그리드 환경에서 구현·평가한 결과, 각각의 구조적 특성에 따른 확장성 한계와 성능 병목을 규명하였다.
상세 분석
논문은 다차원 옵션의 복합적인 행사가격 결정 문제를 해결하기 위해 Monte Carlo 시뮬레이션을 병렬화하는 두 가지 전략을 제시한다. 첫 번째 전략은 전통적인 Longstaff‑Schwartz(L‑S) 회귀 기반 방법을 확장한 것으로, 각 행사 시점마다 최적 행사 경계를 추정한다. 경계 추정은 다차원 회귀 모델(예: 다항식 회귀 또는 커널 회귀)을 이용해 시뮬레이션된 경로들의 현금 흐름을 근사하고, 이 과정에서 경계값을 구간별로 분할해 병렬 작업 단위로 만든다. 경계 계산은 모든 프로세스가 동일한 시점에 동기화되어야 하므로, 통신 비용과 동기화 오버헤드가 확장성에 직접적인 영향을 미친다. 특히 경계 재계산이 매 행사일마다 필요하므로, 프로세서 수가 증가할수록 경계 데이터 전송량이 급증한다.
두 번째 전략은 “분류 기반” 접근법으로, 각 시점에서 ‘행사(Exercise)’와 ‘지속(Continuation)’을 구분하는 이진 분류기를 학습한다. 논문에서는 AdaBoost와 같은 부스팅 기법을 사용해 다차원 상태공간을 학습 데이터로 변환하고, 학습된 모델을 이용해 시뮬레이션 경로를 빠르게 라벨링한다. 이 방법은 경계 계산보다 학습 단계가 더 무거우며, 학습 과정 자체를 병렬화할 수 있다(데이터 파티셔닝 및 모델 파라미터 집계). 그러나 학습이 끝난 후에도 각 시점마다 전체 모델을 모든 워커에 전파해야 하므로, 모델 크기가 커질수록 네트워크 부하가 증가한다.
실험은 BOINC 기반의 이기종 데스크톱 그리드(CPU 사양, 메모리, 네트워크 대역폭이 다양함)에서 수행되었다. 첫 번째 알고리즘은 시뮬레이션 경로 수가 많을수록 좋은 스케일링을 보였지만, 행사일 수가 늘어날수록 경계 재계산 단계가 전체 실행 시간의 30~40%를 차지했다. 두 번째 알고리즘은 초기 학습 단계에서 높은 CPU 사용률을 보였으나, 학습 후 모델 전파와 라벨링 단계에서 통신 병목이 발생해 16코어 이상에서는 효율이 급격히 감소했다.
결론적으로, 두 접근법 모두 “시간 단계별 동기화”와 “공유 데이터 전파”가 확장성의 주요 제약 요인임을 확인하였다. 경계 기반 방법은 경계 계산을 근사화하거나 비동기식 업데이트를 도입해 동기화 비용을 줄일 수 있는 가능성이 있으며, 분류 기반 방법은 모델 압축 및 파라미터 전송 최적화를 통해 네트워크 부하를 완화할 수 있다. 또한, 이기종 환경에서 작업 부하를 동적으로 재조정하는 스케줄러가 필요함을 시사한다.
댓글 및 학술 토론
Loading comments...
의견 남기기