미래 시장 상황을 제어하는 Diffusion 기반 LOB 생성 모델
초록
DiffLOB은 미래 시장 레짐(추세, 변동성, 유동성, 주문 흐름 불균형)을 조건으로 넣어 제한 주문서(Limit Order Book)의 시계열을 생성하는 확산 모델이다. 조건을 바꾸면 가상의 시장 상황에 대한 LOB 변화를 직접 시뮬레이션할 수 있어 스트레스 테스트와 시나리오 분석에 활용 가능하다. 논문은 현실성, 반사실성(대응성), 그리고 실제 예측 성능 향상이라는 세 가지 평가 기준을 제시하고, 기존 모델 대비 우수함을 실증한다.
상세 분석
DiffLOB은 기존 LOB 생성 모델이 “관측된 과거에 기반한 평균적 흐름”만을 학습하는 한계를 극복하고, 미래 레짐을 직접 제어 변수로 도입한다는 점에서 혁신적이다. 논문은 먼저 LOB를 K×C 차원의 텐서(가격 레벨 K와 특성 차원 C)로 정의하고, 미래 구간 τ에 대한 레짐 벡터 c = {trend, vol, liq, imb}를 명시한다. 이 레짐은 관측값이 아니라 가설적 개입이 가능한 변수로 취급되어, p(x_{t+1:t+τ}|x_{1:t}, c) 를 학습함으로써 “레짐이 X일 때 LOB는 어떻게 변할까?”라는 반사실적 질문에 답한다.
모델은 DDPM(denoising diffusion probabilistic model) 프레임워크를 채택한다. 전방 과정에서 목표 LOB 시퀀스를 단계별로 가우시안 노이즈에 노출시키고, 역방향 과정에서는 노이즈를 예측해 원본 데이터를 복원한다. 핵심은 조건부 네트워크가 과거 LOB, 시간‑오브‑데이, 그리고 레짐 정보를 모두 받아들인다는 점이다. 이를 위해 논문은 다음과 같은 설계를 제안한다.
- Backbone: Wavenet‑style residual block을 16개 쌓아 시공간 구조를 모델링한다. 각 블록은 residual과 skip 연결을 제공해 깊은 신호 흐름을 유지한다.
- Regime Condition Encoder: 레짐을 Local(시간‑별 변동)과 Global(전체 추세·변동성)으로 구분해 각각 Conv‑Net과 MLP로 인코딩한다. 이렇게 하면 단기 주문 흐름과 장기 시장 분위기가 서로 다른 시간 스케일에서 독립적으로 반영된다.
- Control Module: ControlNet 아이디어를 차용해 1×1 Conv 레이어를 zero‑init으로 삽입, 초기에는 모델에 영향을 주지 않지만 학습이 진행되면서 레짐‑특정 조절 신호를 점진적으로 학습한다. 이는 레짐을 바꾸었을 때 생성 결과가 일관되게 변하도록 보장한다.
- FiLM Modulation: 각 residual 블록에 diffusion timestep embedding, Local 및 Global 레짐 embedding을 FiLM 방식으로 주입해, 시간‑조건과 레짐‑조건이 복합적으로 작용하도록 설계했다.
데이터는 LOBSTER에서 3개 종목(AMZN, AAPL, GOOG)의 1초 간격 스냅샷을 사용했으며, 10레벨의 bid/ask 가격·거래량을 포함한다. 가격은 절대값 대신 중간가격 차이와 가격 레벨 간 차분으로 변환해 안정성을 높였고, 거래량은 99th percentile 절단 후 제곱근 정규화를 적용했다. 레짐 변수는 목표 시퀀스에서 직접 계산된 누적 수익, 변동성, 총 체류량, 주문 흐름 불균형으로 정의했다.
평가에서는 (1) Controllable Realism – 실제 레짐을 조건으로 넣었을 때 생성된 LOB가 가격·거래량 분포, 자기상관, 스프레드 등 통계적 특성을 얼마나 재현하는가; (2) Counterfactual Validity – 레짐을 인위적으로 변형했을 때 생성된 시계열이 기대되는 방향으로 일관되게 변하는가; (3) Counterfactual Usefulness – 합성된 반사실 데이터가 레짐 예측 모델의 성능을 실제 데이터만 사용할 때보다 얼마나 향상시키는가.
실험 결과 DiffLOB은 모든 지표에서 기존 Diff‑CSDI, Diff‑S4, cGAN, cVAE, AR 모델을 크게 앞섰다. 특히 가격 반환 분포와 스프레드, 변동성 클러스터링을 정확히 재현했으며, 거래량 레벨 간 부정적 상관관계도 포착했다. 레짐을 극단값(예: 급격한 상승 추세, 높은 변동성)으로 바꾸면 생성된 LOB가 실제 시장에서 관찰된 유사 상황과 통계적으로 일치했다. 마지막으로, 합성된 반사실 시퀀스를 훈련 데이터에 추가하면 레짐 예측 모델의 AUC가 평균 4~6% 상승했으며, 특히 레짐이 희귀하거나 극단적인 경우에 큰 개선을 보였다.
한계점으로는 (i) 레짐 변수의 정의가 비교적 단순해 실제 복합적인 시장 스트레스 요인을 모두 포괄하지 못한다는 점, (ii) 32스텝(≈32초) 길이의 시퀀스에 국한돼 장기 시뮬레이션에 대한 확장성이 미흡하다, (iii) 실제 트레이딩 에이전트와의 상호작용을 포함한 정책 평가가 아직 구현되지 않았다. 향후 연구에서는 레짐을 다변량 시계열로 확장하고, 멀티‑에이전트 시뮬레이션과 결합해 정책 최적화에 활용하는 방향이 제시된다.
댓글 및 학술 토론
Loading comments...
의견 남기기