TradeFM 거래 흐름과 시장 미시구조를 위한 생성형 파운데이션 모델

TradeFM 거래 흐름과 시장 미시구조를 위한 생성형 파운데이션 모델
안내: 본 포스트의 한글 요약 및 분석 리포트는 AI 기술을 통해 자동 생성되었습니다. 정보의 정확성을 위해 하단의 [원본 논문 뷰어] 또는 ArXiv 원문을 반드시 참조하시기 바랍니다.

초록

TradeFM은 5억 2400만 파라미터 규모의 트랜스포머 기반 생성 모델로, 9천 종 이상의 미국 주식에서 수십억 건의 거래 이벤트를 학습한다. 규모 불변 특징과 통합 토크나이제이션을 통해 자산별 보정 없이 다중자산에 일반화하며, 부분 관측(레벨 3 거래 메시지)만으로도 시장 미시구조를 재현한다. 모델은 결정론적 시장 시뮬레이터와 결합해 롤아웃을 생성하고, 수익률의 무거운 꼬리, 변동성 클러스터링, 수익률 자기상관 부재 등 전형적인 스타일화된 사실을 재현한다. Compound Hawkes 대비 2‑3배 낮은 분포 오류를 보이며, APAC 시장에 대한 제로샷 일반화도 퍼플렉시티 감소만으로 가능함을 입증한다.

상세 분석

본 논문은 금융 시장 미시구조를 이해하고 합성 데이터를 생성하기 위한 ‘파운데이션 모델’ 접근법을 최초로 제시한다. 핵심 기술은 네 가지로 정리할 수 있다. 첫째, 규모 불변 특징 설계이다. 전통적인 가격·볼륨·시간 변수는 자산마다 절대값이 크게 달라 모델이 일반화하기 어렵다. 저자들은 (1) 로그 변환 볼륨, (2) 중간가격 대비 상대 가격 깊이, (3) 일일 오프닝 대비 상대 가격 수준, (4) 실시간 인터아라밸 시간 등을 도입해 모든 자산을 동일한 단위(비율·베이시스 포인트)로 정규화한다. 이는 ‘Universal Price Formation’ 이론에 기반해 가격 형성 메커니즘이 자산 간에 보편적이라는 가정을 실증적으로 구현한다.

둘째, 통합 토크나이제이션이다. 연속형 특징을 균등 빈도(가격)와 로그·등폭(볼륨·시간) 구간으로 이산화하고, 행동·사이드·시장·참가자 구분 플래그와 결합해 하나의 토큰 시퀀스로 변환한다. 이렇게 하면 기존 NLP 트랜스포머와 동일한 어휘 집합을 활용하면서도 고빈도·저빈도 이벤트가 과도하게 편향되지 않도록 토큰 분포를 균일화한다.

셋째, 부분 관측 학습이다. 대부분의 기존 연구가 전체 LOB 스냅샷(레벨 2)이나 전체 주문서(레벨 3)를 필요로 하는 반면, TradeFM은 레벨 3 거래 메시지만 사용한다. 이는 실제 트레이더가 접근 가능한 정보와 일치하며, 모델이 ‘숨겨진’ 주문서 상태를 추론하도록 강제한다. 실험 결과, 부분 관측만으로도 전체 시장 동역학을 충분히 포착한다는 점이 입증된다.

넷째, 결정론적 시장 시뮬레이터와의 결합이다. 사전 학습된 트랜스포머를 조건부 확률 모델로 활용해 다음 이벤트를 샘플링하고, 이를 실시간 가격 매칭 로직에 투입해 시뮬레이션을 진행한다. 생성된 롤아웃은 수익률의 레벤쿠트(heavy‑tail), 변동성 클러스터링, 수익률 자기상관 부재 등 전통적인 스타일화된 사실을 재현한다. 정량적으로는 Compound Hawkes 모델 대비 2‑3배 낮은 분포 차이를 보이며, APAC 시장(일본·중국)에서도 퍼플렉시티가 약 15 % 상승하는 수준으로 제로샷 일반화가 가능함을 보여준다.

모델 규모(524 M 파라미터)와 데이터 양(10 B 토큰)으로 볼 때, 현재 금융 AI 분야에서 가장 대규모·다중자산 학습 사례 중 하나이며, ‘하나의 모델이 모든 자산을 이해한다’는 파운데이션 모델의 핵심 가설을 실증한다. 다만, 현재는 deterministic 매칭 엔진에 의존해 가격 형성 규칙을 고정했으며, 실제 시장의 비선형 피드백(예: 주문서 깊이 변화에 따른 전략적 행동)까지는 완전히 포착하지 못한다는 한계가 있다. 향후에는 강화학습 기반 에이전트와의 공동 학습, 비정형 뉴스·소셜 데이터와의 멀티모달 통합, 그리고 변동성 충격 시나리오에 대한 스트레스 테스트 등으로 확장할 여지가 크다.


댓글 및 학술 토론

Loading comments...

의견 남기기