중국 공공 REIT 시장을 위한 대형언어모델 기반 다중에이전트 투자 시스템 설계와 실증 연구

중국 공공 REIT 시장을 위한 대형언어모델 기반 다중에이전트 투자 시스템 설계와 실증 연구
안내: 본 포스트의 한글 요약 및 분석 리포트는 AI 기술을 통해 자동 생성되었습니다. 정보의 정확성을 위해 하단의 [원본 논문 뷰어] 또는 ArXiv 원문을 반드시 참조하시기 바랍니다.

초록

본 논문은 저변동성 중국 공공 REIT 시장을 대상으로, 네 종류의 분석 에이전트(공시, 이벤트, 가격모멘텀, 시장)와 예측·결정·실행 에이전트로 구성된 대형언어모델(LLM) 기반 다중에이전트 프레임워크를 제안한다. 예측 에이전트는 일반 목적 LLM DeepSeek‑R1과, SFT·RL을 통해 파인튜닝한 소형 LLM Qwen3‑8B 두 모델을 각각 적용해 성능을 비교한다. 2024‑10∼2025‑10 기간 백테스트 결과, 두 전략 모두 전통적 매수‑보유 대비 누적수익, 샤프비율, 최대낙폭 등에서 현저히 우수했으며, 파인튜닝된 소형 모델이 경우에 따라 대형 모델과 동등하거나 더 나은 성과를 보였다.

상세 분석

이 연구는 금융 LLM 적용의 최신 흐름을 체계적으로 통합한다. 첫째, 정보의 다원성을 고려해 공시, 이벤트, 가격모멘텀, 거시시장 네 가지 분석 에이전트를 별도 모듈로 구현함으로써 단일 모델이 모든 정보를 동시에 처리해야 하는 부담을 해소한다. 각 에이전트는 도메인‑특화된 전처리와 규칙 기반 요약을 수행한 뒤, 구조화된 텍스트를 공통 프롬프트 형식으로 변환해 예측 에이전트에 전달한다.

둘째, 예측 에이전트는 다중시간대(당일, 5일, 20일)별 방향성 확률분포를 출력한다. 여기서 핵심은 “동적 변동성 임계값(θₜ)”과 “사이드웨이 모델링”이다. 변동성은 최근 30일 표준편차와 장·단기 변동성 비율을 이용해 가중치를 동적으로 조정하고, 하위·상위 사분위수를 적용해 극단값을 억제한다. 이 임계값을 기반으로 |rₜ|>θₜ이면 트렌드, ≤θₜ이면 사이드웨이로 구분하고, √k 스케일링을 통해 T+5, T+20에서도 일관된 판단 기준을 제공한다. 이러한 통계적 정의는 저변동성 REIT 시장에서 실제 가격 움직임을 과대평가하지 않도록 설계되었다.

셋째, 의사결정 에이전트는 예측 확률과 사전 정의된 리스크 제약(포지션 상한, 변동성 기반 헤지 비율 등)을 결합해 이산형 포지션 조정 신호를 생성한다. 이 과정에서 LLM이 직접 “매수/매도/관망”을 텍스트로 제시하는 것이 아니라, 확률값을 수치화하고 사전 규칙에 매핑함으로써 실행 가능하고 검증 가능한 트레이딩 로직을 만든다.

넷째, 두 가지 모델 경로를 비교한다. DeepSeek‑R1은 대규모 사전학습 파라미터와 광범위한 금융 지식을 보유하지만, 특정 REIT 특성에 대한 세밀한 튜닝이 부족하다. 반면 Qwen3‑8B는 8 B 파라미터 규모이지만, 12개월의 REIT 데이터에 대해 감독학습(SFT)과 강화학습(RLHF)으로 파인튜닝되었다. 실험 결과, Qwen3‑8B는 특히 단기(T+1)와 중기(T+5) 예측에서 변동성 조정 보상 설계와 잘 맞아 DeepSeek‑R1과 동등하거나 약간 우수한 성과를 보였다. 이는 파인튜닝이 모델 규모보다 도메인 적합성을 크게 향상시킬 수 있음을 시사한다.

다섯째, 백테스트는 2024년 10월부터 2025년 10월까지의 실제 REIT 가격, 거래량, 공시 데이터와 뉴스 텍스트를 사용했으며, 기준선인 ‘Buy‑and‑Hold’ 대비 누적수익률(CR) 1.8배, 샤프비율 1.42, 최대낙폭 12% 감소 등으로 전반적인 위험조정 성과가 크게 개선되었다.

마지막으로, 연구는 오픈소스 코드와 데이터셋을 공개함으로써 재현성을 확보하고, 향후 다중에이전트 협업 구조에 대한 추가 실험(예: 에이전트 간 토론 메커니즘, 메모리 모듈 도입)과 다른 자산군(주식, 채권) 적용 가능성을 제시한다. 다만, 현재 시스템은 단일 REIT에 국한돼 있으며, 시장 충격 시 에이전트 간 의견 불일치 처리와 실시간 데이터 지연 문제는 향후 보완이 필요하다.


댓글 및 학술 토론

Loading comments...

의견 남기기