미래 지향 소프트 대조 학습을 통한 횡단면 자산 검색

미래 지향 소프트 대조 학습을 통한 횡단면 자산 검색
안내: 본 포스트의 한글 요약 및 분석 리포트는 AI 기술을 통해 자동 생성되었습니다. 정보의 정확성을 위해 하단의 [원본 논문 뷰어] 또는 ArXiv 원문을 반드시 참조하시기 바랍니다.

초록

본 논문은 자산 검색에서 “미래와 정렬된” 유사성을 목표로, 미래 수익 상관관계를 연속적인 감독 신호로 활용한 소프트 대조 손실(FASCL)을 제안한다. 패치 기반 트랜스포머 인코더로 시계열을 임베딩하고, 배치 내 자산 간의 Pearson 상관을 온도 스케일 소프트맥스로 변환한 목표 분포와 코사인 유사도 기반 예측 분포 사이의 KL divergence를 최소화한다. 새로운 평가 지표인 Trend Consistency@K, Future Return Correlation@K, Information Coefficient@K 등을 도입해 직접적인 미래 행동 일치를 측정한다. 4,229개 미국 주식에 대한 실험에서 13개 베이스라인을 모두 능가함을 입증한다.

상세 분석

FASCL은 기존 자산 유사도 정의가 과거 가격 패턴이나 섹터 라벨에 의존하는 한계를 극복한다는 점에서 혁신적이다. 핵심 아이디어는 “미래와 정렬된” 유사성을 학습 목표로 삼는 것이다. 이를 위해 저자들은 미래 H일 동안의 일일 수익률 시계열을 수집하고, 각 자산 쌍에 대해 Pearson 상관계수를 계산한다. 이 연속적인 상관값을 온도 매개변수 τ_t 로 스케일링한 뒤 소프트맥스 함수를 적용해 목표 확률 분포 p_i 를 만든다. 동시에 트랜스포머 인코더가 출력한 임베딩 z_i 에 대해 코사인 유사도를 이용해 예측 분포 q_i 를 정의하고, 두 분포 사이의 KL 발산을 최소화한다. 이 손실은 기존 InfoNCE가 이진 긍정/부정 라벨에 의존하는 것과 달리, 상관 정도에 비례해 “끌어당김” 강도를 조절함으로써 금융 자산의 연속적인 유사성을 자연스럽게 반영한다.

인코더 설계는 ViT와 PatchTST를 차용해, T=64일의 관측 윈도우를 P=4일 패치로 나누어 16개의 토큰으로 변환한다. 각 토큰은 1D 컨볼루션으로 D=384 차원에 매핑되고, 8개의 트랜스포머 블록(헤드 8, FFN 확장 4)으로 처리된다. 평균 풀링을 통해 최종 임베딩을 얻으며, 파라미터 수는 약 14M으로 실용적인 규모다.

배치 구성도 중요한 설계 요소다. 동일 날짜 t 에서 무작위로 B개의 자산을 샘플링해 같은 시점의 미래 수익률을 비교함으로써, 시간적 누수(leakage)를 방지하고 실제 투자 상황을 모사한다. 온도 τ와 τ_t 를 별도로 조정해 목표 분포와 예측 분포의 샤프니스를 제어함으로써 학습 안정성을 높인다.

평가 프로토콜은 세 가지 미래 행동 지표를 제시한다. Trend Consistency@K는 상위 K개의 검색 결과가 동일 방향(상승/하락) 움직임을 보이는 비율을 측정하고, Future Return Correlation@K는 검색된 자산들의 실제 미래 수익률 상관 평균을 계산한다. Information Coefficient@K는 검색 결과를 집계해 만든 포트폴리오의 수익률과 실제 시장 수익률 사이의 상관을 평가한다. 이와 함께 전통적인 Sector Precision@K를 포함해 구조적 인식을 검증한다.

실험에서는 4,229개 미국 주식을 2010‑2020년 구간으로 학습·검증·테스트 셋으로 나누고, 13개의 베이스라인(통계적 방법, 시계열 자기지도 학습, 예측 기반 특징 추출기, 도메인 특화 모델, 시계열 파운데이션 모델)을 동일 조건에서 비교했다. FASCL은 모든 K값에서 Trend Consistency, Future Return Correlation, Information Coefficient에서 일관되게 최고 성능을 기록했으며, 특히 FRC@K와 IC@K에서 평균 12%·9%p 상승을 보였다. Ablation 실험은 소프트 대조 형태 자체보다는 미래 상관을 감독 신호로 사용한 것이 성능 향상의 핵심임을 확인했다.

이 논문은 자산 검색을 “미래와 정렬된” 문제로 재정의하고, 연속적인 감독을 통한 소프트 대조 학습 프레임워크와 새로운 평가 지표를 제시함으로써 금융 머신러닝 분야에 중요한 패러다임 전환을 제공한다.


댓글 및 학술 토론

Loading comments...

의견 남기기