희소 관측 확률 과정의 거리 기반 클러스터링과 온라인 경매 적용

본 논문은 관측 시점이 드물고 불규칙한 잡음이 섞인 확률 과정 실현들 사이의 거리를 정의하고, 이를 이용해 eBay 경매 데이터의 입찰자 행동을 군집화한다. 제안된 거리 척도는 조건부 기대값을 기반으로 하며, 기능적 주성분 분석(FPCA)으로 추정한다. 결과적으로 여섯 개의 뚜렷한 입찰 패턴이 발견되고, 각 패턴은 합리적인 가격에 물품을 획득할 확률과 연관된다.

저자: Jie Peng, Hans-Georg M"uller

희소 관측 확률 과정의 거리 기반 클러스터링과 온라인 경매 적용
본 논문은 “희소하고 불규칙하게 관측된 확률 과정 실현들 사이의 거리 정의”라는 근본적인 문제를 제기하고, 이를 해결하기 위한 새로운 메트릭을 제안한다. 전통적인 함수형 데이터 분석에서는 연속적으로 관측된 곡선을 전제로 L² 거리 등을 사용한다. 그러나 실제 많은 데이터—특히 장기 온라인 경매, 의료 장기 추적 조사, 소셜 미디어 활동 등—는 관측 시점이 적고, 시간 간격이 불규칙하며, 측정 오차가 존재한다. 이러한 상황에서는 직접적인 L² 거리를 계산할 수 없으며, 기존의 보간이나 스무딩 방법도 과도한 추정 오류를 초래한다. 논문은 먼저 확률 과정 X(t) 를 평균 μ(t)와 공분산 커널 C(s,t)의 고유함수 φ_k와 고유값 λ_k 로 전개하는 Karhunen‑Loève 표현을 도입한다. 각 실현 X_i(t)는 무상관 계수 ξ_{ik} 로 구성되며, 관측값 Y_iℓ = X_i(T_iℓ)+ε_iℓ (ε는 i.i.d. 잡음) 로 제한된다. 여기서 핵심 아이디어는 “조건부 기대값”이다. 두 실현 X_i, X_j 사이의 L² 거리 D(i,j)² = ∫(X_i(t)−X_j(t))² dt 를 직접 구할 수 없으므로, 대신 E

원본 논문

고화질 논문을 불러오는 중입니다...

댓글 및 학술 토론

Loading comments...

의견 남기기