경쟁 제품 채택과 사용 빈도 모델링

안내: 본 포스트의 한글 요약 및 분석 리포트는 AI 기술을 통해 자동 생성되었습니다. 정보의 정확성을 위해 하단의 [원본 논문 뷰어] 또는 ArXiv 원문을 반드시 참조하시기 바랍니다.

초록

본 논문은 온라인 소셜 네트워크에서 관측되는 사용자별 제품 사용 시점을 시계열 점 과정으로 모델링한다. 다변량 Hawkes 프로세스를 기반으로, 제품 사용의 ‘재현성(Recency)’, ‘사회적 영향(Social Influence)’, 그리고 ‘경쟁(Competition)’이라는 세 가지 핵심 요인을 동시에 포착한다. 모델 파라미터는 로그우도 최대화의 볼록 최적화 문제로 추정되며, 네트워크 규모가 수십만 노드에 달해도 부분 문제로 분할해 병렬 처리할 수 있다. 합성 데이터와 트위터 실데이터 실험을 통해 제안 모델이 기존 베이스라인보다 예측 정확도가 높고, 파라미터 해석을 통해 인기 제품의 사용이 주로 최근 사용에 의해 좌우되며, 열등 제품의 노출이 인기 제품 사용을 억제한다는 인사이트를 얻었다.

상세 분석

이 논문은 제품 채택과 반복 사용을 미시적 수준에서 설명하기 위해 연속시간 확률 모델을 설계한다. 핵심은 다변량 Hawkes 과정에 ‘음의 영향(억제)’을 허용한 점이다. 기존 Hawkes 모델은 사건이 발생하면 미래 사건 발생률을 양의 방향으로만 증가시키지만, 여기서는 a_lp, b_lp 파라미터가 음수일 경우 경쟁 제품 사용이 현재 제품 사용률을 감소시키는 메커니즘을 구현한다. 모델 식(15)은 세 부분으로 구성된다. 첫 번째는 제품별 고정 베이스라인 µ_p로, 사용자가 외부 요인에 의해 스스로 채택하는 확률을 나타낸다. 두 번째는 ‘재현성’ 항으로, 사용자가 과거에 사용한 제품 l이 현재 제품 p에 미치는 영향을 a_lp·g(t‑t_i) 형태로 가중한다. 여기서 g는 지수 감쇠 커널이며, 시간 간격이 클수록 영향이 급격히 감소한다. 세 번째는 ‘사회적 영향’ 항으로, 이웃 v가 과거에 사용한 제품 l이 사용자 u의 현재 제품 p 사용률에 미치는 영향을 b_lp·g(t‑t_i) 로 모델링한다. 이 구조는 사용자의 개인적 습관(재현성)과 이웃의 행동(사회적 영향)을 동시에 고려하면서, 서로 다른 제품 간의 양·음 상호작용을 정량화한다.

파라미터 추정은 로그우도 L = Σ log λ*(t_i) – ∫ λ*(τ)dτ 를 최대화하는 볼록 최적화 문제로 변환된다. 중요한 점은 전체 네트워크에 대한 대규모 최적화가 아니라, 각 사용자‑제품 쌍에 대한 독립적인 서브문제로 분해된다는 것이다. 이는 H(u)와 N(u) (이웃 집합)의 희소성을 이용해 연산량을 O(nd|V|) 로 낮춘다. 또한, 지수 커널을 사용함으로써 강도 업데이트를 O(1) 시간에 수행할 수 있다(λ*(t₂) = (λ*(t₁)–µ)·e^{–ωΔt}+µ).

실험에서는 합성 데이터로 모델 복원력을 검증하고, 트위터에서 수집한 URL 단축 서비스와 리트윗 표기 방식 두 종류의 경쟁 현상을 분석한다. 결과는 (1) 제안 모델이 시간적 버스트와 제품 전환 현상을 자연스럽게 재현한다, (2) 파라미터 회복 정확도가 데이터 양이 증가함에 따라 향상된다, (3) 실제 데이터에서 베이스라인(포아송, Weibull, 기존 Hawkes 등)보다 예측 정확도가 현저히 높다, (4) 해석 가능한 파라미터를 통해 인기 제품은 재현성에 크게 의존하고, 덜 인기 있는 제품의 노출이 인기 제품 사용을 억제한다는 정책적 인사이트를 제공한다는 점이다.

이와 같이, 연속시간 점 과정 기반의 다변량 Hawkes 모델을 확장해 제품 경쟁을 정량화하고, 효율적인 시뮬레이션·추정 알고리즘을 제시함으로써 마케팅·경제학 분야에서 미시적 행동 분석에 새로운 도구를 제공한다.

경쟁 제품 채택과 사용 빈도 모델링

초록

상세 분석

댓글 및 학술 토론

의견 남기기