스폰서 검색 결과의 매력도와 다중 클릭 모델링

안내: 본 포스트의 한글 요약 및 분석 리포트는 AI 기술을 통해 자동 생성되었습니다. 정보의 정확성을 위해 하단의 [원본 논문 뷰어] 또는 ArXiv 원문을 반드시 참조하시기 바랍니다.

초록

본 논문은 기존 클릭 모델이 갖는 두 가지 한계—검색 결과 간 매력도 정보 공유 부족과 순차적 스캔 가정—를 극복하기 위해, 스폰서 검색 결과에 특화된 새로운 클릭 모델을 제안한다. 모델은 문서 간 키워드·구문 공유를 통해 매력도를 정교히 추정하고, 사용자의 과거 클릭 경험에 따라 위치별 클릭 확률과 매력도가 시간에 따라 변한다는 가정을 도입한다. 외부 효과, 사용자 피로도, 사전·사후 클릭 관련성 등을 자연스럽게 통합하며, 효율적인 일회 통과 추론 알고리즘을 제공한다. 대규모 상용 검색 엔진 로그 실험에서 기존 모델들을 크게 능가함을 입증한다.

상세 분석

이 논문은 스폰서 검색, 특히 메인라인 광고에 초점을 맞추어 기존 클릭 모델들의 구조적 결함을 진단한다. 첫 번째 결함은 매력도(Attractiveness) 추정 시 개별 광고에만 의존하고, 동일 쿼리 하에 노출되는 다른 광고들의 텍스트 정보를 활용하지 못한다는 점이다. 저자들은 “공유 정보”라는 개념을 도입해, 동일 쿼리에서 여러 광고가 포함하는 키워드·구문을 공동으로 학습함으로써 각 광고의 매력도를 보다 정확히 추정한다. 이는 베이즈식 사전(Dirichlet)과 베타 분포를 이용해 광고별 매력도 θ_d 를 공동 파라미터로 모델링함으로써 구현된다.

두 번째 결함은 사용자가 광고를 순차적으로 스캔한다는 가정이다. 실제 로그 분석 결과, 약 10%의 세션이 다중 클릭을 포함하고, 그 중 30%는 역순 클릭(예: 3번 위치 후 1번 위치 클릭)을 보인다. 이를 반영하기 위해 모델은 클릭 위치 전이 확률 γ_{i,j} 를 도입해, 이전 클릭 위치 i 로부터 어떤 위치 j 로도 이동할 확률을 명시적으로 학습한다. γ는 Dirichlet 사전을 갖으며, 역순 전이도 허용함으로써 기존의 Cascade·DCM·DBN 등 선형 스캔 모델을 일반화한다.

또한, 사용자의 만족도(s_i)와 포기(t_i) 변수를 베타 분포로 모델링해, 클릭 후 만족 여부에 따라 세션이 종료되는 메커니즘을 명시한다. 만족도는 광고의 사후 클릭 관련성 ρ_d 에 의해 결정되며, 포기 확률 η_i 는 클릭 횟수가 증가할수록 감소하도록 설계돼 사용자 피로와 외부 효과를 동시에 포착한다.

모델 전체는 베이지안 네트워크 형태로 표현되며, P(c, s, t, a, V | α_η, A_γ, D) 로 정의된다. 여기서 c_i 는 i번째 클릭 위치, a_j 는 광고 j 의 매력도, v_{i,j} 는 i번째 전이에서 j 로 이동할 확률이다. 중요한 점은 전체 파라미터 추정이 “one‑pass inference” 로 가능하다는 것이다. 로그 데이터를 한 번 순회하면서 충분통계(예: 클릭·노출 횟수, 전이 카운트)를 누적하고, 베타·디리클레트 사후를 업데이트함으로써 대규모 실서비스에 적용 가능한 효율성을 확보한다.

실험에서는 Microsoft Bing Ads의 방대한 클릭 로그를 사용해 기존 DBN, DCM, CCM 등과 비교하였다. 매력도 공유 모델은 특히 희소 데이터(클릭이 적은 광고)에서 성능 향상이 두드러졌으며, 역순 클릭을 허용한 전이 모델은 다중 클릭 세션의 로그우도(log‑likelihood)를 크게 개선했다. 또한, 외부 효과를 반영한 η_i 와 γ_{i,j} 파라미터는 광고 배치 최적화 시 실제 매출 증가 효과를 검증했다.

이 논문은 스폰서 검색 특유의 짧은 광고 텍스트, 높은 위치 편향, 그리고 다중·역순 클릭 현상을 정량적으로 모델링함으로써, 광고 순위 및 입찰 전략에 직접 활용 가능한 정교한 클릭 예측 프레임워크를 제공한다.

스폰서 검색 결과의 매력도와 다중 클릭 모델링

초록

상세 분석

댓글 및 학술 토론

의견 남기기