온라인 광고에서 중단된 랜덤 워크를 이용한 인과 추론
초록
본 논문은 광고 경매에서 예약가격 등 메커니즘 파라미터를 바꾸는 처치를 장기 매출에 미치는 효과를 추정하고자 한다. 사용자의 페이지 전이와 광고주의 예산 소모를 마코프 연쇄로 모델링하고, 실험 설계에 예산을 분할하는 방식을 적용한다. 중단된 랜덤 워크, Anscombe 정리, Wald‑유사 방정식, 중앙극한정리를 결합해 치료군·대조군의 기대 매출 차이에 대한 신뢰구간을 제공한다. 또한, 사용자‑광고주 상호작용을 하나의 큰 마코프 체인 대신 순서를 재배열하는 ‘퍼뮤테이션 트릭’으로 차원 축소를 수행한다.
상세 분석
이 연구는 온라인 광고 시스템이라는 복합 네트워크에서 인과 효과를 추정하는 데 필요한 새로운 확률론적 프레임워크를 제시한다. 가장 핵심적인 가정은 각 사용자 세션이 마코프 체인으로 근사될 수 있다는 점이며, 광고주의 예산 변화 역시 별도의 마코프 연쇄로 모델링한다. 이러한 두 연쇄가 동시에 진행되면서 발생하는 상호작용은 전통적인 i.i.d. 가정이 깨지는 ‘치료 의존적 인구 규모’ 문제를 야기한다. 저자는 이를 해결하기 위해 실험을 진행할 때 전체 예산을 두 부분으로 나누어(예산‑분할 설계) 각각을 독립적인 랜덤 워크로 본다.
중단된 랜덤 워크는 실험이 종료되는 시점을 ‘스톱핑 타임’으로 정의함으로써, 관측된 총 매출을 해당 스톱 시점까지의 부분합으로 표현한다. 이때 Anscombe 정리를 이용하면 스톱핑 타임이 랜덤이더라도 평균과 분산이 기존 CLT와 동일하게 유지된다는 중요한 성질을 활용한다. 또한, Wald‑유사 방정식을 통해 스톱핑 타임 전후의 기대값 차이를 정확히 추정하고, 이를 바탕으로 중앙극한정리를 적용해 정규 근사 신뢰구간을 만든다.
차원 문제를 해결하기 위한 ‘퍼뮤테이션 트릭’은 일정 윈도우 T 내에서 같은 사용자의 페이지 전이를 연속적으로 재배열함으로써, 원래 d명의 사용자가 동시에 진행하던 마코프 체인을 하나의 ‘사용자 세션 흐름’으로 압축한다. 이 과정에서 상태공간이 X × ℝ^m ×
댓글 및 학술 토론
Loading comments...
의견 남기기