온라인 광고 최적화와 확률 네트워크

본 논문은 검색 서비스 제공자가 키워드 검색에 따라 광고를 할당하고, 고객사의 예산 제약을 만족시키면서 장기 평균 수익을 극대화하는 확률 모델을 제시한다. 도착 쿼리와 클릭‑through 행동을 확률적으로 다루는 온라인 알고리즘을 설계하고, Lyapunov 드리프트 기법을 이용해 최적 수익에 $O( epsilon)$ 이내로 접근하면서 과다 사용(오버드래프트

온라인 광고 최적화와 확률 네트워크

초록

본 논문은 검색 서비스 제공자가 키워드 검색에 따라 광고를 할당하고, 고객사의 예산 제약을 만족시키면서 장기 평균 수익을 극대화하는 확률 모델을 제시한다. 도착 쿼리와 클릭‑through 행동을 확률적으로 다루는 온라인 알고리즘을 설계하고, Lyapunov 드리프트 기법을 이용해 최적 수익에 $O(\epsilon)$ 이내로 접근하면서 과다 사용(오버드래프트) 혹은 미사용(언더드래프트) 수준을 $O(1/\epsilon)$ 로 제한한다. 또한 클릭‑through 비율 최대화, 비정상적 도착, 단기 계약 등 실무적 확장도 다룬다.

상세 요약

이 연구는 광고 할당 문제를 무작위 쿼리 흐름과 클릭‑through 확률이라는 두 가지 핵심 불확실성에 기반한 확률 네트워크 모델로 재구성한다. 기존 문헌에서는 쿼리 도착률을 사전에 알려진 정적 파라미터로 가정하거나, 예산 초과를 완전히 방지하는 강제 제약을 두는 경우가 많았다. 그러나 실제 온라인 광고 환경에서는 사용자 검색 패턴이 시시각각 변하고, 클릭 확률 역시 추정 오차가 존재한다. 저자들은 이러한 현실을 반영하기 위해, 각 고객사의 장기 평균 예산 제약을 “가상 큐”(virtual queue) 형태로 도입한다. 가상 큐는 실제 예산 초과·미달을 추적하는 역할을 하며, 온라인 알고리즘은 매 순간 현재 큐 길이에 따라 광고 배정을 조정한다.

알고리즘 설계는 Lyapunov 함수 $L(t)=\frac12\sum_i Q_i(t)^2$ 의 드리프트를 최소화하는 형태로 전개된다. 매 시간 슬롯 $t$에, 시스템은 현재 큐 상태 $Q_i(t)$와 추정된 클릭‑through 확률 $\hat{c}{ij}$ 를 이용해, 수익 $r{ij}$ 와 예산 소비 $b_{ij}$ 를 고려한 가중합을 최대화하는 광고 $j$ 를 선택한다. 이때 선택 기준은 $r_{ij} - \epsilon b_{ij} - Q_i(t) b_{ij}$ 와 같은 형태이며, $\epsilon$ 은 트레이드오프 파라미터이다.

수학적 분석을 통해, $\epsilon$ 을 충분히 작게 잡으면 기대 수익 $R^{\text{online}}$ 가 오프라인 최적 $R^{}$ 와 $|R^{\text{online}}-R^{}}|\le O(\epsilon)$ 로 수렴함을 보인다. 동시에 가상 큐의 평균 길이는 $E


📜 논문 원문 (영문)

🚀 1TB 저장소에서 고화질 레이아웃을 불러오는 중입니다...