자동입찰의 ROI 제약을 위한 불확실성 정량화와 최적 입찰 설계

자동입찰의 ROI 제약을 위한 불확실성 정량화와 최적 입찰 설계
안내: 본 포스트의 한글 요약 및 분석 리포트는 AI 기술을 통해 자동 생성되었습니다. 정보의 정확성을 위해 하단의 [원본 논문 뷰어] 또는 ArXiv 원문을 반드시 참조하시기 바랍니다.

초록

본 논문은 광고 자동입찰에서 실제 전환값(가치)이 알려지지 않은 현실을 고려한다. 기존 머신러닝 예측값에 컨포멀 프레딕션을 적용해 값의 불확실성을 상한 형태의 예측 구간으로 정량화하고, 이를 조정된 예측값으로 변환한다. 조정된 값은 온라인 미러 디센트 기반 입찰 알고리즘에 통합되어 예산·ROI(또는 RoS) 제약을 만족하면서도 최적에 근접한 보상을 제공한다. 데이터가 i.i.d.가 아니어도 독립성과 유한 타입 가정만으로 이론적 보상·제약 위반 경계가 증명되며, 시뮬레이션 및 실제 JD.com 데이터 실험에서 기존 방법보다 높은 성능과 낮은 연산 비용을 입증한다.

상세 분석

이 연구는 광고 플랫폼에서 자동입찰 시스템이 직면하는 두 가지 핵심 난제를 동시에 해결한다. 첫째, 전환율·구매전환 등 가치(vₜ)는 실시간으로 관측되지 않으며, 과거 데이터 기반 머신러닝 모델이 제공하는 예측값은 노이즈와 모델 오버피팅으로 인해 불확실성을 내포한다. 둘째, 광고주는 전체 예산과 Return‑on‑Spend(RoS) 목표라는 제약을 동시에 만족시켜야 한다. 기존 문헌은 가치가 완전히 알려졌다고 가정하거나, i.i.d. 데이터와 즉시 피드백을 전제로 UCB·밴딧 방식의 알고리즘을 설계했지만, 실제 온라인 광고 환경은 비동질적(heterogeneous) 분포와 지연 피드백이 일반적이다.

논문은 이러한 현실을 반영해 두 단계의 접근법을 제시한다. (1) 컨포멀 프레딕션을 이용해 각 요청 zₜ에 대한 가치 vₜ의 상한을 포함하는 1‑β 수준의 예측 구간을 구성한다. 여기서 비대칭 비컨포멀 점수 b_S(z,v)=v−μ̂(z) 를 사용해 상한만을 강조하고, 가중치 기반 가중 평균을 통해 비교환(non‑exchangeable) 상황에서도 유효한 커버리지를 보장한다. (2) 이 상한을 μ̂(zₜ)+Δₜ 형태의 ‘조정된 예측값’으로 정의하고, 온라인 미러 디센트(Online Mirror Descent) 프레임워크에 삽입한다. 조정된 값은 실제 가치보다 보수적으로 높게 잡히므로, RoS 제약을 위반할 위험을 사전에 억제한다.

이론적 분석에서는 (i) 독립성 가정만으로도 조정값이 true value를 상한으로 포함한다는 확률적 보장을 제시하고, (ii) 조정값을 사용한 입찰 전략이 최적 오프라인 보상에 대해 (1−O(√T⁻¹)) 수준의 경쟁비율을 달성함을 증명한다. 또한 RoS 위반 누적량은 O(√T) 이하로 제한돼, 장기적으로 목표 ROI를 유지한다. 중요한 점은 데이터가 서로 다른 K개의 분포(‘유한 타입’)에서 샘플링되더라도 위 결과가 그대로 적용된다는 점이다.

실험에서는 공개 Alibaba 데이터와 JD.com 실서비스 로그를 활용해 세 가지 알고리즘을 비교한다. 기존 완전 가치 기반 알고리즘, Vijayan et al.의 UCB‑based 방법, 그리고 제안된 조정‑컨포멀 알고리즘이다. 결과는 제안 방법이 보상 측면에서 5‑12% 향상을 보이며, RoS 위반률을 30% 이상 감소시킨다. 또한 매 라운드마다 LP를 푸는 비용이 없는 구조 덕분에 실행 시간은 기존 방법 대비 3배 이상 빠르다.

결론적으로, 본 논문은 머신러닝 예측값에 통계적 불확실성 정량화를 결합함으로써, 실제 광고 시스템에서 요구되는 예산·ROI 제약을 만족하면서도 이론적·실험적 최적성을 동시에 달성할 수 있음을 보여준다.


댓글 및 학술 토론

Loading comments...

의견 남기기