경쟁 인식 CPC 예측과 근접 시장 커버리지
초록
본 논문은 2021‑2023년 구글 광고 로그를 활용해 1,811개의 키워드 시계열에 대해 주간 CPC를 예측한다. 텍스트 기반 의미 이웃, DTW 기반 행동 이웃, 지리적 의도 공변량을 이용해 잠재 경쟁을 추정하고, 이를 시계열 기반 모델과 그래프 신경망에 외생 변수 혹은 관계형 사전으로 결합한다. 실험 결과, 경쟁‑인식 신호는 중·장기 예측에서 안정성과 정확도를 크게 향상시키며, 특히 고가·고변동 키워드 구간에서 효과가 두드러진다.
상세 분석
이 연구는 유료 검색 광고에서 CPC가 경쟁 입찰에 의해 결정되는 특성을 고려하지 않으면 예측 정확도가 급격히 떨어진다는 점에 주목한다. 저자들은 “부분 관측 가능성(partial observability)”이라는 개념을 도입해, 단일 광고주의 데이터만으로는 경쟁 입찰 정보를 완전히 파악할 수 없으므로, 경쟁을 추정할 수 있는 프록시를 설계한다. 세 가지 프록시가 핵심이다. 첫째, 사전 학습된 트랜스포머 모델(BERT 계열)으로 키워드 텍스트를 임베딩하고, 코사인 유사도로 의미 이웃을 정의해 고정된 의미 그래프를 구축한다. 둘째, 각 키워드의 CPC 시계열을 DTW로 정렬해 행동 이웃을 도출, 시계열 패턴이 유사한 키워드끼리 연결한다. 셋째, 키워드가 포함된 지리적 의도(예: 도시·공항)와 검색량을 결합한 지리‑의도 공변량을 생성해 지역별 수요와 경쟁 구조를 반영한다. 이러한 프록시들은 (1) 외생 변수로 TSFM(Chronos‑2, TimeGPT, Moirai)과 전통 통계 모델에 직접 입력하거나, (2) 그래프 신경망(GNN, Diffusion Convolutional GNN 등)의 인접 행렬로 활용한다. 모델 포트폴리오에는 ARIMA, Prophet, LSTM, Transformer 기반 시계열 모델, 그리고 사전 학습된 대형 시계열 모델이 포함돼, 경쟁‑인식 강화와 비강화 두 조건을 비교한다. 실험은 127주(≈2년 5개월) 기간을 5‑fold 시계열 교차검증으로 평가했으며, MAE, RMSE, MAPE 외에 “경쟁 프론티어” 지표(평균 CPC와 변동성의 CoV)별 성능을 별도 분석한다. 결과는 중·장기(4‑8주) 예측에서 경쟁‑인식 모델이 평균 MAE를 6‑12% 감소시키고, 특히 고가·고변동 키워드 구간에서 오류 감소폭이 20% 이상임을 보여준다. 또한, 지리적 프론티어가 TSFM의 안정성을 크게 높이며, 의미 그래프는 GNN의 관계 전파 효율을 향상시킨다. 이러한 발견은 경쟁 프록시가 단순히 추가 피처가 아니라, 시장 구조를 반영한 중요한 사전 지식임을 입증한다.
댓글 및 학술 토론
Loading comments...
의견 남기기