고객 하향 추세 예측 및 무언가 고통받는 고객 탐지를 위한 통합 프레임워크

고객 하향 추세 예측 및 무언가 고통받는 고객 탐지를 위한 통합 프레임워크
안내: 본 포스트의 한글 요약 및 분석 리포트는 AI 기술을 통해 자동 생성되었습니다. 정보의 정확성을 위해 하단의 [원본 논문 뷰어] 또는 ArXiv 원문을 반드시 참조하시기 바랍니다.

초록

본 논문은 고객 이탈 전 단계인 ‘하향 추세’를 조기에 예측하고, 그 원인인 불만 경험을 과학적으로 식별하기 위해 두 단계로 구성된 프레임워크를 제안한다. 첫 단계에서는 GBM 기반 이진 분류기로 GMV, 구매 건수, 구매 일수 등 3가지 지표별 하향 가능성을 예측하고, AUC 0.90 이상을 달성한다. 두 번째 단계에서는 인과 추론을 통해 실제 불만 경험이 하향 추세의 원인인 ‘골든 셋’을 정의하고, 반자동 반감 학습(EM)으로 보고하지 않은 ‘침묵 고통 고객’를 탐지한다. 실제 e‑커머스 환경에서 A/B 테스트를 수행해 구매량 88.5% 증가 효과를 입증하였다.

상세 분석

이 연구는 CRM 분야에서 기존에 주로 다루어졌던 ‘이탈(Churn)’ 예측을 넘어, 고객이 아직 활발히 거래하고 있지만 매출·구매 빈도·구매 일수 등이 감소하는 ‘하향 추세’를 조기에 포착하는 문제에 초점을 맞춘다. 하향 추세 정의는 고객별 과거 12개월 평균과 표준편차를 이용한 ‘노름 박스(Norm Box)’ 방식으로 구현되었으며, 하향 플래그는 해당 월 매출이 하한선(μ‑σ·α) 이하일 때 발생한다. 여기서 α는 비즈니스 민감도에 따라 조정 가능한 파라미터이며, 빈번 구매자(FB)와 비빈번 구매자(IB)를 구분해 각각 다른 α 값을 적용함으로써 이벤트 비율을 적절히 제어한다.

예측 모델은 Gradient Boosting Machine(GBM)을 사용했으며, 초기 200개의 후보 피처 중 변수 중요도 분석을 통해 각 지표별 13개의 핵심 피처만을 최종 선택했다. 주요 피처는 최근 30·60·90일 매출 비율, 구매 간격 평균·표준편차, 구매 일수 등 시계열 행동 특성을 반영한다. 모델 깊이는 5로 제한해 과적합을 방지했으며, 검증 결과 AUC가 0.90~0.91, 최대 F1 점수는 0.47 수준으로 실무 적용에 충분한 성능을 보였다.

하향 원인 탐지는 두 단계로 구성된다. 첫째, ‘골든 셋’ 정의를 위해 인과 추론을 적용한다. BCE(불만 구매 경험) 누적 횟수 X와 하향 점수(decile) Y 사이의 비대칭성을 검증했으며, X→Y는 유의하지만 Y→X는 통계적으로 의미가 없음을 확인했다. 이는 BCE가 하향 추세의 원인임을 시사한다. 둘째, 골든 셋 외에 보고되지 않은 침묵 고통 고객을 찾기 위해 반감 학습(EM) 기반의 반감 라벨링 알고리즘을 설계했다. 초기 라벨은 골든 셋을 1, 나머지는 0으로 두고, 반복 학습을 통해 확률이 높은 샘플을 ‘스파이’로 선정해 라벨을 업데이트한다. 이 과정에서 라벨 변화율이 사전 정의된 임계값 이하가 되면 학습을 종료한다.

실제 적용을 위해 eBay의 쇼핑 데이터를 활용했으며, BCE를 주요 레버(원인)로 설정해 A/B 테스트를 진행했다. 실험군에게는 하향 추세와 BCE 위험이 높은 고객에게 맞춤형 마케팅(쿠폰·추천·고객 서비스) 메시지를 전달했으며, 대조군과 비교해 구매량이 88.5% 상승하는 효과를 기록했다. 이는 조기 하향 예측과 원인 기반 개입이 고객 유지와 매출 증대에 실질적인 가치를 제공함을 입증한다.

이 논문의 주요 기여는 (1) 하향 추세를 정량적으로 정의하고 고성능 예측 모델을 구축한 점, (2) 인과 추론을 통해 ‘진짜’ 불만 원인을 골든 셋으로 식별한 점, (3) 제한된 라벨만으로도 반감 학습을 활용해 침묵 고통 고객을 효과적으로 탐지한 점, (4) 실무 A/B 테스트를 통해 비즈니스 임팩트를 검증한 점이다. 다만, BCE 외의 다중 레버를 동시에 고려하는 확장성, 장기적인 고객 가치(LTV)와의 연계 분석, 그리고 다른 산업군에의 일반화 가능성에 대한 추가 연구가 필요하다.


댓글 및 학술 토론

Loading comments...

의견 남기기